语音编码技术的分类

展开全文

语音编码技术的分类
	网易科技报道 http://tech.163.com	前往科技论坛
	2004-11-03 18:20:33 来源: 中国科普博览不良信息举报		发表评论	查看评论

语音的编码技术通常分为三类：波形编码、参量编码和混合编码。其中，波形编码和参量编码是两种基本类型。

波形编码是将时间域信号直接变换为数字代码，力图使重建语音波形保持原语音信号的波形形状。波形编码的
基本原理是在时间轴上对模拟语音按一定的速率抽样，然后将幅度样本分层量化，并用代码表示。解码是其反过程，
将收到的数字序列经过解码和滤波恢复成模拟信号。它具有适应能力强、语音质量好等优点，但所用的编码速率高，
在对信号带宽要求不太严格的通信中得到应用，而对频率资源相对紧张的移动通信来说，这种编码方式显然不合适。

脉冲编码调制（PCM ）和增量调制（△M ），以及它们的各种改进型自适应增量调制（ADM ），自适应差分编
码（ADPCM ）等，都属于波形编码技术。它们分别在64以及16Kbit/s的速率上，能给出高的编码质量，当速率进一
步下降时，其性能会下降较快。

与波形编码不同，参量编码又称为声源编码，是将信源信号在频率域或其它正交变换域提取特征参量，并将其
变换成数字代码进行传输。解码为其反过程，将收到的数字序列经变换恢复特征参量，再根据特征参量重建语音信
号。具体说，参量编码是通过对语音信号特征参数的提取和编码，力图使重建语音信号具有尽可能高的可靠性，即
保持原语音的语意，但重建信号的波形同原语音信号的波形可能会有相当大的差别。这种编码技术可实现低速率语
音编码，比特率可压缩到2Kbit/s-4.8Kbit/s ，甚至更低，但语音质量只能达到中等，特别是自然度较低，连熟人
都不一定能听出讲话人是谁。线性预测编码（LPC ）及其它各种改进型都属于参量编码。

计算机的发展为语音编码技术的研究提供了强有力的工具，大规模、超大规模集成电路的出现，则为语音编码
的实现提供了基础。80年代以来，语音编码技术有了实质性的进展，产生了新一代的编码算法，这就是混合编码。

它将波形编码和参量编码组合起来，克服了原有波形编码和参量编码的弱点，结合各自的长处，力图保持波形
编码的高质量和参量编码的低速率，在4-16Kbit/s速率上能够得到高质量的合成语音。多脉冲激励线性预测编码
（MPLPC ），规划脉冲激励线性预测编码（KPELPC），码本激励线性预测编码（CELP）等都是属于混合编码技术。
很显然，混合编码是适合于数字移动通信的语音编码技术。