分享

语音编码技术的分类

 hello今天 2010-11-02

语音编码技术的分类

网易科技报道 http://tech.163.com
2004-11-03 18:20:33 来源: 中国科普博览   不良信息举报

    语音的编码技术通常分为三类:波形编码、参量编码和混合编码。其中,波形编码和参量编码是两种基本类型。

    波形编码是将时间域信号直接变换为数字代码,力图使重建语音波形保持原语音信号的波形形状。波形编码的
基本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。解码是其反过程,
将收到的数字序列经过解码和滤波恢复成模拟信号。它具有适应能力强、语音质量好等优点,但所用的编码速率高,
在对信号带宽要求不太严格的通信中得到应用,而对频率资源相对紧张的移动通信来说,这种编码方式显然不合适。


   脉冲编码调制(PCM )和增量调制(△M ),以及它们的各种改进型自适应增量调制(ADM ),自适应差分编
码(ADPCM )等,都属于波形编码技术。它们分别在64以及16Kbit/s的速率上,能给出高的编码质量,当速率进一
步下降时,其性能会下降较快。

    与波形编码不同,参量编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参量,并将其
变换成数字代码进行传输。解码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信
号。具体说,参量编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的可靠性,即
保持原语音的语意,但重建信号的波形同原语音信号的波形可能会有相当大的差别。这种编码技术可实现低速率语
音编码,比特率可压缩到2Kbit/s-4.8Kbit/s ,甚至更低,但语音质量只能达到中等,特别是自然度较低,连熟人
都不一定能听出讲话人是谁。线性预测编码(LPC )及其它各种改进型都属于参量编码。

    计算机的发展为语音编码技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现,则为语音编码
的实现提供了基础。80年代以来,语音编码技术有了实质性的进展,产生了新一代的编码算法,这就是混合编码。

    它将波形编码和参量编码组合起来,克服了原有波形编码和参量编码的弱点,结合各自的长处,力图保持波形
编码的高质量和参量编码的低速率,在4-16Kbit/s速率上能够得到高质量的合成语音。多脉冲激励线性预测编码
(MPLPC ),规划脉冲激励线性预测编码(KPELPC),码本激励线性预测编码(CELP)等都是属于混合编码技术。
很显然,混合编码是适合于数字移动通信的语音编码技术。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多