音频解码标准样本.docx
- 文档编号:965571
- 上传时间:2022-10-14
- 格式:DOCX
- 页数:12
- 大小:22.94KB
音频解码标准样本.docx
《音频解码标准样本.docx》由会员分享,可在线阅读,更多相关《音频解码标准样本.docx(12页珍藏版)》请在冰豆网上搜索。
音频解码标准样本
音频编解码标准
PCMU(G.711U)
类型:
Audio
制定者:
ITU-T
所需频宽:
64Kbps(90.4)
特性:
PCMU和PCMA都能提供较好的语音质量,可是它们占用的带宽较高,需要64kbps。
优点:
语音质量优
缺点:
占用的带宽较高
应用领域:
voip
版税方式:
Free
备注:
PCMUandPCMA都能够达到CD音质,可是它们消耗的带宽也最多(64kbps)。
如果网络带宽比较低,能够选用低比特速率的编码方法,如G.723或G.729,这两种编码的方法也能达到传统长途电话的音质,可是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。
如果带宽足够而且需要更好的语音质量,就使用PCMU和PCMA,甚至能够使用宽带的编码方法G722(64kbps),这能够提供有高保真度的音质。
PCMA(G.711A)
类型:
Audio
制定者:
ITU-T
所需频宽:
64Kbps(90.4)
特性:
PCMU和PCMA都能提供较好的语音质量,可是它们占用的带宽较高,需要64kbps。
优点:
语音质量优
缺点:
占用的带宽较高
应用领域:
voip
版税方式:
Free
备注:
PCMUandPCMA都能够达到CD音质,可是它们消耗的带宽也最多(64kbps)。
如果网络带宽比较低,能够选用低比特速率的编码方法,如G.723或G.729,这两种编码的方法也能达到传统长途电话的音质,可是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。
如果带宽足够而且需要更好的语音质量,就使用PCMU和PCMA,甚至能够使用宽带的编码方法G722(64kbps),这能够提供有高保真度的音质。
ADPCM(自适应差分PCM)
类型:
Audio
制定者:
ITU-T
所需频宽:
32Kbps
特性:
ADPCM(adaptivedifferencepulsecodemodulation)综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。
它的核心想法是:
①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;
②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
优点:
算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:
声音质量一般
应用领域:
voip
版税方式:
Free
备注:
ADPCM(ADPCMAdaptiveDifferentialPulseCodeModulation),是一种针对16bit(或者更高?
)声音波形数据的一种有损压缩算法,它将声音流中每次采样的16bit数据以4bit存储,因此压缩比1:
4.而压缩/解压缩算法非常的简单,因此是一种低空间消耗,高质量声音获得的好途径。
LPC(LinearPredictiveCoding,线性预测编码)
类型:
Audio
制定者:
所需频宽:
2Kbps-4.8Kbps
特性:
压缩比大,计算量大,音质不高,廉价
优点:
压缩比大,廉价
缺点:
计算量大,语音质量不是很好,自然度较低
应用领域:
voip
版税方式:
Free
备注:
参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。
译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。
具体说,参数编码是经过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。
如:
线性预测编码(LPC)及其它各种改进型都属于参数编码。
该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低。
CELP(CodeExcitedLinearPrediction,码激励线性预测编码)
类型:
Audio
制定者:
欧洲通信标准协会(ETSI)
所需频宽:
4~16Kbps的速率
特性:
改进语音的质量:
①对误差信号进行感觉加权,利用人类听觉的掩蔽特性来提高语音的主观质量;
②用分数延迟改进基音预测,使浊音的表示更为准确,特别改进了女性语音的质量;
③使用修正的MSPE准则来寻找”最佳”的延迟,使得基音周期延迟的外形更为平滑;
④根据长时预测的效率,调整随机激励矢量的大小,提高语音的主观质量;⑤使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能合成自然度较高的语音。
结论:
①CELP算法在低速率编码环境下能够得到令人满意的压缩效果;
②使用快速算法,能够有效地降低CELP算法的复杂度,使它完全能够实时地实现;
③CELP能够成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境,特别是背景噪声存在时更为重要。
优点:
用很低的带宽提供了较清晰的语音
缺点:
应用领域:
voip
版税方式:
Free
备注:
1999年欧洲通信标准协会(ETSI)推出了基于码激励线性预测编码(CELP)的第三代移动通信语音编码标准自适应多速率语音编码器(AMR),其中最低速率为4.75kb/s,达到通信质量。
CELP码激励线性预测编码是CodeExcitedLinearPrediction的缩写。
CELP是近来最成功的语音编码算法。
CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。
CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。
CELP(Code-ExcitedLinearPrediction)这是一个简化的LPC算法,以其低比特率著称(4800-9600Kbps),具有很清晰的语音品质和很高的背景噪音免疫性。
CELP是一种在中低速率上广泛使用的语音压缩编码方案。
G.711
类型:
Audio
制定者:
ITU-T
所需频宽:
64Kbps
特性:
算法复杂度小,音质一般
优点:
算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:
占用的带宽较高
应用领域:
voip
版税方式:
Free
备注:
70年代CCITT公布的G.71164kb/s脉冲编码调制PCM。
G.721
类型:
Audio
制定者:
ITU-T
所需频宽:
32Kbps
特性:
相对于PCMA和PCMU,其压缩比较高,能够提供2:
1的压缩比。
优点:
压缩比大
缺点:
声音质量一般
应用领域:
voip
版税方式:
Free
备注:
子带ADPCM(SB-ADPCM)技术。
G.721标准是一个代码转换系统。
它使用ADPCM转换技术,实现64kb/sA律或μ律PCM速率和32kb/s速率之间的相互转换。
G.722
类型:
Audio
制定者:
ITU-T
所需频宽:
64Kbps
特性:
G722能提供高保真的语音质量
优点:
音质好
缺点:
带宽要求高
应用领域:
voip
版税方式:
Free
备注:
子带ADPCM(SB-ADPCM)技术
G.723(低码率语音编码算法)
类型:
Audio
制定者:
ITU-T
所需频宽:
5.3Kbps/6.3Kbps
特性:
语音质量接近良,带宽要求低,高效实现,便于多路扩展,可利用C5402片内16kRAM实现53coder。
达到ITU-TG723要求的语音质量,性能稳定。
可用于IP电话语音信源编码或高效语音压缩存储。
优点:
码率低,带宽要求较小。
并达到ITU-TG723要求的语音质量,性能稳定。
缺点:
声音质量一般
应用领域:
voip
版税方式:
Free
备注:
G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。
G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,能够应用于IP电话等系统中。
其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术。
G.723.1(双速率语音编码算法)
类型:
Audio
制定者:
ITU-T
所需频宽:
5.3Kbps(22.9)
特性:
能够对音乐和其它音频信号进行压缩和解压缩,但它对语音信号来说是最优的。
G.723.1采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。
除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,而且避免了载波信号的时通时断。
优点:
码率低,带宽要求较小。
并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。
缺点:
语音质量一般
应用领域:
voip
版税方式:
Free
备注:
G.723.1算法是ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法,其目标应用系统包括H.323、H.324等多媒体通信系统。
当前该算法已成为IP电话系统中的必选算法之一。
G.728
类型:
Audio
制定者:
ITU-T
所需频宽:
16Kbps/8Kbps
特性:
用于IP电话、卫星通信、语音存储等多个领域。
G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。
G.728还采用了自适应后置滤波器来提高其性能。
优点:
后向自适应,采用自适应后置滤波器来提高其性能
缺点:
比其它的编码器都复杂
应用领域:
voip
版税方式:
Free
备注:
G.72816kb/s短延时码本激励线性预测编码(LD-CELP)。
1996年ITU公布了G.7288kb/s的CS-ACELP算法,能够用于IP电话、卫星通信、语音存储等多个领域。
16kbpsG.728低时延码激励线性预测。
G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器的混合体。
G.728是LD-CELP编码器,它一次只处理5个样点。
对于低速率(56~128kbps)的综合业务数字网(ISDN)可视电话,G.728是一种建议采用的语音编码器。
由于其后向自适应特性,因此G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。
G.728还采用了自适应后置滤波器来提高其性能。
G.729
类型:
Audio
制定者:
ITU-T
所需频宽:
8Kbps
特性:
在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。
这种语音压缩算法能够应用在很广泛的领域中,包括IP电话、无线通信、数字卫星系统和数字专用线路。
G
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 解码 标准 样本