通信仿真技术音频信号仿真分析.docx
- 文档编号:7160683
- 上传时间:2023-01-21
- 格式:DOCX
- 页数:23
- 大小:349.71KB
通信仿真技术音频信号仿真分析.docx
《通信仿真技术音频信号仿真分析.docx》由会员分享,可在线阅读,更多相关《通信仿真技术音频信号仿真分析.docx(23页珍藏版)》请在冰豆网上搜索。
通信仿真技术音频信号仿真分析
通信仿真技术
--
姓名:
xxxxxx
班级:
08级通信工程
题目:
基于Matlab的语音信号编解码实现
指导教师:
柯玮
二〇一一年六月
摘要
语音信号的编解码技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。
其中语音编解码仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。
本文简要介绍了语音信号编解码的发展史以及语音信号的特征、编解码方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。
关键词:
语音信号,编解码,Matlab
Audiosignalcoderanddecoder
Author:
YangchuanlongTeacherguidance:
Kewei
Abstract
Speechsignalcoderanddecodertechniquesareawiderangeofcross-scientific,Itsapplicationanddevelopmentofvoicestudy,soundmeasurementstudy,electronicmeasuringtechnology,anddigitalsignalprocessingdisciplines,suchasclosecontact。
Coderanddecoderofvoiceoneofthesmall-scaleequipment,intelligence,digitalandmulti-functionaldevelopmentofmoreandmorequickly,fasterthanthepreviousanalysishasbeensubstantiallyhigh。
Thispaperintroducesthevoicesignalcoderanddecoderofthehistoryofthedevelopment,aswellasthecharacteristicsofspeechsignal,coderanddecodersmethods,RecordingmachinethroughthePCsectionofmyownvoices,theuseofMatlabforsimulationanalysis,finallyaddthenoisefiltertodealwith,comparisonoffilterbeforeandafterChange。
Keywords:
audiosignal,Coderanddecoder,MATLAB
第1章绪论
1.1课题的背景与意义
通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。
语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。
因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。
并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。
现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。
语音信号编解码之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系.并且一起发展。
语音信号编解码是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。
对语音信号编解码的研究一直是数字信号处理技术发展的重要推动力量。
因为许多处理的新方法的提出,首先是在语音信号处理中获得成功,然后再推广到其他领域。
1.2本文主要工作
本文简要介绍了语音信号编解码的发展史以及语音信号的特征、编解码方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。
第2章主要介绍语音信号的特点与采集,仿真主要是验证奈奎斯特定理。
第3章主要是对语音信号进行编解码分析。
1.3本文的仿真软件Matlab
MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分[4]。
MATLAB是矩阵实验室(MatrixLaboratory)的简称,和Mathematica、Maple并称为三大数学软件。
它在数学类科技应用软件中在数值计算方面首屈一指。
MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。
第2章语音信号的特点与采集
2.1语音信号的特点
通过对大量语音信号的观察和分析发现,语音信号主要有下面两个特点:
在频域内,语音信号的频谱分量主要集中在300~3400Hz的范围内。
利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。
在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。
在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。
下面是一段语音信号的时域波形图(图2-1)和频域图(图2-2),由这两个图可以看出语音信号的两个特点。
图2-1语音信号时域波形图图2-2语音信号频域波形图
Figure2-1Speechsignaltime-domainwaveformFigure2-2Frequency-domainspeechsignalwaveform
2.2语音信号的采样和量化
连续时间的离散化通过采样来实现,就是每隔相等的一段时间采样一次,这种采样称为均匀采样(uniformsampling)
连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。
下图表示了声音数字化的概念
2.3语音信号的采样频率
采样频率由根据奈奎斯特理论(Nyquisttheory)确定
奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做无损数字化(losslessdigitization)
假设被采样信号的最高频率为fmax,则采样定律可用公式表示为
可这样来理解奈奎斯特理论
声音信号可看成是由许多正弦波组成的,一个振幅为A、频率为f的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高频率为fmax,采样频率最低要选择2fmax。
例如,话音信号的最高频率约为3.4kHz,采样频率就选为8kHz
2.4语音信号的采样精度
度量声音波形幅度的精确程度,用每个声音样本的位数(即bps)表示
例如每个声音样本用16位表示,测得的声音样本值是在[0~65535]范围里的数,它的精度是1/65536
精度是在模拟信号数字化过程中度量模拟信号的最小单位,因此也称量化阶(quantizationstepsize)
0~1V的电压用256个数表示时,量化阶等于1/256V
样本位数的大小影响到声音的质量,位数越多,声音质量越高,所需存储空间也越多;位数越少,声音质量就越低,所需存储空间也越少
2.5语音信号的声音质量和数据率—质量度量
质量
采样频率(kHz)
样本精度(bit/s)
单道声/立体声
(未压缩的)数据率(kb/s)
频率范围(Hz)
电话*
8
8
单道声
64.0
200~3400
AM
11.025
8
单道声
88.2
20~15000
FM
22.050
16
立体声
705.6
50~7000
CD
44.1
16
立体声
1411.2
20~20000
DAT
48
16
立体声
1536.0
20~20000
*电话使用m律编码,动态范围为13位,压缩后的样本精度为8位
第3章语音信号的编解码原理分析
3.1PCM编解码技术
●在前面的图中
●输入是模拟信号,输出是PCM样本。
●防失真滤波器:
低通滤波器,用来滤除声音频带以外的信号
●波形编码器:
可理解为采样器
●量化器:
可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器
●PCM实际上是模拟信号数字化
模拟声音数字化的两个步骤:
●第一步是采样,就是每隔一段时间间隔读一次声音的幅度
●第二步是量化,就是把采样得到的声音信号幅度转换成数字值
均匀量化:
采用相等的量化间隔/等分尺度量采样得到的信号幅度,也称为线性量化。
量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声
非均匀量化:
●大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔
●可在满足精度要求的情况下用较少的位数来表示
●声音数据还原时,采用相同的规则
●采样输入信号幅度和量化输出数据之间定义了两种对应关系
●μ律压扩算法
●A律压扩算法
PCM音频仿真结果分析:
1%信号幅度A律与均匀量化编码差异
5%信号幅度A律与均匀量化编码差异
10%信号幅度A律与均匀量化编码差异
15%信号幅度A律与均匀量化编码差异
音频信号分析—10%
音频信号分析—5%
音频信号分析—3%
音频信号分析—2%
3.2增量调制DM编解码技术
●
增量调制最早由法国人DeLoraine于1946年提出,目的是简化模拟信号的数字化方法。
其主要特点是:
(1)在比特率较低的场合,量化信噪比高于PCM。
(2)抗误码性能好。
能工作在误比特率为
102~103的信道中,而PCM则要求信道
的误比特率为104~106。
(3)设备简单、制造容易。
它与PCM的本质区别是只用一位二进制码进行编码,但这一位码不表示信号抽样值的大小,而是表示抽样时刻信号曲线的变化趋向。
ΔM的调制原理
●在模拟信号f(t)的曲线附近,有一条阶梯状的变化曲线f′(t),f′(t)与f(t)的形状相似。
显然,只要阶梯“台阶”σ和时间间隔Δt足够小,则f′(t)与f(t)的相似程度就会提高。
对f′(t)进行滤波处理,去掉高频波动,所得到的曲线将会很好地与原曲线重合,这意味着f′(t)可以携带f(t)的全部信息(这一点很重要)。
因此,f′(t)可以看成是用一个给定的“台阶”σ对f(t)进行抽样与量化后的曲线。
我们把“台阶”的高度σ称为增量,用“1”表示正增量,代表向上增加一个σ;用“0”表示负增量,代表向下减少一个σ。
●则这种阶梯状曲线就可用一个“0”、“1”数字序列来表示,也就是说,对f′(t)的编码只用一位二进制码即可。
此时的二进制码序列不是代表某一时刻的抽样值,每一位码值反映的是曲线向上或向下的变化趋势。
这种只用一位二进制编码将模拟信号变为数字序列的方法(过程)就称为增量调制(DeltaModulation),缩写为DM或ΔM调制。
●如何在发送端形成f′(t)信号并编制成相应的二元码序列呢?
仔细分析一下图4―1,比较在每个抽样时刻Δt处的f(t)和f′(t)的值可以发现,
●当f(iΔt)>f′(iΔt_)时,上升一个σ,发“1”码;
●当f(iΔt) ●f′(iΔt_)是第i个抽样时刻前一瞬间的量化值。 增量调制原理框图 增量调制过程示意图 ΔM的解调原理 ●为了完成整个通信过程,发送端调制出的信号必须在接收端通过解调恢复出原始模拟信号。 ΔM信号的解调比较简单,用一个和本地解码器一样的积分器即可。 在接收端和发送端的积分器一般都是一个RC积分器。 解调过程就是图4―3中的积分过程。 当积分器输入“1”码时,积分器输出产生一个正斜变的电压并上升一个量化台阶σ;而当输入“0”码时,积分器输出电压就下降一个量化台阶σ ●为了保证解调质量,对解码器有两个要求: ● (1)每次上升或下降的大小要一致,即正负斜率大小一样。 ● (2)解码器应具有“记忆”功能,即输入为连续“1”或“0”码时,输出能连续上升或下降。 ●对积分器的输出信号进行低通滤波,滤除波形中的高频成分,即可得到与原始模拟信号十分近似的解调信号,如图。 增量调制译码(解调)示意图 ΔM调制存在的问题 ●增量调制尽管有前面所述的不少优点,但它也有两个不足: 一个是一般量化噪声问题;另一个是过载噪声问题。 两者可统一称为量化噪声。 ●观察图可以发现,阶梯曲线(调制曲线)的最大上升和下降斜率是一个定值,只要增量σ和时间间隔Δt给定,它们就不变。 那么,如果原始模拟信号的变化率超过调制曲线的最大斜率,则调制曲线就跟不上原始信号的变化,从而造成误差。 我们把这种因调制曲线跟不上原始信号变化的现象叫做过载现象,由此产生的波形失真或者信号误差叫做过载噪声。 另外,由于增量调制是利用调制曲线和原始信号的差值进行编码,也就是利用增量进行量化,因此在调制曲线和原始信号之间存在误差,这种误差称为一般量化误差或一般量化噪声。 两种噪声示意图如图所示。 DM音频仿真结果分析: 信号频率为1Hz,采样频率为2Hz 信号频率为1Hz,采样频率为5Hz 信号频率为1Hz,采样频率为15Hz 信号频率为1Hz,采样频率为50Hz 音频信号分析—人声 音频信号分析—低响度,柔和 音频信号分析—高响度,激昂 3.3CVSD编解码技术 ●ΔM的量化信噪比与抽样频率成三次方关系,即抽样频率每提高一倍则量化信噪比提高9dB。 通常ΔM的抽样频率至少16KHz以上才能使量化信噪比达到15dB以上。 32KHz时,量化信噪比约为26dB左右,可以用于一般的通信质量要求。 如果设信道可用的最小信噪比为15dB,则信号的动态范围仅有11dB,远远不能满足高质量通信要求的35-50dB的动态范围,除非抽样频率提高到100KHz以上采用实用价值。 ●改进ΔM动态范围的方法有很多,其基本原理是采用自适应方法使量阶Δ的大小随输入信号的统计特性变化而跟踪变化。 如量阶能随信号瞬时压扩,则称为瞬时压扩ΔM,记作ADM。 若量阶Δ随音节时间问隔(5一20ms)中信号平均斜率变化,则称为连续可变斜率增量调制,记作CVSD。 由于这种方法中信号斜率是根据码流中连“1”或连“0”的个数来检测的,所以又称为数字检测、音节压扩的自适应增量调制,简称数字压扩增量调制。 CVSD编码原理图 CVSD解码原理图 CVSD音频仿真结果分析: 信号频率为1Hz,采样频率为4Hz 信号频率为1Hz,采样频率为15Hz 信号频率为1Hz,采样频率为36Hz 信号频率为1Hz,采样频率为100Hz 音频分析—人声 音频分析—低响度,柔和 音频信号分析—高响度,激昂 总结 通过这次课程设计,使我对语音信号有了全面的认识,对数字信号处理的知识又有了深刻的理解,在之前数字信号与处理的学习以及完成课后的作业的过程中,已经使用过MATLAB,对其有了一些基础的了解和认识。 通过这次练习是我进一步了解了信号的产生、采样及频谱分析的方法。 以及其中产生信号和绘制信号的基本命令和一些基础编程语言。 让我感受到只有在了解课本知识的前提下,才能更好的应用这个工具;并且熟练的应用MATLAB也可以很好的加深我对课程的理解,方便我的思维。 这次设计使我了解了MATLAB的使用方法,学会分析滤波器的优劣和性能,提高了分析和动手实践能力。 同时我相信,进一步加强对MATLAB的学习与研究对我今后的学习将会起到很大的帮助。 参考文献 [1]丁玉美.高西全.数字信号处理【M】.西安电子科技大学出版社,2006. [2]樊昌信.通信原理【M】北京: 国防工业出版社,2005. [3]张雄伟,陈量,杨吉斌.现代语音处理技术及应用[M].北京: 机械工业出版社.2003 附录一PCM编解码程序: function[out]=pcm_encode_13(x); x=x*2048;n=length(x); fori=1: n ifx(i)>0 out(i,1)=1; else out(i,1)=0; end ifabs(x(i))>=0&abs(x(i))<16 out(i,2)=0;out(i,3)=0;out(i,4)=0;step=1;st=0; elseif16<=abs(x(i))&abs(x(i))<32 out(i,2)=0;out(i,3)=0;out(i,4)=1;step=1;st=16; elseif32<=abs(x(i))&abs(x(i))<64 out(i,2)=0;out(i,3)=1;out(i,4)=0;step=2;st=32; elseif64<=abs(x(i))&abs(x(i))<128 out(i,2)=0;out(i,3)=1;out(i,4)=1;step=4;st=64; elseif128<=abs(x(i))&abs(x(i))<256 out(i,2)=1;out(i,3)=0;out(i,4)=0;step=8;st=128; elseif256<=abs(x(i))&abs(x(i))<512 out(i,2)=1;out(i,3)=0;out(i,4)=1;step=16;st=256; elseif512<=abs(x(i))&abs(x(i))<1024 out(i,2)=1;out(i,3)=1;out(i,4)=0;step=32;st=512; elseif1024<=abs(x(i))&abs(x(i))<2048 out(i,2)=1;out(i,3)=1;out(i,4)=1;step=64;st=1024; else out(i,2)=1;out(i,3)=1;out(i,4)=1;step=64;st=1024; end if(abs(x(i)))>=2048 out(i,2: 8)=[1111111]; else tmp=floor((abs(x(i))-st)/step); t=dec2bin(tmp,4)-48; out(i,5: 8)=t(1: 4); end end out=reshape(out',1,8*n); function[out]=pcm_encode_ave(x); x=x*128; n=length(x); fori=1: n ifx(i)>0 out(i,1)=1; else out(i,1)=0; end ifabs(x(i))>=0&abs(x(i))<16 out(i,2)=0;out(i,3)=0;out(i,4)=0;st=0; elseif16<=abs(x(i))&abs(x(i))<32 out(i,2)=0;out(i,3)=0;out(i,4)=1;st=16; elseif32<=abs(x(i))&abs(x(i))<48 out(i,2)=0;out(i,3)=1;out(i,4)=0;st=32; elseif48<=abs(x(i))&abs(x(i))<64 out(i,2)=0;out(i,3)=1;out(i,4)=1;st=48; elseif64<=abs(x(i))&abs(x(i))<80 out(i,2)=1;out(i,3)=0;out(i,4)=0;st=64; elseif80<=abs(x(i))&abs(x(i))<96 out(i,2)=1;out(i,3)=0;out(i,4)=1;st=80; elseif96<=abs(x(i))&abs(x(i))<112 out(i,2)=1;out(i,3)=1;out(i,4)=0;st=96; elseif112<=abs(x(i))&abs(x(i))<128 out(i,2)=1;out(i,3)=1;out(i,4)=1;st=112; else out(i,2)=1;out(i,3)=1;out(i,4)=1;st=112; end if(abs(x(i)))>=128 out(i,2: 8)=[1111111]; else tmp=floor((abs(x(i))-st)); t=dec2bin(tmp,4)-48; out(i,5: 8)=t(1: 4); end end out=reshape(out',1,8*n); function[out]=pcm_decode_13(in) n=length(in);in=reshape(in',8,n/8)'; slot (1)=0;slot (2)=16;slot(3)=32;slot(4)=64;slot(5)=128;slot(6)=256;slot(7)=512;slot(8)=1024; step (1)=1;step (2)=1;step(3)=2;step(4)=4;step(5)=8;step(6)=16;step(7)=32;step(8)=64; fori=1: n/8; sym=2*in(i,1)-1;tmp=in(i,2)*4+in(i,3)*2+in(i,4)+1;st=slot(tmp); dt=(in(i,5)*8+in(i,6)*4+in(i,7)*2+in(i,8))*step(tmp)+0.5*step(tmp); out(i)=sym*(st+dt)/2048; end function[out]=pcm_decode_ave(in) n=length(in);in=reshape(in',8,n/8)'; slot (1)=0;slot (2)=16;slot(3)=32;slot(4)=48;slot(5)=64;slot(6)=80;slot(7)=96;slot(8)=112; fori=1: n/8; sym=2*in(i,1)-1;tmp=in(i,2)*4+in(i,3)*2+in(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 通信 仿真技术 音频 信号 仿真 分析