混响效果的设计课程设计论文.docx
- 文档编号:3286163
- 上传时间:2022-11-21
- 格式:DOCX
- 页数:23
- 大小:504.34KB
混响效果的设计课程设计论文.docx
《混响效果的设计课程设计论文.docx》由会员分享,可在线阅读,更多相关《混响效果的设计课程设计论文.docx(23页珍藏版)》请在冰豆网上搜索。
混响效果的设计课程设计论文
通信系统课程设计报告
混响效果的设计
混响效果的设计
摘要
语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。
Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。
信号处理是Matlab重要应用的领域之一。
本课程设计基于Matlab分析wav声音文件频谱与声音的关系。
通过采集一段声音进行频谱分析等处理,然后设计数字滤波器处理这个原始声音的wav文件,并比较滤波以后输出声音信号与原声音信号的异同。
关键词:
matlab;语音信号;延时;混响;滤波器
Abstract
Speechsignalprocessingisthestudyofdigitalsignalprocessingtechnologyandphoneticsknowledgeofthevoicesignalprocessingoftheemergingdiscipline,isoneofthecoretechnologyofthefastestgrowingfieldofscientificresearch.Voicetransmissionofinformationishumanisthemostimportantandeffectiveexchangeofinformationintheformmostcommonlyusedandmostconvenient.
TheMatlablanguageisaverypowerfulcomputerapplicationsoftwareinadataanalysisandprocessingfunctions,itcantransformthesoundfilesfordiscretedatafiles,andthenuseitspowerfulmatrixoperationscapableofhandlingdata,suchasdigitalfiltering,Fouriertransform,domainandfrequencydomainanalysis,voiceplayback,aswellasavarietyofmapshowingthesignalprocessingandanalysistoolkitforspeechsignalanalysisprovidesaveryrichfeaturefunction,theuseofthesefeaturesfunctioncanquickandeasilycompletedthespeechsignalprocessingandanalysisandsignalvisualization,makecomputerinteractionmoreconvenient.ThesignalprocessingisoneofthetheMatlabimportantfieldofapplication.
ThiscourseisdesignedbasedonMatlabanalysisofthespectrum,therelationshipbetweensoundofwavsoundfiles.Throughthecollectionofindividualsasoundspectrumanalysis,processing,andthendesignthedigitalfilter,theoriginalsoundwavfiles,andcomparesimilaritiesanddifferencesoftheoutputaudiosignalwiththeoriginalsoundsignalafterthefilter.
Keywords:
matlab;voicesignal;delay;reverb;filter
1.引言
语音信号处理是一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段。
通过语言相互传递信息是人类最重要的基本功能之一。
语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。
语音是语言的声学表现,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。
近年来,随着计算机及大规模数字集成电路的迅速发展,语音数字信号处理得到了相应的发展。
语音信号分析模拟、语音合成、语音识别等的研究已较成熟。
、各种声码器、声控器、语声识别系统、语声合成器等已逐渐有商品出现。
2.设计要求
(1)选择录制一段语音信号作为分析对象。
(2)对选择的语音进行频谱分析。
(3)在时域用数字信号处理方法对信号加入三种混响,再分析其频谱。
(4)并与原始信号进行对比。
3.设计思路
利用Windows下的录音机或其他软件,录制一段语音信号,时间控制在3s左右,并对录制的信号进行采样
语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图
将信号加入延时和混响,再分析其频谱,并与原始信号频谱进行比较
设计几种特殊类型的混响器:
无限个回声混响器,多重回声混响器,全通结构的混响器,并画出滤波器的频域响应,对采集的语音信号进行滤波
分析得到信号的频谱,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化
回放语音信
4.设计原理
4.1混响和延时的基本原理
4.1.1混响
声音是通过媒质传入人的听觉器官的。
媒质,既是声音的传播途径,也是声音的载体。
用一个日常生活中司空见惯的例子来说,媒质,就像湖中传递波浪的湖水。
在平静的湖面投人一块石子,石子击起水波,波纹越来越大,水波越传越远。
这湖水,就是传播水波的媒质。
声音也仿佛如此:
当某一声源发音,空气中声波的震荡就会改变周围空气的静止状态,使之形成时而压缩,时而稀疏的前进波,声波就这样不断地散发开去,传播声音的媒质就是空气。
在闭室中,当声源发出一个声音信号(例如是一个脉冲声信号)时,位于室内任何一点的听者所接收到的声音中,应包含两部分成份,一部分是由声源直接传到听者的声音,我们称其为“直达声”。
另一部分是声波传到墙壁或障碍物处反射出的声音,其中有一些被听者接收到,另外一些又会传到其它墙壁处再次发生反射,反射后的声音中又有一些被听者接收到,类似地持续下去,将听者接收到的这部分声音,统称为“反射声”。
从时间上看,反射声较直达声落后(或称为延迟声),从能量角度看,由于每经一次反射都会有部分能量被吸收,因此反射声是一系列能量逐渐衰减的延迟声。
数字混响可以通过用人工创作的回音并将它加入原始信号里,从而把隔音录音室里录制的声音转换为一种自然的声音形式;回音可以简单地由延迟单元产生。
混响效果主要是用于增加音源的融合感。
自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。
常见参数有以下几种:
(1)混响时间:
能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。
(2)高频滚降:
此项参数用于模拟自然混响当中,空气对高频的吸收效应,以产生较为自然的混响效果。
一般高频混降的可调范围为0.1~1.0。
此值较高时,混响效果也较接近自然混响;此值较低时,混响效果则较清澈。
(3)扩散度:
此项参数可调整混响声阵密度的增长速度,其可调范围为0~10,其值较高时,混响效果比较丰厚、温暖;其值较低时,混响效果则较空旷、冷僻。
(4)预延时:
自然混响声阵的建立都会延迟一段时间,预延时即为模拟次效应而设置。
(5)声阵密度:
此项参数可调整声阵的密度,其值较高时,混响效果较为温暖,但有明显的声染色;其值较低时,混响效果较深邃,切声染色也较弱。
(6)频率调制:
这是一项技术性的参数,因为电子混响的声阵密度比自然混响稀疏,为了使混响的声音比较平滑、连贯,需要对混响声阵列的延时时间进行调制。
此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。
(7)调治深度:
指上述调频电路的调治深度。
4.1.2延时
延时就是将音源延迟一段时间后,再欲播放的效果处理。
依其延迟时间的不同,可分别产生合唱、镶边、回音等效果。
当延迟时间在3~35ms之间时人耳感觉不到滞后音的存在,并且他与原音源叠加后,会因其相位干涉而产生"梳状滤波"效应,这就是镶边效果。
如果延迟时间在50ms以上时,其延迟音就清晰可辨,此时的处理效果才是回音。
回音处理一般都是用于产生简单的混响效果。
延时、合唱、镶边、回音等效果的可调参数都差不多,具体有以下几项:
延时时间(Dly),即主延时电路的延时时间调整。
反馈增益(FBGain),即延时反馈的增益控制。
反馈高频比(HiRatio),即反馈回路上的高频衰减控制。
调制频率(Freq),指主延时的调频周期。
调制深度(Depth),指上述调频电路的调制深度。
高频增益(HF),指高频均衡控制。
预延时(IniDly),指主延时电路预延时时间调整。
均衡频率(EQF),这里的频率均衡用于音色调整,此为均衡的中点频率选择。
由于延时产生的效果都比较复杂多变,如果不是效果处理专家,建议使用设备提供的预置参数,因为这些预置参数给出的处理效果一般都比较好。
4.2离散傅立叶变换
在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。
下面介绍这些函数。
函数FFT用于序列快速傅立叶变换。
函数的一种调用格式为 y=fft(x)(式4-1)
其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x为一向量,y是x的FFT。
且和x相同长度。
若x为一矩阵,则y是对矩阵的每一列向量进行FFT。
如果x长度是2的幂次方,函数fft执行高速基-2FFT算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。
函数FFT的另一种调用格式为 y=fft(x,N)(式4-2)
式中,x,y意义同前,N为正整数。
函数执行N点的FFT。
若x为向量且长度小于N,则函数将x补零至长度N。
若向量x的长度大于N,则函数截短x使之长度为N。
若x为矩阵,按相同方法对x进行处理。
经函数fft求得的序列y一般是复序列,通常要求其幅值和相位。
MATLAB提供求复数的幅值和相位函数:
abs,angle,这些函数一般和FFT同时使用。
用MATLAB工具箱函数fft进行频谱分析时需注意:
(1)函数fft返回值y的数据结构对称性。
(2)频率计算。
(3)作FFT分析时,幅值大小与FFT选择点数有关,但不影响分析结果。
4.3滤波器设计
数字滤波器的作用是利用离散时间系统的特性对输入信号波形(或频谱)进行加工处理,或者说利用数字方法按预定的要求对信号进行变换。
数字滤波器可以理解为是一个计算程序或算法,将代表输入信号的数字时间序列转化为代表输出信号的数字时间序列,并在转化过程中,使信号按预定的形式变化。
4.3.1特殊滤波器的系统函数
无限个回声滤波器的系统函数:
H(z)=
<1(式4-3)
多重回声滤波器的系统函数:
H(z)=
<1(式4-4)
全通结构的混响器的系统函数:
H(z)=
<1(式4-5)
4.3.2滤波函数filter
系统还是离散时间LTI系统,系统对输入信号的响应,实质上就是对输入信号从频域角度,无论是连续时间LTI的频谱进行不同选择处理的过程,这个过程称为滤波。
因此,在MATLAB的信息处理工具箱中,提供了一维滤波器函数filter和二维滤波器函数filter2。
函数filter的调用格式为 y=filter(b,a,x)(式4-6)
该格式采用数字滤波器对数据进行滤波,既可以用于IIR滤波器,也可以用于FIR滤波器。
其中向量b和a分别表示系统函数的分子、分母多项式的系数,若a=1,此时表示FIR滤波器,否则就是IIR滤波器。
该函数是利用给出的向量b和a,对x中的数据进行滤波,结果放入向量y。
5.设计步骤
5.1读取3s的语音信号
x1=wavread('yuying111.wav');%读取信号
[x,fs,bits]=wavread('yuying111.wav',[10245120]);
x=x(:
1);%只取单声道
sound(x,fs,bits);
X=fft(x,32000);
magX=abs(X);
angX=angle(X);
figure
(1);
subplot(2,1,1);plot(x);title('原始信号波形');
subplot(2,1,2);plot(X);title('原始信号频谱');
5.2对语音信号进行采样
[x,fs,bits]=wavread('yuying111.wav',[1000040000]);
x=x(:
1);%只取单声道
sound(5*x,fs);%对声音的回放
n1=0:
2000;
N=size(x,1);
Y=fft(x,32000);%对信号做32000点FFT变换
figure
(2);
subplot(2,1,1);plot(x);title('采样后信号的时域波形');
subplot(2,1,2);plot(n1(1:
1000),Y(1:
1000));title('采样后信号的频谱图');%信号幅度
5.3对采样后的信号延时
z1=[zeros(1000,1);x];%对信号进行延时
z2=[zeros(2000,1);x];
z3=[zeros(3000,1);x];
Z1=fft(z1,32000);
Z2=fft(z2,32000);
Z3=fft(z3,32000);
figure(3);
subplot(3,1,1);plot(z1);title('延时后的时域图1');%画出延时后的信号时域图
subplot(3,1,2);plot(z2);title('延时后的时域图2');
subplot(3,1,3);plot(z3);title('延时后的时域图3');
figure(4)
subplot(3,1,1);plot(n1(1:
1000),Z1(1:
1000));title('延时后的频谱图1');%延时后的信号频谱图
subplot(3,1,2);plot(n1(1:
1000),Z2(1:
1000));title('延时后的频谱图2');
subplot(3,1,3);plot(n1(1:
1000),Z3(1:
1000));title('延时后的频谱图3');
5.4对信号进行混响
x1=[x;zeros(1000,1)];%使语音信号与延时后信号同等长度
x2=[x;zeros(2000,1)];
x3=[x;zeros(3000,1)];
y1=x1+z1;%信号的混响
y2=x2+z2;
y3=x3+z3;
sound(y1,fs,bits);
sound(y2,fs,bits);
sound(y3,fs,bits);
figure(5);
subplot(3,1,1);plot(y1);title('混响的时域图1');%混响时域图
subplot(3,1,2);plot(y2);title('混响的时域图2');
subplot(3,1,3);plot(y3);title('混响的时域图3');
Y1=fft(y1,32000);%对混响信号FFT变换
Y2=fft(y2,32000);
Y3=fft(y3,32000);
figure(6);
subplot(3,1,1);plot(n1(1:
1000),Y1(1:
1000));title('混响的频谱图1');%混响频谱图
subplot(3,1,2);plot(n1(1:
1000),Y2(1:
1000));title('混响的频谱图2');
subplot(3,1,3);plot(n1(1:
1000),Y3(1:
1000));title('混响的频谱图3');
5.5三种混响器的设计并对信号进行处理
5.5.1无限回声混响器
a=0.05;%a取小于等于1
Bz=[0,0,0,0,0,0,0,0,0,0,1];%分子的系数
Az=[1,0,0,0,0,0,0,0,0,0,-a];%分母的系数
yy1=filter(Bz,Az,z1);%滤波器进行滤波
YY1=fft(yy1,32000);%经无限回声滤波器后的信号做32000点的FFT变换
5.5.2多重回声混响器
a=0.05;%a取小于等于1
N=5
Bz1=[1,0,0,0,0,0,0,0,0,0,-0.5^N]%分子的系数
Az1=[1,0,0,0,0,0,0,0,0,0,-0.5];%分母的系数
yy2=filter(Bz1,Az1,z1);%滤波器进行滤波
YY2=fft(yy2,32000);%经多重回声滤波器后的信号做32000点的FFT变换
5.5.3全通结构的混响器
a=0.05;%a取小于等于1
Bz1=[a,0,0,0,0,0,0,0,0,0,1];%分子的系数
Az1=[1,0,0,0,0,0,0,0,0,0,a];%分母的系数
yy3=filter(Bz1,Az1,z1);%滤波器进行滤波
YY3=fft(yy3,32000);%经全通结构的混响器后的信号做32000点的FFT变
sound(yy1,fs,bits);
sound(yy2,fs,bits);
sound(yy3,fs,bits)
5.5.4经混响器处理后信号的时域波形和频谱图
figure(8);
subplot(2,1,1);plot(yy1);title('无限个回声滤波器时域图');%无限回声滤波器时域波形
subplot(2,1,2);plot(n1(1:
1000),YY1(1:
1000));title('无限个回声滤波器频谱图');%无限回声滤波器频谱图
figure(9)
subplot(2,1,1);plot(yy2);title('多重回声滤波器的时域图')%多重回声滤波器的混响器时域波形
subplot(2,1,2);plot(n1(1:
1000),YY2(1:
1000));title('多重回声滤波器的频谱图')%多重回声滤波器的频谱图
figure(10)
subplot(2,1,1);plot(yy3);title('全通结构滤波器的时域图')%全通结构的混响器时域波形
subplot(2,1,2);plot(n1(1:
1000),YY3(1:
1000));title('全通结构滤波器的频谱图')%全通结构的混响器频谱图
6.运行结果
6.1.原始信号时域波形和频谱图
图6.1原信号时域波形和频谱图
6.2采样后信号的时域波形和频谱图
图6.2采样后信号的时域波形及频谱
6.3对采样后信号延时时域波形和频谱图
图6.3延时后的时域波形
图6.4延时后的频谱图
分析:
(1)从时域上看,延时后的波形向右移动。
(2)从频谱图上看,幅值上几乎不变。
6.4混响后时域波形和频谱图
图6.5混响后时域图
图6.6混响后的频谱
分析:
(1)从时域上看,混响之后时域波形发生了一定变化,主要是幅度有一定变化。
(2)从频谱图上看,混响后频谱有上下跳动,其幅值有一定改变,部分地方跳动较明显。
6.5原始信号时域波形及频谱图和混响后的对比
图6.7原信号与混响信号的对比
6.6信号经过无限个混响器时域波形和频谱图
图6.8无限回声混响器处理信号
分析:
(1)从时域上看,波形与滤波前的波形大体相同,幅度上有微小变化;
(2))从频谱图上看,幅度有变化,且曲线相对于滤波前总体有向上变化的趋势。
6.7信号经过多重回声混响器时域波形和频谱图
图6.9多重回声混响器处理信号
分析:
(1)从时域上看,波形变化大,而经多重回声滤波器之后,其时域波形延长了。
(2)从频谱图上看,幅值总体减小。
6.8信号经过全通结构混响器时域波形和频谱图
图6.10全通结构混响器处理信号
分析:
(1)从时域上看,波形与滤波前的波形大体相同,幅度上有微小变化;
(2)从频谱图上看,幅值略微减小,曲线总体趋势向下。
7.总结
通过此次的课程设计,我对语音信号的延时和混响有了进一步的认识,能明白其的原理,特别是对多重回声滤波器、全通混响器等几种特别特殊滤波器的系统函数和编程实现都有一定了解。
此次的课设过程中,把它与我们所学的专业知识数字信号处理联系在一起,进一步的加深了对数字信号处理的相关知识的学习。
在设计的过程中,由于对所涉及的几种特殊滤波器之前没有接触过,所以遇到了很大的困难,而且关于在数字处理中,对语音信号里加入延时和混响的的资料都非常的少,这给开始的设计带来了很大的麻烦。
经过各方面的搜索,最终通过在网上查询得出了设计的方案。
这次的课设中,在多次的编程调试过程中,我对matlab的掌握更加的熟练了。
作为电子信息工程专业的学生,熟练的使用matlab软件对我们来说是很重要的技能。
此次的综合课设,涉及的知识较广,也有一定的难度,通过这段时间的努力,从着手开始查阅资料到编程不断调试,直至最后编程通过,在这个过程中,自己独立处理问题的能力得到了锻炼。
在以后的学习和工作中常常需要接触到各种新的知识点,很多东西之前都不懂,这就要求我们在已有的知识上,有很强的自学能力,进而达到预期目标。
此次课设对我来说无疑是一次很好的提升
参考文献
[1]刘慧颖,《MATLABR2007基础教程》,清华大学出版社.
[2]周开利,《MATLAB基础及其应用教程》,北京大学出版社.
[3]杨述斌,《数字信号处理实践教程》,华中科技大学出版社.
[4]刘幺和、宋庭新,《语音识别与控制技术》,科学出版社.
[5]赵力,《语音信号处理》,机械工业出版社.
[6]胡航,《语音信号处理》,哈尔滨工业大学出版社.
[7]王一世,《数字信号处理》,北京理工大学出版社.
[8]陈杰,《Matlab宝典》,电子工业出版社.
附录
源程序
x1=wavread('yuying111.wav');%读取信号
[x,fs,bits]=wavre
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 混响 效果 设计 课程设计 论文