声音信号的分析处理.docx
- 文档编号:1232092
- 上传时间:2022-10-19
- 格式:DOCX
- 页数:16
- 大小:412.25KB
声音信号的分析处理.docx
《声音信号的分析处理.docx》由会员分享,可在线阅读,更多相关《声音信号的分析处理.docx(16页珍藏版)》请在冰豆网上搜索。
声音信号的分析处理
《信号与系统》课程设计
语音信号的分析和处理
学院:
通信与信息工程学院
班级:
2010012030班
学生:
李雷(2010012030018)
阚姗蕾(2010012030037)
指导教师:
崔琳莉
2011年12月19日
一、摘要
声音是由物体的振动产生,以声波的形式在介质中传播,介质主要可分为固体,液体以及气体。
声波振动内耳的听小骨,这些振动被转化为微小的电子脑波,它就是我们觉察到的声音。
内耳采用的原理与麦克风捕获声波或扬声器的发音一样,它是移动的机械部分与气压波之间的关系。
在国际标准中,人声的频率范围是300Hz~3400Hz,不同的人或乐器产生的声音频率不一致,通过对声音信号的研究能够更好的处理声音信号的处理以及传输。
Matlab作为一款主要面对科学计算、可视化以及交互式程序设计的高科技计算软件,能够很好的完成对声音信号的分析和处理,快速的得出声音信号的时域图以及频域图。
关键字:
声音频率时域图频域图Matlab
Soundcomesfromtheshakeofobjectsandspreadsintheformofwavesinmediumconsistsofsolid,liquidandgas.Soundwavesshaketheossiclesintheears,transformedintofinalelectronicbrainwavesandthenwehearthesound.Theprincipletheearworkswhichisthesameastheprinciplethemicrophoneandthespeakerworks,isusingtherelationbetweenmechanicalpartandbarometricwave.InISO,thefrequencydomainisfrom300Hzto3400Hz,differsindifferentpeopleandmusicalinstruments.Thestudyofthesoundsignalhelptobetterdealwiththesignals.Asasoftwaremajorinscientificcalculation,Matlabisvisualandinteractive.Itiscapableofperfectlyfinishingtheanalysisanddisposeofthesoundsignalbysketchingthetimedomainfigureandfrequencydomainfigure.
Keywords:
sound,frequency,timedomainfigure,frequencydomainfigure,Matlab
二、实验要求
通过MATLAB的函数wavread()可以读入一个.wav格式的音频文件,并将该文件保存到指定的数组中。
例如下面的语句(更详细的命令介绍可以自己查阅MATLAB的帮助)中,将.wav读入后存放到矩阵y中。
y=wavread('SpecialEnglish.wav');
对于单声道的音频文件,y只有一行,即一个向量;对于双声道的音频文件,y有两行,分别对应了两个声道的向量。
我们这里仅对一个声道的音频进行分析和处理即可。
注意:
.wav文件的采样频率为44.1KHz,采样后的量化精度是16位,不过我们不用关心其量化精度,因为在MATLAB读入后,已将其转换成double型的浮点数表示。
在获得了对应音频文件的数组后,我们可以对其进行一些基本的分析和处理。
可以包括:
1、对语音信号进行频域分析,找到语音信号的主要频谱成分所在的带宽,验证为何电话可以对语音信号采用8KHz的采样速率。
2、分析男声和女声的差别。
我们知道男声和女声在频域上是有些差别的,一般大家都会认为女声有更多高频的成分,验证这种差别。
同时,提出一种方法,能够对一段音频信号是男声信号、还是女声信号进行自动的判断。
3、语音与乐器音频的差别。
比较语音信号与乐器音频信号的差别,尤其是在频域上的差别。
4、.wav文件的采样速率为44.1KHz,仍然远远高于我们通常说的语音信号需要的频谱宽度,例如在电话对语音信号的采样中,我们仅仅使用8KHz的采样速率。
对读入的音频数据进行不同速率的降采样,使用wavplay()命令播放降采样后的序列,验证是否会对信号的质量产生影响。
降采样的方法很简单,例如命令y=wavread('SpecialEnglish.wav');将语音文件读入后保存在向量y中,这时对应的采样频率为44.1KHz。
使用y1=y(1:
2:
length(y))命令,就可以将原序列y每隔1个采样后放入序列y1中,这时y1序列对应的采样频率即为22KHz。
5、自己下载获得一段中文语音信号(可以使用诸如“千千静听”等工具将.mp3文件转换成.wav文件),对中文语音与英文语音进行比较。
三、实验内容
3.1、对语音信号进行频域分析,找到语音信号的主要频谱成分所在的带宽,验证为何电话可以对语音信号采用8KHz的采样速率。
对声音信号的频谱图进行分析,使用Matlab绘制该语音信号的频谱图,观察频谱图,读出声音信号的频率范围,由采样定理可知,如果需要重建声音信号,需产生一个周期冲激串,其冲激幅度就是采样得到的样本值,将该冲激串通过一个增益为T,截止频率为,而小于的理想低通滤波器,该低通滤波器的输出就是。
使用Matlab中的快速傅里叶变换(fft),绘制出声音文件的时域图和频域图,对频域图进行分析,观察可得声音信号的主要频率范围为200Hz~1800Hz,根据采样定理可得,采样频率应不小于3600Hz,故电话使用8kHz的采样频率能保证声音无失真采样及恢复。
程序代码:
[x,fs,bits]=wavread('相声.wav');%将原声音信号转化为字符串%
subplot(211);
plot(x);%绘制声音信号的时域图%
title('时域分析图');
subplot(212);
y=fft(x,fs);
df=fs/length(y);
fx=df*(0:
length(y)-1);%将横坐标转化为频率值%
plot(fx,abs(y));%绘制声音信号的频谱图%
axis([080000500]);
title('频域分析图');
3.2、分析男声和女声的差别。
我们知道男声和女声在频域上是有些差别的,一般大家都会认为女声有更多高频的成分,验证这种差别。
同时,提出一种方法,能够对一段音频信号是男声信号、还是女声信号进行自动的判断。
首先,我们选择了普通的男生和女生分别演唱同一首歌,用matlab分别绘出两段声音信号的频谱图,从图中可以看出,男生的声音频率主要分布在200Hz~800Hz,女生的声音频率主要分布在300Hz~1800Hz,女生的声音高频成分较多。
这是因为,声波是由物体振动产生的机械波,男人声带宽而厚,振动频率低;女人声带窄而薄,振动频率高。
而我们平时所感受得男生声音低沉,女生声音尖细,则是由于发声时男女声带的振动频率的高低不同,所以男女音调的高低不同。
使用Matlab对男声女声的声音信号在不同频率的分布比例进行分析,运行程序后可得出,在低频范围(150Hz~1000Hz)内
男声低频比例n1=9.5343e-006女声低频比例n2=8.6394e-006
在高频范围(1000Hz~1800Hz)内
男声高频比例m1=7.5965e-006女声高频比例m2=8.2355e-006
以上的数据计算进一步验证了女声频率较高的假设,我们可以通过这种计算来分辨男声女声。
程序代码:
%画男生声音、女生声音的频谱图
y1=wavread('lu_ll.wav');
Fs=44100;%采样频率%
yt1=fft(y1);%傅里叶变换%
df=Fs/length(yt1);
Fx=df*(0:
length(yt1)-1);%将横轴变为频率轴%
figure
(1)
subplot(211);%subplot将图像画在一张图上%
plot(y1);title('男声时域波形');%画语音信号的时域波形%
subplot(212);
plot(Fx,abs(yt1));axis([010000010000]);
title('男声频谱图');xlabel('频率/Hz');
y2=wavread('lu_ksl.wav');
Fs=44100;%采样频率%
yt2=fft(y2);%傅里叶变换%
df=Fs/length(yt2);
Fx=df*(0:
length(yt2)-1);%将横轴变为频率轴%
figure
(2)
subplot(211);%subplot将图像画在一张图上%
plot(y2);title('女声时域波形');%画语音信号的时域波形%
subplot(212);
plot(Fx,abs(yt2));axis([01000005000]);
title('女声频谱图');xlabel('频率/Hz');
%计算男生和女生信号中高频和低频信号所占的比例:
[y1Fs]=wavread('lu_ll.wav');y1=y1(:
1);
yt1=fft(y1);
[y2Fs]=wavread('lu_ksl.wav');y2=y2(:
1);
yt2=fft(y2);
sum1=0;
fori=200:
1000%计算男声的低频比例%
sum1=sum1+abs(yt1(i));
end
sum=0;
fori=1:
length(yt1)
sum=sum+abs(yt1(i));
end
n1=sum1/sum;
sum1%低频信号量
sum%总信号量
n1%比例
sum1=0;
fori=200:
1000%计算女声的低频比例%
sum1=sum1+abs(yt2(i));
end
sum=0;
fori=1:
length(yt2)
sum=sum+abs(yt2(i));
end
n2=sum1/sum;
sum1
sum
n2
%高频%
sum1=0;
fori=3000:
3800%计算男声的高频比例%
sum1=sum1+abs(yt1(i));
end
sum=0;
fori=1:
length(yt1)
sum=sum+abs(yt1(i));
end
m1=sum1/sum;
sum1
sum
m1
sum1=0;
fori=3000:
3800%计算女声的高频比例%
sum1=sum1+abs(yt2(i));
end
sum=0;
fori=1:
length(yt2)
sum=sum+abs(yt2(i));
end
m2=sum1/sum;
sum1
sum
m2
3.3、语音与乐器音频的差别。
比较语音信号与乐器音频信号的差别,尤其是在频域上的差别。
我们找了五种不同的乐器演奏的《梁祝》,试图不仅分析语音信号和乐器音频信号的差别,还要分析不同乐器音频信号的差别。
使用狸窝软件进行时间截取和格式转换,分析得到频谱如下:
对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 声音 信号 分析 处理