用MATLAB实现语音信号的时域分析Word格式文档下载.docx
- 文档编号:13607981
- 上传时间:2022-10-12
- 格式:DOCX
- 页数:10
- 大小:120.23KB
用MATLAB实现语音信号的时域分析Word格式文档下载.docx
《用MATLAB实现语音信号的时域分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《用MATLAB实现语音信号的时域分析Word格式文档下载.docx(10页珍藏版)》请在冰豆网上搜索。
wavwrite(y,'
f:
\\a'
soundview(y,Fs,'
name'
)
(2)读取WAV文件,显示语音信号的波形。
x=wavread('
\\a.wav'
figure;
plot(x);
axis([0,size(x,1),-0.35,0.3]);
%坐标轴范围
title('
语音信号时域波形'
xlabel('
样点数'
ylabel('
幅度'
(
3)读取WAV文件,计算并显示语音的短时能量(窗函数为矩形窗,帧长为20)。
x=double(x);
f=enframe(x,20,100);
energy=sum(abs(f),2);
subplot(2,2,1);
axis([0,size(x,1),-0.7,0.9]);
subplot(2,2,2);
plot(energy);
语音信号的短时能量'
legend('
帧长LEN=20'
f=enframe(x,20,200);
subplot(2,2,3);
帧长LEN=100'
f=enframe(x,20,400);
subplot(2,2,4);
帧长LEN=200'
(4)读取WAV文件,计算并显示语音的短时过零率(窗函数为矩形窗,帧长为256,帧移为128),所用程序代码为:
LEN=100;
INC=100;
f=enframe(x,LEN,INC);
%分帧
%计算短时过零率
z=zeros(size(f,1),1);
difs=0.01;
fori=1:
size(f,1)
s=f(i,:
forj=1:
(length(s)-1)
ifs(j)*s(j+1)<
0&
abs(s(j)-s(j+1))>
difs;
z(i)=z(i)+1;
end
subplot(2,1,1);
plot(x);
xlabel('
subplot(2,1,2);
plot(z);
语音信号的短时过零率'
帧数'
短时过零率'
(5)读取WAV文件,当窗函数为矩形窗、帧长为20时,计算一帧浊音的短时自相关函数所用的程序代码为:
x=wavread('
LEN=100;
INC=100;
ff=f(72,:
%选取一帧浊音信号
ff=ff'
.*rectwin(length(ff));
%计算短时自相关
N=LEN;
R=zeros(1,N);
fork=1:
N
R(k)=sum(ff(k:
N).*ff(1:
N-k+1));
R1(k)=R(k)/R
(1);
plot(ff);
axis([0,N,-0.5,0.5])
加矩形窗的语音帧'
plot(R1);
axis([0,N,-1,1])
加矩形窗的短时自相关函数'
k'
R(k)'
3.实验结果及其分析
(1)本实验利用8000Hz的采样频率对输入的语音信号进行采样,采样点数为40000个,持续时间为4秒,存储格式为double。
之后将数字语音数据写入F盘的a.wav文件,这段波形是读音为’ke’的波形,并通过放音设备进行回放。
回放的GUI界面如图1所示,通过该界面可以观察采集的语音信号。
图1用soundview函数显示的语音信号
(2)本实验将L盘的a.wav文件读取出来,并显示文件中的语音信号波形,显示的波形如图2所示。
该波形是汉语拼音“ke”的时域波形。
从图2可以看出,[K]是清音,它的波形峰值较低;
[e]是浊音,它的波形峰值较高。
图2语音“ke”的时域波形
(3)本实验将L盘的a.wav文件读取出来,当帧长取不同值时计算语音信号的短时能量,如图3所示。
从图3可以看出,浊音短时能量大,短时平均幅度大,短时过零率低,浊音具有较强的能量值,音段内隐藏信息的能力高。
清音短时能量小,短时平均幅度小,能量值较低,音段内隐藏信息的能力较低;
图3不同帧长对应的短时能量
(4)本实验首先读取a.wav中的语音数据,之后计算每一帧的短时过零率,最后将原始语音信号和短时过零率显示出来,如图4所示。
从图4可以看出,清音的过零率较高,浊音的过零率较低。
图4短时过零率
(5)本实验首先读取a.wav中的语音数据,之后对数据进行分帧加窗处理,帧长为256,帧移为128。
选取其中的一帧浊音(第*帧)并计算这帧的短时自相关函数。
当窗函数分别为矩形窗和汉明窗时,截取的语音信号和短时自相关函数如图5和图6所示。
从图5和图6可以看出,矩形窗能够比汉明窗更明显的显示出第一个峰值。
当窗函数为矩形窗,不同帧长(帧移=帧长)的一帧浊音对应的短时自相关函数如图7和图8所示。
从图7和图8可以看出,帧长越长,越容易区分其最大值。
当窗函数为矩形窗,帧长为256,帧移为128,选取一帧清音,获得的短时自相关函数如图9所示。
从图5和图9可以看出,浊音具有明显的周期性,清音无明显周期。
图5加矩形窗的短时自相关函数
图6加汉明窗的短时自相关函数
图7帧长为50时的短时自相关函数
图8帧长为100时的短时自相关函数
图9清音的短时自相关函数
4.思考题
短时能量的主要用途有哪些?
答:
可以区分清音段与浊音段,可以用来区分,有声与无声的分界,生母和韵母的分界等,也可以用于语音识别中。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 实现 语音 信号 时域 分析