语音信号处理 2.docx
- 文档编号:28985822
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:11
- 大小:99.73KB
语音信号处理 2.docx
《语音信号处理 2.docx》由会员分享,可在线阅读,更多相关《语音信号处理 2.docx(11页珍藏版)》请在冰豆网上搜索。
语音信号处理2
实验报告
课程名称语音信号处理
实验仪计算机
实验名称语音信号的基本参数提取与矢量量化
系别信息与通信工程学院
专业电子信息工程
班级/学号电信11/2011m
学生姓名
实验日期2012-5-21
成绩_________________
指导教师王勇
一、实验目的
使学生通过本实验掌握提取并观察线性预测系数(lpc)、倒频谱(cep)、反射系数(k)等几种常用的语音参数;熟悉特征矢量、矢量形成、矢量空间、区域边界、距离测度、码本、聚类等概念,加深理解矢量量化(VQ)的原理;掌握基本的VQ实现方法,为进一步掌握语音识别等实际应用技术奠定基础。
二、实验内容
(1)利用Matlab对元音提取并观察线性预测系数(lpc)、倒频谱(cep)、反射系数(k)等几种常用的语音参数。
对比不同元音之间的参数。
(2)比较标量量化与矢量量化的异同点,熟悉特征矢量、矢量形成、矢量空间、区域边界、距离测度、码本、聚类等概念,加深理解矢量量化(VQ)的原理。
(3)通过编程实现简单的VQ过程,掌握基本的VQ实现方法。
三、实验原理
(1)线性预测系数(lpc)、倒频谱(cep)、反射系数(k)是几种常用的语音参数,可以形成特征矢量,矢量量化的码本中的码字就是由特征矢量构成的;
(2)矢量量化是将若干个标量数据构成一个矢量,然后在矢量空间中给以整体量化;
(3)矢量量化的方法:
①确定包含M个码字的码本,每个码字是由P个参数构成一个特征矢量;
②将语音信号的每一帧提取与码本中的码字相同形式的由P个参数构成的特征矢量;
③将输入信号的特征矢量与码本中的每一个码字相比较并被量化为‘距离’最小的码字的矢量值,将该码字的下标(标号)作为输出。
(4)在本实验中码本是给定的。
(5)矢量量化的原理框图:
码本
Yj(j=1,2,...
码本
Yj(j=1,2,...
Yjmin=min-1d(X,Yj)
矢量形成
X
Yjmin
图1矢量量化的原理框图
四、实验方法与实验步骤
(1)语音参数提取
参考如下程序,利用Matlab编程对每个元音提取并观察线性预测系数(lpc)、倒频谱(cep)、反射系数(k)等几种常用的语音参数,以适当的表格将数据记录下来。
画出
便于观察与对比不同元音之间参数的图形。
xa=wavread('a.wav',[501756]);
ca=rceps(xa);%提取倒频谱(cep)
[aa,ea,ka]=aryule(xa,8);%提取反射系数(k)
aa2=lpc(xa,8);%提取线性预测系数(lpc)
subplot(4,4,1);plot(xa)
subplot(4,4,2);plot(ca)
subplot(4,4,3);bar(aa)
(2)本实验中给定的矢量量化的码本
本实验中给定的矢量量化的码本有4个码字,特征矢量采用线性预测系数(LPC参数),分析阶数P=8,码字矢量维数K=9,给定码本中的码字如下:
Y1=(
)=Ya
=(1,-1.77891,1.43475,-0.87491,0.51574,-0.35793,
0.25688,0.22895,-0.27550)
Y2=(
)=Ye
=(1,-1.74811,1.44779,-0.42867,-0.72046,0.43426,
0.31352,-0.70315,0.50096)
Y3=(
)=Yi
=(1,-1.88931,1.68912,-1.20478,0.72695,-0.81863,
1.14223,-0.920350.33845)
Y4=(
)=Yu
=(1,-1.97814,1.40744,-0.52973,0.10981,-0.68175,
1.37006,-0.87356,0.20293)
(3)发【a】、【i】、【e】、【u】这四个元音,由麦克风采集语音数据,分别存成“a.wav”、
“i.wav”、“e.wav”、“u.wav”文件,存在文件夹‘YINSU’中。
(4)对文件夹‘YINSU’中每个语音取一段提取8阶线性预测系数(LPC参数),形成特征矢量。
(5)采用欧氏距离(d=sum((a-b).^2)),对文件夹‘YINSU’中每个音素进行矢量量化,记录每个音素与码本中各个码字的距离与量化结果。
(6)采用最大似然比失真测度,对文件夹‘YINSU’中每个音素进行矢量量化。
记录每个音素与码本中各个码字的距离与量化结果。
五、实验截图及实验数据
i
Y1=
1.0000-1.77891.4348-0.87490.5157-0.35790.25690.2289-0.2755
d1=
10.3182
Y2=
1.0000-1.74811.4478-0.4287-0.72050.43430.3135-0.70320.5010
d2=
11.4810
Y3=
1.0000-1.88931.6891-1.20480.7269-0.81861.1422-0.92040.3384
d3=
14.5510
Y4=
1.0000-1.97811.4074-0.52970.1098-0.68171.3701-0.87360.2029
d4=
12.9823
A
Y1=
1.0000-1.77891.4348-0.87490.5157-0.35790.25690.2289-0.2755
d1=
5.9421
Y2=
1.0000-1.74811.4478-0.4287-0.72050.43430.3135-0.70320.5010
d2=
6.9356
Y3=
1.0000-1.88931.6891-1.20480.7269-0.81861.1422-0.92040.3384
d3=
10.1783
Y4=
1.0000-1.97811.4074-0.52970.1098-0.68171.3701-0.87360.2029
d4=
8.2330
E
Y1=
1.0000-1.77891.4348-0.87490.5157-0.35790.25690.2289-0.2755
d1=
6.4027
Y2=
1.0000-1.74811.4478-0.4287-0.72050.43430.3135-0.70320.5010
d2=
7.3099
Y3=
1.0000-1.88931.6891-1.20480.7269-0.81861.1422-0.92040.3384
d3=
11.0306
Y4=
1.0000-1.97811.4074-0.52970.1098-0.68171.3701-0.87360.2029
d4=
9.4274
U
Y1=
1.0000-1.77891.4348-0.87490.5157-0.35790.25690.2289-0.2755
d1=
4.6368
Y2=
1.0000-1.74811.4478-0.4287-0.72050.43430.3135-0.70320.5010
d2=
4.4621
Y3=
1.0000-1.88931.6891-1.20480.7269-0.81861.1422-0.92040.3384
d3=
9.4099
Y4=
1.0000-1.97811.4074-0.52970.1098-0.68171.3701-0.87360.2029
d4=
6.7690
六、思考题
矢量量化在高度压缩信息方面的高性能是有代价的,其代价是什么?
在压缩过程中会损失掉一部分信息,这样,其原始数据不能由压缩数据完全恢复出来。
他是以丢失部分信息为代价而获得较高的压缩率。
7、实验心得
通过本次实验握了提取并观察线性预测系数(lpc)、倒频谱(cep)、反射系数(k)等几种常用的语音参数;熟悉特征矢量、矢量形成、矢量空间、区域边界、距离测度、码本、聚类等概念,加深理解了矢量量化(VQ)的原理;掌握基本的VQ实现方法,为进一步掌握语音识别等实际应用技术奠定了基础。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音信号处理 语音 信号 处理