数字语音处理文档格式.docx
- 文档编号:16329874
- 上传时间:2022-11-22
- 格式:DOCX
- 页数:11
- 大小:57.14KB
数字语音处理文档格式.docx
《数字语音处理文档格式.docx》由会员分享,可在线阅读,更多相关《数字语音处理文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
声音的长短,它取决于发音时间的长短。
音色,音调,音强,音长,音色,音调,音强,音长
5说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫()。
一个音节可以由一个()构成,也可以由几个()构成。
()是语音发音的最小单位。
音节(Syllable);
音素(Phoneme);
音素;
音素
6任何语言都有语音的()和()两种音素。
元音(Vowel);
辅音(Consonant)
7呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素称为()。
辅音
8发辅音时由声带是否振动引起浊音和清音的区别,声带振动的是(),声带不振动的是()。
浊音;
清音
9()构成音节的主干(因为无论从长度还是能量看,元音在音节中都占主要部分。
)
元音
10人类的声道和鼻道可以看作是非均匀截面的声道管,声道管的谐振频率称为()。
共振峰频率(共振峰)
11汉语音节一般由()、()和()三部分组成。
汉语普通话中有6000多个常用字,每个汉字是一个音节。
声母;
韵母;
声调
12发浊音时,气流通过声门时使声带发生振动,产生准周期激励脉冲串,这个脉冲串的周期就称为(),其倒数成为()。
基音周期(pitch);
基音频率
13无论是单音节语音还是连续语音,其中浊音段的基因频率是随时间而变化的,基因频率的不同轨迹成为()。
14当两个响度不同的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象成为()。
掩蔽效应
15语音信号的生成模型可由()、()和()三个子模型构成,三者是()(串联/并联)的关系。
激励模型;
声道模型;
辐射模型;
串联
16语音信号激励模型一般分为浊音激励和清音激励,发清音时激励信号通常被模拟为()。
随机白噪声
17语音信号生成模型的辐射模型是()。
一阶类高通滤波器
18设截取的一段语音共有160个样本,而采样频率为8kHz,则该段语音持续时间为()。
20ms
19研究语音的时频分析特性所采用的与时序相关的傅立叶分析的显示图形称为()(Sonogram,或者Spectrogram)。
语谱图
20语谱图是一种()频谱,它是表示语音频谱随时间变化的图形,其纵轴为(),横轴为(),任一给定频率成分在给定时刻的强弱用相应点的()或色调的浓淡来表示。
三维;
频率;
时间;
灰度
[单项选择题]
21、传输函数形式为
的共振峰模型为()数学模型。
A.全零点;
B.全极点;
C.极零点;
D.以上都不是;
B
更多内容请访问《睦霖题库》微信公众号
22、传输函数形式为
D.以上都不是
C
23、传输函数形式为
的共振峰模型在结构上为()模型。
A.级联型
B.并联型;
C.混合型;
24简述基音频率、共振峰、语谱图的概念。
发浊音时,气流通过声门时使声带发生振动,产生准周期激励脉冲串,这个脉冲串的周期就称为基音周期(pitch),其倒数成为基音频率。
一般来说,男性说话的基音频率大致分布在50-200Hz范围内,女性和小孩的基因频率在200-450Hz之间。
人类的声道和鼻道可以看作是非均匀截面的声道管,声道管的谐振频率成为共振峰频率,简称共振峰。
共振峰由低到高依次为第一共振峰、第二共振峰、第三共振峰、...,相应的频率用F1、F2、F3...表示。
一般浊音中可以辨识的共振峰有5个,其中前三个对于区别不同语音至关重要。
语谱图描述了语音信号随时间而变化的频谱特性。
纵轴对应于频率、横轴对应于时间,图像的黑白度对应于信号的能量。
25简述什么是音调?
及单调与频率的关系表示。
音调是听觉分辨声音高低时,用于描述这种感受的一种特性。
音调与声音的频率并不成正比,还与声音的强度及波形有关。
描述音调的单位是美(mel)。
一个高于听阈40dB、频率为1KHz的纯音所产生的音调定位1000mel,如果一个纯音听起来比1000mel的声音调子高一倍,则其音调为2000mel。
音调与频率的关系近似表示为:
26掩蔽效应
当两个响度不同的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象成为掩蔽效应。
27语音信号分析采用()。
短时分析技术
28语音信号分析,根据所分析出的参数的性质的不同可以分为:
()、()、()、()等。
根据分析方法的不同,分为()和()两种。
时域分析;
频域分析;
倒频域分析;
线性预测分析;
模型分析方法;
非模型分析方法
29不论是分析怎么样的参数以及采用什么分析方法,在按帧进行语音分析,提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如()、()、()、()等。
语音信号的数字化;
语音信号的端点检测;
预加重;
加窗和分帧
30语音信号加窗、分帧常用的窗函数有()、()等。
(列举两个)
矩形窗;
汉明窗
31对于频率分布为0~3400Hz的语音信号,最低无失真采样频率应为()。
6800Hz
32、以下哪种分析不属于语音信号时域分析?
()
A.短时过零率分析;
B.短时相关分析;
C.短时平均幅度差函数;
D.同态分析;
D
33、短时能量的主要用途不包括以下哪一项?
A.可以区分浊音段和清音段;
B.可以用来查找声母和韵母的分界;
C.可以用来查找无声和有声的分界;
D.可以区分高频和低频分量;
34、采用自相关函数法对基音周期进行估计时,先用60~900Hz的带通滤波器对语音信号进行滤波,以下描述错误的是()
A.可减少共振峰的影响;
B.可抑制50Hz的电源干扰;
C.可保留基音频率的一、二次谐波;
D.为了防止8kHz采样时发生混叠干扰;
35语音的时变性与短时平稳性
语音信号的波形有些波形段有较强的周期性,有的波形段有较强的噪声性,并且周期性语音和噪声性语音的特征也在不断变化中,从而具有时变性。
但在较短时间内(10-30ms)语音信号的特征可以认为基本保持不变,这就是语音信号的短时平稳性。
36常用的时域基音检测算法有哪些(任选两种作答)?
它们的基本原理是什么?
自相关函数法:
浊音信号的自相关函数在基音周期的整数倍位置上出现峰值;
而清音的自相关函数没有明显的峰值出现。
因此检测是否有峰值就可判断是清音或浊音,检测峰值的位置就可提取基音周期值。
短时平均幅度差函数法:
对周期性的浊音语音,短时平均幅度差函数也呈现与浊音语音周期相一致的周期特性,短时平均幅度差函数在周期的各个整数倍点上具有谷值特性而不是峰值特性,可确定基音周期;
而对于清音语音信号,短时平均幅度差函数却没有这种周期特性。
利用短时平均幅度差函数的这种特性,可以判定一段语音是浊音还是清音,并估计出浊音语音的基音周期。
37浊音与清音的短时能量、短时平均过零率、短时自相关函数和短时平均幅度差函数有什么差异?
导致这些差异的根本原因是什么?
相对来说浊音的短时能量大、短时平均过零率低、短时自相关函数的峰值位置具有周期性,短时平均幅度差函数的谷值位置具有周期性。
这是因为浊音是由声带振动引起的脉冲波激励声道产生的,能量较大,频率较低,具有与激励波相同的周期性结构,而清音是由白噪声激励而产生,能量较低,频率较高,不具有周期性。
38设语音信号的线性预测模型为
,模型增益G=1,求该语音信号的线性预测谱表达式。
39根据量化的值的维数的不同,量化可分为()和()。
标量量化;
矢量量化
40矢量量化常用的失真测度有:
()。
欧式距离测度、加权欧式距离测度、Itakura-Saito距离、似然比测度和识别失真测度
41、矢量量化LBG算法每次迭代时将训练集分割为若干个子集所依据的是()
A.最邻近准则;
B.Centroid质心条件;
C.收敛准则;
D.熵极大化准则;
A
42、矢量量化LBG算法每次迭代时计算新码字所依据的是()
43HMM是一个()随机过程。
双内嵌式
44下图是一个三状态HMM,S1是起始状态,S3是终了状态,该HMM只能输出a和b两种符号,由下图的Viterbi算法可知输出aab的最佳路径为()
S1→S1→S2→S3
45对于语音识别用HMM,可用六个参数M={S,O,A,B,π,F}来定义,这六个参数分别表示什么?
S是模型中状态的有限集合;
O是输出的观测值序号的集合;
A是状态转移概率的集合;
B是输出观测值概率的集合;
π是系统初始状态概率的集合;
F是终了状态的集合。
46、从左到右型HMM(即状态的转移只能从左到右或者停留在原状态,不能返回到以前的状态)的状态转移矩阵具有何种形式?
A.上三角矩阵;
B.下三角矩阵;
C.对称矩阵;
D.非奇异矩阵;
47、训练HMM模型采用()
A.前向算法;
B.后向算法;
C.Viterbi算法;
D.Baum-Welch算法;
48语音编码(SpeechCoding)的目的是在保证语音质量和可懂度的条件下,采用尽可能少的比特数来表示语音。
即降低()。
数码率
49信源编码主要解决()问题;
信道编码主要解决()问题。
有效性;
可靠性
50()力图使重建后的语音时域信号的波形与原语音信号保持一致。
具有适应能力强、话音质量好等优点,缺点是()。
波形编码;
编码速率高
51()又称声码器技术,从听觉感知的角度注重语音的重现,通过建立语音信号的产生模型,提取其特征参数来编码,波形上不要求与原信号匹配。
优点是();
缺点是语音质量差,自然度低,对环境噪声敏感。
参数编码;
编码速率低
52若普通电话通信中采用8kHz采样,并进行12bit量化,则数码率为()。
96Kbit/s
53人的听觉生理和心理特性对于语音感知的影响主要表现在哪些方面?
1)人类听觉系统具有掩蔽效应;
2)人耳对不同频段声音的敏感程度不同;
3)人耳对语音信号的相位变化不敏感。
54感觉加权滤波器是根据人耳的()来设计的。
55均匀量化的特点是:
大信号时量化信噪比(),小信号时量化信噪比()。
大;
小
56在增量调制(DM)中,语音信号波形发生急剧变化时,容易出现译码波形不能充分跟踪这种急剧变化而产生失真的现象,称为()。
斜率过载
57LPC声码器采用的编码方式为()(波形编码/参数编码)。
参数编码
58、语音信号中存在多种冗余度是语音信号可进行压缩的重要依据,下列选项中()属于频域冗余度。
A.语音信号幅度非均匀分布性
B.语音信号样本间的强相关性
C.浊音语音段具有的准周期性
D.非均匀的长时功率谱密度
59一帧典型的LPC参数包括1bit清浊音信息、5bit增益常数、6bit基因周期、每个LPC系数6bit,共8个LPC系数,如果一帧时长20ms,请计算该LPC声码器的码率。
(1+5+6+6*8)/0.02=3000bit/s
60语音识别从所识别的对象来分,可分为什么?
(1)孤立词语音识别系统:
(2)连接词语音识别系统;
(3)连续语音识别系统;
(4)语音理解;
(5)会话识别。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 语音 处理