基于单片机的语音录放系统设计研究Word文档下载推荐.docx
- 文档编号:16900477
- 上传时间:2022-11-27
- 格式:DOCX
- 页数:29
- 大小:502.62KB
基于单片机的语音录放系统设计研究Word文档下载推荐.docx
《基于单片机的语音录放系统设计研究Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《基于单片机的语音录放系统设计研究Word文档下载推荐.docx(29页珍藏版)》请在冰豆网上搜索。
关键词:
嵌入式系统;
数字录音;
FlashMemory
ABSTRACT
WiththegrowthoftheneedforsoundrecordinthedepartmentofGonganandRailway,manyproductsforsounddisposalhaveappeared.Asonesortoftheproducts,digitalrecordingsystemismainlyusedinthesystemsofindustrialwatchandautomaticresponsion,reportingtimelytheStateofworkingandwarninginformation,promptinformationandexplanation.
II
Thepaperhasdevisedtheembeddedsystemofdigitalrecordingonthebasisoftheprincipleofdigitalrecording.Whenrecording,themicrocontrollerwillconverttheanalogsignalsintothedigitalsignalsandthenstorethedigitalsignalsintheFlashMemory.Whileplayingthesound,therecordingfileorthe.wavfilecanbebothplayed.Thepaperfirstlyintroducesseveralwaysofdesigningthesystem,thentheprincipleofdigitalrecording,andthenthemainarchitectureofthesystemandthedevisingofthehardwareandsoftware.Atlastthefutureofthesystemandsomethinkingofpromotingisprovided.
Theembeddedsystemofdigitalrecordingisprovedtobestableafterthetestofit.Obviouslythesystemhastobepromotedbeforeitscommercialization,yetitisusefulhighlyforthesituationneedingrecording
Keywords:
theembeddedsystem;
digitalrecording;
第1章绪论
1.1课题背景
随着我国经济建设的迅猛发展,公安、铁路、民航、金融等部门对语音记录的需求不断增长。
把语音生成技术用于工业监控系统、自动应答系统、多媒体查询系统、智能化仪表、办公自动化系统或家用电气产品中,使它们具有语音输出功能,使之能在适当的时候用语音实时报告系统的工作状态、警告信息、提示信息或相关的解释说明等,无疑在提高人机通信能力、减少对错误处理的遗漏、提高系统性能、降低人们的工作强度等方面都有极大的好处。
数字录音系统是将现场的语音模拟信号转变为离散的数字信号,然后存储在一定的存储介质上的一种录音方式,它也是数字语音处理技术中常用的一种方式。
采用数字录音技术,有较高的效率和自动化程度,录音时间也长,并可将信息长期保存于存储介质中,同时对语音信息进行编辑整理非常方便,可快速查找。
实现数字录音系统可以采用PC机实现和嵌入式系统实现两种方式。
当使用PC机的时候,由于它的体积庞大,耗电高,造价也高,并且在某些情况下系统的稳定性得不到保证所以用PC机来实现前述的各项功能和操作,就受到了一定的限制。
而嵌入式系统的体积小,供电方便,造价低,稳定性也高,所以得到了广泛的应用。
本文中设计的嵌入式数字录音系统,主要是要满足以下几个指标:
(1)足够长的录音时间,至少30分钟以上的时间,主要满足对长时间数字语音记录的需要;
(2)大容量非易失数据的存储器作为存储媒介,可以保存语音文件和一记录;
(3)灵活方便的控制方式,可以随心所欲地进行客户所需要的各种对语音的操作;
(4)好的语音质量的保证,必须有足够高的采样频率;
(5)合理的数据压缩方式,既保证语音的质量,又要尽可能地充分地利用存储空间;
(6)同时录放音,即实现语音数据全双工传输;
(7)与PC机联机,能够将语音文件传入存储器,以备播放时用。
现阶段下,实现嵌入式录音系统主要有三种方案:
语音芯片实现、DSP芯片实现和通用单片机实现。
1.2当前嵌入式录音系统实现的方案
1.2.1语音芯片的采用
采用语音芯片进行录音是一种可行的方法,它有音质自然、单片存储、反复录放、低功耗等优点。
现有的主流语音芯片有以下几种:
(1)ISD系列[8]
一块ISD芯片上集成有麦克风前置放大器(AMP)、自动增益控制电路(AGC)、抗混淆和平滑滤波器、模拟存储阵列、扬声器驱动器、控制接口和内部精确的参考时钟,外部元件包括:
麦克风、扬声器、开关和少数电阻、电容,再加上电源和电池。
ISD系列语音芯片包括如下几种:
表1.1ISD系列语音芯片技术指标
芯片型号
录音时间
采样频率
特点
ISD1400系列
16-20秒
6.4-8.OKHz
边缘/电平触发音,EEPROM存储器,真实、自然再现语音和音乐,100,000次录音周期(典型值)
ISD2500系列
32-120秒
4.0-8.OKHz
边缘/电平触发音,EEPROM存储器,实自然再现语音和音乐避免了量化噪音,100,000次录音周期(典型值)
ISD33000系列
60-240秒
自动静噪功能,内置微控制器串行通信接口,EEPROM存储器,真实、自然再现语音和音乐,避免了量化噪音,反复录音十万次
ISD4003系列
4-8分钟
4.0-8.OKH
自动静噪功能,内置微控制器串行通信接口,音质真实自然,EEPROM存储器,反复录音十万次
ISD系列芯片的控制录放音有两种方式:
引脚的边沿或电平触发控制和微控制器串行通信接口控制,这两种方式都不能用类似文件的方式进行控制,因此操作不方便;
它的存储器采用的是非易失数据的EEPROM,但它的容量较小,由表1.1可以看出,最大录音时间只有8分钟;
另外,ISD系列芯片不能同时进行录放音。
由于上述原因,本嵌入式数字录音系统不采用ISD系列语音芯片。
(2)APR系列
APR系列录放语音芯片有以下几种:
表1.2APR系列语音芯片技术指标
边缘/电平触发音,EEPROM存储器,真实、自然再现语音和音乐,100,000次录音周期(典型值)
边缘/电平触发放音,EEPROM存储器,真实、自然再现语音和音乐,避免了量化噪音,100,000次录音周期(典型值)
APR系列芯片的控制录放音有两种方式:
电平触发录音、边缘触发放音控制和微控制器串行外设接口控制,这两种方式也都不能用类似文件的方式进行控制,因此操作不方便;
它的存储器采用的是非易失数据的多段式闪存,由表1.2可以看出,APR系列语音芯片最长的录音时间也只有16分钟;
另外,APR系列芯片也不能同时进行录放音,所以本嵌入式数字录音系统亦不采用APR系列语音芯片。
1.2.2DSP芯片的采用[2][4]
DSP芯片,也称数字信号处理器,是一种特别适合于数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法。
根据数字信号处理的要求,DSP芯片一般具有以下特点:
(1)在一个指令周期内可完成一次乘法和一次加法运算。
(2)程序和数据存储空间分开,可以同时访问数据和指令。
(3)片内具有快速RAM,通常可通过独立的数据总线进行访问。
(4)具有低开销或无开销执行循环及跳转操作的硬件支持。
(5)快速的中断处理和硬件I/O支持。
(6)在单周期内操作的多个硬件地址产生器。
(7)可以并行执行多个操作。
(8)支持流水线操作,不同操作阶段可以重叠执行。
从以上的特点可以看出,DSP芯片具有较快的运算速度和较短的指令周期,它的应用领域也非常广泛,对于语音的处理也是它的一个应用。
在本嵌入式数字录音系统中,未选择DSP芯片主要是基于以下几个因素的考虑:
(1)运算速度。
本系统中,对运算速度的要求,主要是要满足每一个AD变换后的数据都能及时地存入存储器,从后面的分析可以看出,通用单片机的处理能力已经可以满足本系统的需要。
(2)运算精度。
本数字录音系统没有复杂的数学计算,所以没有对运算精度的要求。
(3)片内硬件资源。
本数字录音系统由于必须能同时进行录放音,所以AD和DA的功能是必需的,对DSP芯片,若外接AD或DA元件,增加了复杂度,也提高了成本。
(4)功耗。
DSP芯片实现的功能较多,所以它的功耗相对较高。
(5)开发调试工具。
因为选用DSP芯片的同时,还要增加它的开发调试工具,因此提高了成本。
(6)价格。
DSP芯片的价格虽然己经降到很低,但相对于C8051F系列微处理器,还是要高一点,因此从成本考虑的话,选择一个价格相对较低的产品可以带来利润和产品竞争力的提高。
由于上述原因,本系统未采用DSP芯片,而是选用了通用的单片机。
1.3本论文的任务
在铁路公寓的叫班机系统和铁路机车上,都需要播放语音提示,为了界定责任,放音的同时还要将这些语音录制下来,这样在发生事故的时候,从录制的该语音情况就可以判断出谁是事故的责任方。
本系统就是针对类似的这种应用进行设计的,这种嵌入式数字录音系统,可以播放预先存储在存储器里的语音文件或它们的组合,也可以播放录音后存在存储器里的声音文件,在自己播放语音文件的同时,它还可以通过麦克风将该声音连带外界的声音一起录制下来,作为对播放过该语音文件的证明。
另外,通过它的TTL232接口,可以向其中输入命令来执行录放音、读取参数、传送文件等多种操作。
为了实现这些功能,本嵌入式数字录音系统必须在下列各项指标上达到要求:
(1)录音时间。
本系统的录音时间应该在30分钟以上,以满足对长时间录音的需要。
为了实现如此长时间的录音,必须有大容量的存储设备。
(2)非易失数据的存储器。
语音和录音文件必须能保存下来,才能用来重复播放,以满足需要。
(3)合适的采样速率。
由于本系统处理的不是音乐,而是语音信号,所以11.025KHz的采样速率可以保证录音和放音的质量。
(4)与PC机的联机功能。
要实现对本数字录音系统的控制,应考虑与PC机联机,通过TTL232接口发送相应的命令来实现相应的操作,另外也要通过TTL232接口将语音文件传入存储器。
(5)数据的压缩。
适当的数据压缩,可以减少存储器空间的用量,增大录音时间,但由于存储器的录音区是循环利用的,为了降低算法的复杂度,少占用更多的系统资源,所以本系统没有采用语音数据的压缩。
第2章数字录音的基本原理
2.1模拟音频和数字音频[1][9]
声音是由物体振动产生的,振动发声的物体称为声源。
在空气中,声源的振动会使周围的空气质点产生一定的疏密变化,并以一定的速度传播出去形成声波。
因此声波是疏密波,也称为纵波。
[1]
包围地球表面的大气层,随高度的不同而存在不同的大气压强。
有声音存在时,大气压强会有微弱的起伏变化,即在静态大气压强上叠加了变化的分量,这个变化的分量称为声压p,通常声压的大小用它的有效值P表示,单位是Pa。
人耳刚好能听到的声压约为2×
10-5Pa,在房间中大声说话,在相距1米处的声压约为0.05~0.1Pa。
声音在1秒间所传播的距离称为声速c,单位是米/秒(m/s),在室温下,1个大气压的空气中,声速约为340m/s.当声源作周期性振动,所发出的声波也是做同样的周期性振动,声源或声波每秒钟内的振动次数称为声音的频率f,单位是赫兹Hz,人耳能听到的声音频率范围是2OHz-20kHz。
单位时间内穿过垂直声波传播方向单位面积的声能称为声强,单位是瓦/平方米(W/m2)。
人耳对声振动的感受,在频率及声压级方面都有一定的范围,在这个范围以外的声振动人耳是听不到的。
人耳能感觉到的声振动约在20Hz-20kHz之间,称为可听声。
紊乱断续或统计上随机的声音称为噪声,对于不需要的声音也称为噪声。
噪声也用它的声压级dB数来表示它的大小,称为噪声级。
在寂静的环境里,人耳能分辨出轻微的声音,但在嘈杂的环境中,这些轻微的声音就被淹没掉了。
由于第一个声音存在而使第二个声音提高的现象称为掩蔽效应。
掩蔽效应对数字音频编码起到重要作用。
2.2数字音频技术的概念[1][9]
模拟量是指在时间上和幅度上都是连续的量,声波就是声压幅度随时间连续变化的模拟量,它由传声器转换成声频信号后,也是时间和电压幅度都连续变化的模拟信号。
如果幅度只是一些特定值的阶梯波,则是时间连续而幅度不连续的信号。
幅度连续而时间不连续的信号是脉冲幅度(PAM)调制信号。
时间和幅度都不连续的信号是数字信号。
从模拟磁带录音机和数字磁带录音机的比较来看,模拟录音存在很多缺点:
(1)在录音、编辑和放音过程中混入的各种噪音不能被分离出来,形成对信号的损伤。
(2)录音媒体的信噪比可成为记录信号信噪比的一部分。
(3)录音磁头、放音磁头等呈现的非线性会使记录的信号也呈现非线性。
(4)驱动、转动机械系统的不稳定会造成抖晃。
数录音是将模拟信号转变为离散的数字信号后进行记录的。
对于需要多次转接、复制的模拟录音,每转接、复制一次,信号的质量下降程度就要累加一次,而数字录音就没有这一问题。
数字录音具有下列优占。
(1)数字化的标准(取样频率、量化比特数)确定以后,性能的界限也就确定了,性能是稳定的。
(2)录音是以“0”或“1”数字进行的,放音时,只需判断出“0”或“1”,即判断脉冲“有”“无”即可,因而记录媒体的信噪比与放音信噪比无直接的关系。
(3)许多器件不需要具有线性。
(4)驱动、转动系统的不稳定,由于时钟脉冲信号和存储器的作用,不会造成晃。
2.3语音信号的数字化
将模拟信号转变成数字信号,需经过取样、量化和编码三个步骤。
2.3.1取样[1][3]
(1)取样定理
模拟声频信号可用幅度对时间的关系来表示,将模拟信号的幅度以一定的时间间隔取得样值,称为取样(或采样、抽样)。
取样的时间间隔称为取样周期,每秒内取样的次数称为取样频率。
根据取样定理,当取样频率fs为被取样信号最高频率fh的两倍时,则被取样信号可以被恢复,即fs≥2fh
(2)取样频率
取样频率的选取应考虑以下两点:
1)声频信号的最高频率;
2)防混叠低通滤波器的截止特性。
数字音频的质量与采样频率和量化精度有关,数字音频可分为以下几个质量等级[7]:
表2.1数字音频质量等级
信号类型
频率范围(Hz)
采样频率(KHz
量化精度(位)
电话语音
200~3400
8
宽带音频
50~7000
16
调频广播
20~15K
37.8
高质量音频
20~20K
44.1
由于本系统录音的对象是人说话时的语音,人的语音频率大概在300Hz至3.4KHz之间,根据取样定理,采样频率应该高于6.8KHz,从表2.1可以看出,普通语音选取的是8KHz,但为了提高声音的保真度,减少滤波实现的难度,同时与微机的录音频率最大程度地接近,所以系统选取采样频率为11.025KHz。
3)混叠的防止
经过取样后,原信号的频谱分布要有改变。
如果取样频率小于信号最高频率的两倍,或信号的实际最高频率超过了f
,则会产生频谱混叠现象,以后就无法将原信号复原,并且出现混叠噪声。
为了将声频信号严格限制在f
以下,应先让原信号通过一个高频截止频率为f
的低通滤波器后再进行取样。
4)取样保持电路
取样保持电路是在A/D变换器之前,为使取样保持一定时间而设的。
由于A/D变换器的转换需要一定时间才能完成,而输入的模拟信号是不断变化的,因此取样值必须保持一定时间。
5)取样产生的孔径效应
取样定理所叙述的由取样的PAM信号可以完全恢复原模拟信号是有条件的,即取样脉冲的宽度(即脉冲所占时间)应为无限小,但实际的取样脉冲都有一定的宽度,这就会使恢复的模拟信号的高频特性产生失真,这种效应称为孔径效应。
实验证明,当取样脉冲宽度为取样周期的1/4时,孔径效应所产生的高频损失约为0.2dB,人耳对它不能察觉到,不会成为问题。
2.3.2量化[1][3]
(1)量化的概念
将模拟信号的取样值,经“四舍五入”的方法转换成一种数字信号的过程称为量化。
在数字语音技术中,我们采用二进制表示一个数,即用“1”“0”来表示一个数,逢2进1,用电路的接通和断开即可实现。
采用二进制时的有效位数称为比特数或位数,在进行舍入运算的过程中会产生舍入误差。
由取样定理知道,如果取样频率能满足这个定理,就会完全恢复原波形,但要真正完全恢复原波形,则需要无穷多位数。
在通常的数字系统中,每个取样点都会产生舍入误差,并且存在与这种舍入误差相应的失真和噪声,称为量化噪声或量化失真。
量化阶梯数,或量化级数,是指量化所能取值的数目。
以二进制量化时,位数越多,量化阶梯数也就越多,16位的量化阶梯数为65536个,量化误差己很小。
对于量化阶梯相等的量化方法称为线性量化或均匀量化,不相等则称为非线性量化或不均匀量化。
均匀量化的量化噪声也是恒值,因此信号幅度大时,信噪比高;
信号幅度小时,信噪比低,噪声较明显。
非均匀量化在信号幅度小的时候,量化阶梯高度也小,信噪比可以较好。
信号幅度大的部分,量化阶梯高度也大,虽然量化噪声大,但由于人耳的掩蔽效应,对信号幅度大时增大的噪声会感觉不出来。
由表2.1可以看出,对于普通语音,量化精度选取8位就可以满足数字化语音质量的要求,因此本系统的量化位数就选取8位。
2量化噪声
(2.1)
当声噪信号为正弦波时,并且峰峰值为
1,则在单位负载上的功率S为
(2.2)
于是,可以算出以dB表示的信噪比为
(2.3)
可见,量化比特数M越大,信噪比越好。
量化噪声是均匀分布在0-fs/2的频带中,另外量化噪声的振幅为常数,它等于△,不随信号大小而改变,因而当信号很大时,系统的信噪比很高;
但当信号很小时,则量化噪声对系统的音质影响就将十分明显。
量化噪声的减低对于量化噪声可采用在信号中加给高频抖动信号的方法,量化后,再减去高频抖动信号,而使量化噪声白噪声化。
量化噪声随量化比特数增大而相应减小,但不能减为零。
量化噪声是不同于白噪声(即等带宽能量相等的噪声)的一种高频噪声,它是由比较少的孤立频谱重叠而成的噪声。
因此在听感上与白噪声不同,是一种较粗糙的、刺耳的、称为颗粒性噪声的声音。
可以将一种称为高频脉动的、与量化阶梯高度相等的小振幅白噪声与信号重叠,经量化后,颗粒性噪声即被白噪声化,使听感变好。
理论上将与量化阶梯高度v相等的均匀分布的高频抖动在量化前先与信号相重叠,量化后再将高频抖动除去,量化噪声就成为宽度为V、电功率v2/12的均匀分布的白噪声。
另外,还可由过取样减低量化噪声,利用非均匀量化的输入输出特性也可减低量化噪声。
2.3.3编码[1][3]
二进制使用“0”或“1”两个数字,逢二进一,用二进制数表示某一数值时,这一二进制数称为字,这种表示过程称为二进制编码。
常用的各种二进制码有自然二进制码、偏移二进制码、2的补码、偏移反射二进制码和折叠二进制码。
将模拟信号转换为数码,然后再转换成二进制数字信号的方法称为脉冲编码调制(PCM),冠以脉冲是因为转换后的数字信号以脉冲形式出现。
2.4数字信号的检错、纠错及模拟信号的恢复
2.4.1数字信号的检错和纠错[1]
数字信号在传输或记录过程会产生误码,根据产生的状态,误码可分为随机性误码和突发性误码两类。
随机性误码是指彼此孤立的误码,突发性误码是指彼此连续的集中误码。
为了避免重放已记录的数字信号时,由于各种原因所造成的连续的突发性误码影响重放,采取在记录时改变数字信号的顺序,重放时再按原来顺序重排回来的措施称为交织。
经过交织,可以将记录媒质上所产生的突发性误码,在信号恢复为原来顺序后被分散开形成随机性误码,以便于采取措施进行纠错。
常用的检错和纠错方法有:
奇偶校验码、交叉交织码、循环冗余校验码和邻接码。
2.4.2模拟信号的恢复
数字信号经反交织、纠错码处理和D/A变换后,还要经窗口电路和低通滤波器才能恢复为模拟信号。
(1)窗口电路
D/A变换器的输出信号需馈送到一个窗口电路,窗口电路是由一个模拟开关和两个缓冲放大器组成。
因为D/A变换器的输出信号必须经过一定时间后才能达到稳定值,利用来自模拟开关的控制信号,可在波形稳定后读出电压值,输出PAM信号。
(2)解调低通滤波器
当窗口电路输出的PAM信号,如果设计得使下一个脉冲正好在上一则通过低通滤波器后的脉冲串可变为各个脉冲响应的合成波,重现出原信号的波形。
第三章系统的硬件设计
在前一章介绍的数字录音原理的基础上,结合实际的情况和需要,从系统的任务和要求入手,开始对系统进行总体设计。
3.1系统的硬件总体设计
嵌入式数字录音系统应由下面各部分组成,如图3.1所示。
本嵌入式数字录音系统采用包含有AD与DA电路的单片机来实现
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 单片机 语音 录放 系统 设计 研究