基于LD3320的语音控制系统的设计.docx
- 文档编号:5622498
- 上传时间:2022-12-29
- 格式:DOCX
- 页数:12
- 大小:80.72KB
基于LD3320的语音控制系统的设计.docx
《基于LD3320的语音控制系统的设计.docx》由会员分享,可在线阅读,更多相关《基于LD3320的语音控制系统的设计.docx(12页珍藏版)》请在冰豆网上搜索。
基于LD3320的语音控制系统的设计
基于LD3320的语音控制系统
摘要:
本系统是基于LD3320的语音控制系统,以LD3320和单片机(STC11L08XE)系统的中央处理器,构成一个独立的语音控制模块。
LD3320芯片是一款“语音识别”专用芯片,由ICRoute公司设计生产。
该芯片集成了语音识别处理器和一些外部电路,包括AD、DA转换器、麦克风接口、声音输出接口等。
该芯片在设计上注重节能与高效,不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中即可以实现语音识别、声控、人机对话功能。
并且,识别的关键词语列表是可以任意动态编辑的。
关键字:
语音控制系统;LD3320;STC11L08XE
ThevoicecontrolsystembasedonLD3320
Abstract:
ThissystemisbasedonthevoicecontrolsystemLD3320,LD3320centralprocessorandmicrocontroller(STC11L08XE)system,constituteanindependentvoicecontrolmodule.LD3320chipisa"voicerecognition"dedicatedchip,designedandmanufacturedbytheICRoutecompany.Thechipintegratesaspeechrecognitionprocessorandsomeexternalcircuits,includingAD,DAconverters,microphonejack,audiooutputinterface.Thechipemphasisonenergyconservationandefficiencyinthedesign,doesnotrequireanyexternalauxiliarychipssuchasFlash,RAM,etc.,directlyintegratedintheexistingproductsthatcanbeimplementedvoicerecognition,voicecontrol,man-machinedialoguefunction.Andidentifyalistofkeywordscanbeeditedatanydynamic.
Keywords:
Voicecontrolsystem;LD3320;STC11L08XE
第一章绪论
1.1课题背景.
语言是人们传递信息的主要方法,其中语音识别技术是世界上最流行和最具发展前景的新的信息技术。
使用语音识别作为人机接口设备可以具有简单、快速、灵便的优点,它起到了莫大的作用,在民用、军用和商用等领域,并将成为21世纪的新一代操作系统的连接端口。
在智能语音控制汽车、自动售票系统、智能家电控制、GPS导航和智能玩物等方面都有着极其广泛的运用。
此篇文章设计中枢为嵌入式微处理器,采用LD3320语音识别芯片和相干电路,策划达成了语音控制彩灯花样流水灯的语音控制系统。
由于LD3320芯片配置了语音识别CPU和外置电路,其中包括了DA以及AD转换器、MIC输入端、音频输出等输出端,辅助的芯片如Flash等都不需要在外部重新衔接。
在当前的电子产品中,直接配置就可以实现声音控制、人机交流、言语识别的功能,能够任意动态编辑识别的关键词语列表,因而满足了缩小芯片面积、降低机器功耗可通用的需求,综上所述,本声控系统有着非常广泛的应用前景。
1.2课题研究的目的及意义.
由于各种机器被人们创造出来并运用到生活中,我们就希望能够让机器理解人类语言和口头命令、人类的行动,以实现人机交流,让机器“活”起来。
人类实现这一梦想是从语音控制技术出现之后。
使机器经过理解和识别之后,把语言信号变换为对应的文字或指令的进程,就叫做语音识别的过程,这门技能,就叫语音识别。
作为低成本语音芯片以及消费类电子产品的需求高倍稳定的增加,使得其从PC平台转移到了移动和嵌入式设备中,识别精准度达到百分之九十八以上对于现在嵌入式非特定语音识别系统来说非常轻松。
基于上面描述社会的发展现状,我们对此有更为完美的设计概念的语音控制系统。
1.3系统设计主要任务.
本文利用LD3320模块与单片机STC11L08XE和若干LED小灯设计制作一款语音控制LED的变换系统。
系统的设计内容包括有:
硬件方面的设计与调试以及软件方面的编写与调试。
1.3.1硬件部分.
语音控制系统其硬件部分主要由以下三大部分构成:
(1)控制单元。
单片机(STC11L08XE)作为整个体系中控制方面最重要的元件,它与控制单位组合,形成控制功能的部分。
(2)语音识别系统。
语音识别芯片(LD3320)通过对语句的识别的编辑,供给用户掌管操作。
(3)LED灯组。
MCU通过语音芯片识别的数据来控制LED实现花样流水变换,完成语音控制的设计目的。
1.3.2软件部分.
语音控制其软件识别命令的设计主要由以下两大操作构成;
(1)语音芯片底层驱动。
语音芯片接口定义,方便主程序调用。
(2)MCU主程序。
通过接收语音芯片数据完成目的功能。
第二章系统方案设计
对于上面所描述的当代所拥有的技术,我们以单片机为中央控制单位,采集声音信息到LD3320,将语音信息转换成数据,实时在LED小灯上展示结果,可达到语音控制的目的。
系统设计框图如图1
图1系统总体结构框图
此次设计的内容是以LD3320语音控制为核心,设计一个LED小灯花样流水变换的系统,其变换内容有六个:
小灯全部点亮;小灯全部熄灭;单号的小灯点亮;双号的小灯点亮;小灯从左至右依次点亮;小灯从右至左依次点亮。
我们对系统采用的是语音口令操作,让芯片自动识别并执行相应的操作,而识别过程中,是不需要提前训练的,识别的关键词语是以字符串的形式存储在芯片中,我们事先将需要识别的语句传入到芯片中即可。
其识别的过程就是将我们所说的语音和关键词语列表进行一一匹配,选取最精确最相似的一条匹配结果,并执行相应操作。
本系统以LD3320为核心,结合MCU,LED灯,MIC等外围设备构成一个完整的语音识别系统。
第三章系统硬件电路设计
3.1单片机控制模块.
MCU采用STC11L08XE单片机。
STC11L08XE单片机是高抗干扰、新极速、微功耗的新型的8051芯片,早先的8051代码被其完整兼容,并且提速十倍左右。
里面集成度高,并且复位电路可靠,针对极速通信,智能控制,高干扰场景,指令代码完全兼容传统8051。
基本满足控制LD3320芯片的需求。
3.2语音识别模块----LD3320.
3.2.1LD3320特点介绍.
LD3320这款芯片(图2)是由ICRoute公司设计并出产的“语音识别”指定芯片。
此款芯片由语音识别CPU和部分外置电路组成,包括DA和AD转换器、MIC音频输入、音频输出端口等。
此款语音识别芯片在设计上注重节约能源以及提高效率,不用再外部另接Flash等其他的辅助芯片,在当前的产品中直接配置就可以完成声音控制、言语识别、人机交流功能,并且,此款芯片的识别关键词语库是可以任意动态编辑的。
图2LD3320外围电路
3.2.1LD3320模块功能介绍.
该芯片公司创新了独特的快而稳的精简算法,通过此算法,即可达到与说话者无关的语言识别,并且不需要使用者提前训练和录音,识别精准度高达百分之九十五。
不需要任何外部辅助闪存芯片,内存芯片和AD芯片,即可以达到识别语音的功用。
确切的提供了一种用于语音识别的单芯片解决方案。
单次的识别候选语句的设置都不能超过五十项,识别语句可以是单独的汉子,单词,或者小短句,但不能超过八十个字节的拼音串或者十个汉字。
另一方面,句子的内容识别可以动态修改,因此可以由一个系统支持各种场景。
内部的芯片设计已经配备了16位D/A转换器、16位A/D转换器和功放电路,MIC音频输入、单声道喇叭和立体声耳机能够非常便捷地和芯片的管脚相衔接。
立体声耳机能够产生清楚嘹亮的音响,最为难得的是它的输出端口的功率才20mW。
而且它的状态可以设置成为休眠,并且可以便捷地唤醒。
它也支持MP3的播放音频功用,不需要外围设备,掌握单片机的MP3数据将被发送到3320芯片可以从相应的语音芯片的输出引脚送入。
获得音频输出可以从立体声耳机或者扬声器来选择该产品设计。
工作供电为3.3伏特,三节常用的AA电池既可以达到便携移动系统的供电需求。
3.3系统电源.
LD3320需要工作在3.3V电压下,考虑LD3320I/O口需要与单片机I/O口直接相连接,顾采用3.3单片机,使得高电压的单片机控制的3320引脚不超过3.3伏特的电压。
常用USB供电都是5V顾采用AMS1117芯片及以下电路完成对系统的供电。
图3AMS1117芯片电路图
3.4通信.
LD3320芯片可以运用并行的方法以及串行的方法和外部中央处理器衔接,并行的时候,采用四个控制信号和八个数据线,加上一个中断返回信号。
串行接口,通过SPI协议和外部CPU衔接,MD接高电平,那么(SPIS:
1:
)再接到地面。
而此刻用到四个管脚:
一是片选(SCS冰),二是SPI时钟(SDCK),三是SPI输入(SDI),四是SPI输出(SDO)。
由于MCU的I/O口数量充足,且串行通信相对麻烦,故系统采用并行通信方式。
3.5LED外围设备.
选用LED流水灯是为了方便观察语音控制结果且相对直观。
其电路图如下:
图4LED流水灯设计电路图
第四章系统软件设计
4.1系统整体流程图.
中央控制器流程如图4.1所示
图5中央控制器流程
4.2流水灯设计理念.
本课题使用STC11L08XE单片机时无须外扩存储器。
此次设计的单片机最小运用系统,实验中,彩灯部分的设计配备的发光二极管一共用了八个,其他的由晶振、复位、供电等电路和必备的软件部分构成。
如果想连接到LED1打开P1.0端口,因此只需把P1.0端口变为低电平即可;反而言之,假使连接到LED1熄灭P1.0端口,只需把P1.0端口变为高电平就可以了;由此可知,另外七个LED彩灯在p1.1到p1.7端口的打开和关闭的方法和LED1是一样的。
同理可得,要实现彩灯流水变化,我们仅需将彩灯LED1到LED8逐一打开或关闭,八个LED灯就可以一明一暗的进行流水变换了。
因为人类眼睛的视觉暂留效应,再加上单片机执行每个命令所耗费的时间周期非常短,因而在控制彩灯开关的时候需要延迟一定的时长,否则我们就无法实现“流水”的效果了。
4.3流水灯设计方法.
(1)循环移位法.
在以上设计编程中我们运用的方法是逐一控制引脚端口的来达到目的的,所以程序会变的复杂,我们可以采用循环移位指令的方法,编程方面运用循环程序结构。
在程序最初的时候,发送给P1.0口一个数,该数原本就让P1.0先低,另外的位都是高位,接着保持一段时长,再让数据向高位去移动,P1口接受输出,这样就实现“流水”效果啦。
实际编程中我们先在ACC命令数据向左移动或者向右移动,接着将ACC移动数据再输出到P1口,即可以达到“流水”的设计成果。
详细的编程规划在下方,确实简化了程序结构。
(2)查表法.
通过检查流水灯程序,达到任何方式都可以进行流动变化,以及无限的流动模式,只要流水表不断变更,就可以完成多种样式的设计,实实在在的达到任意变化的流水灯花样效果。
首先显示的数据流模式是建立在一个标签,标签的数据表,然后通过查表指令后,将“-+DPTR-”送到累加器A中。
(3)位控法.
它是一种无技术含量但又最容易通晓的方式,采用的结构是顺序程序,与一个指挥和控制各输出级P1口,可控制相应的LED灯的亮灭。
在这个实验中,我们采取循环移位方法以及查表方法,两种手段比位置控制方法更繁琐,但是程序更容易。
4.4LED显示原理.
LED矩阵板就是LED点阵显示器的另一种说法,其特点是高亮度、均匀发亮、高可靠性等优点,可以组合成任意尺寸的LED显示屏幕。
正因如此,它被大量运用显示屏,仪器表以及各种设备中,展示出来的效果普遍得到认可。
而且它的显示体系非常的节能,再加上它灵巧的使用,可以拼装成大型LED显示体系。
由Ed点阵构成的LED屏,其普通型号为p2158a。
它是基于发光二极管像素,显示装置和按行和列的顺序,一行一行或一列一列的扫描模式,一个脉冲峰值较大的驱动,连续不断的选通显示屏的每行,在同一时间,脉冲信号的图形或文字信息发送到每列,重复上面操作,可以显示各种图形和文本信息。
此设计中LED灯的显示为动态显示。
我们采用的是共阴极LED灯,在“0”时LED灯发光,反之“1”的时候关闭,我们改变每个接口的“0”,“1”状态,开启或关闭,从而完成整个LED灯系统,使其流水状的明灭。
我们还可以采用各种不同颜色的LED灯,使我们的实验结果更加绚丽多彩,增加视觉效果。
4.5流水灯花样设计.
(1)说出语音指令“从上亮”,芯片接受指令之后,彩灯依次从上至下点亮循环;
(2)说出语音指令“从下亮”,芯片接受指令之后,彩灯依次从下至上点亮循环;
(3)说出语音指令“单号亮”,芯片接受指令之后,彩灯单号依次点亮循环;
(4)说出语音指令“双号亮”,芯片接受指令之后,彩灯双号依次点亮循环;
(5)说出语音指令“全部亮”,芯片接受指令之后,彩灯全部亮;
(6)说出语音指令“全部灭”,芯片接受指令之后,彩灯全部熄灭。
彩灯用8个发光二极管代替。
控制电路点亮了灯右移,左移,全部点亮或者全部熄灭,代替了原始的按键操作,两个彩灯之间的移动间隙设置为半秒。
LED彩灯的流水花样设计非常丰富,结合LD3320语音控制模板,可以实现各种花样的控制,语音指令设计非常便捷,单次的识别候选语句的设置都不能超过五十项,识别语句可以是单独的汉子,单词,或者小短句,但不能超过八十个字节的拼音串或者十个汉字。
另一方面,句子的内容识别可以动态修改,因此可以由一个系统支持各种场景,系统控制多种流水花样的变换。
第五章系统整机调试及功能测试
5.1硬件调试.
常见故障:
1、逻辑错误:
这是由于在设计的过程中而产生的错误所导致的,这方面的错误主要指线路连接错误。
2、元器件失效:
原因来自两个方面,第一点是由于元器件性能不达标,或者是元件本身就已经受到无法正常工作的损坏;二是由一个组件失效引起的装配误差。
3、可靠性差:
可靠性不好的原因非常多,例如芯片的质量直接影响到系统的稳定,类似此类的外部原因都可能造成实验的不成功。
4、供电因素:
如果电源供电方面存在问题,则芯片可能会因电压过高而烧掉,或者电压过低,无法带动系统运转。
调试方法:
包括多级调试和联机调试。
调试时,需要我们细心观察,细心检查,对问题逐一进行排除检查,找到原因并且排除故障。
硬件调试的时候,对于存在的问题进行了认真分析和细心纠正,这样做,才可以让实验的最终设计得以完成,并达到设计的效果。
硬件调试时,可以用PC进行电子调试,将MCU串口通过串口线联接到PC机,利用PC端打开串口调试助手,通过对芯片喊话,在芯片识别后通过MCU串口发送到电脑端,在屏幕上显示相对应的汉字,因而达到语音识别的调试结果。
若显示结果无误,则设计及编程没有错误;若显示内容与语音口令的内容不一致,则需检查电路,并修改程序,再次进行调试。
5.2软件调试.
软件调试一般分为以下四个阶段:
1、编写程序并初步检查错误;
2、在汇编语言的编译系统中编译源程序;
3、编制程序的链接,并及时发现程序中存在的错误;
4、改正错误。
对于软件的调试过程,对于存在的问题进行了认真分析和细心纠正,这样做,才可以让实验的最终设计得以完成,并达到设计的效果。
该系统可以通过调整语音控制口令的改进而控制流水灯的转移,变速,改变亮度,当然,这是比较繁琐的一项设计。
通过向芯片喊话,实现不同种类的花样流水灯,这样就可以直观的展示语音控制的魅力了。
也基本实现了语音控制的目的。
5.3设计效果调试
实验整体设计结束后,我们开始对实验成品进行最终调试,LD3320语音控制LED流水灯设计的展示。
对着MIC音频输入装置发送语音口令指示,观察流水灯的花样展示是否与我们当初的设计一致。
(1)说出语音指令“从上亮”,设计成品在接受指令之后,8个彩灯依次从上至下点亮循环,实验结果与设计一致;
(2)说出语音指令“从下亮”,设计成品在接受指令之后,8个彩灯依次从下至上点亮循环,实验结果与设计一致;
(3)说出语音指令“单号亮”,设计成品在接受指令之后,8个彩灯单号依次点亮循环,实验结果与设计一致;
(4)说出语音指令“双号亮”,设计成品在接受指令之后,8个彩灯双号依次点亮循环,实验结果与设计一致;
(5)说出语音指令“全部亮”,设计成品在接受指令之后,8个彩灯全部亮,实验结果与设计一致;
(6)说出语音指令“全部灭”,设计成品在接受指令之后,8个彩灯全部熄灭,实验结果与设计一致。
到此,实验整体调试全部结束,设计完成,模块稍加装饰即可成为一个独立的语音控制LED流水灯花样变换的最小系统。
第六章设计总结及技术展望
目前的语音口令控制体系的成本还是偏高,如果普及的话,并不是很受欢迎,而我们的设计,将各个功能模块有机的完美的结合起来,构成一个系统,并为它创新的更为智能化,更为人性化,符合21世纪的节能环保理念,高性价比,配置方便,安装便捷,适合于各种场合的推广,也可应用于高要求高配置的场所。
系统的创新点在于:
使用语音控制,摒弃了以往枯燥的按键式控制,实现了人机的交互,同样也是在开发过程中所攻克的技术难关。
语音控制系统给电子产品带来了全新的变革,一句简单的口令就可以实现人机交互,为智能家居、智能办公等提供了高效的方式。
现代人的生活理念就是智能生活,不少的电影里,都展现出人们对智能化的设计蓝图,随着科技的加速发展,在未来,更有可能实现人机结合,人们在机甲内,通过口令的发送,完成各种动作,在当代,美国、中国、日本等科技大国都在不断的进行这种人机结合的设计研究,越来越多的智能化机器不断诞生,更为精致,便捷,高效,低能耗的机器不断撩拨人们的眼球。
就拿最贴近生活的手机来说,智能化的手机设计理念不断完善,不断改变,人们开车时不方便打电话,只需说出电话号码,手机就会贴心的为您拨出号码。
还有更为便捷的导航功能,就如同电视广告所说的,您只需说出目的地,手机即可自动为你计算出导航地图,规划出最快的驾驶路线。
一个小小的手机,已经实现了人机交互的最大化,只需一句话,就可以代替双手,完成你想要的操作,这就是控制系统的优势所在。
就当代的情景来看,语音控制系统仍然处于一个不断研究探索的过程,还是需要不断地完善其功能,才能更好的适应社会未来的发展要求。
参考文献
[1]ThangTatVu,MaiChiLuong,SatoshiNakamura.AnHMM-basedVietnameseSpeechSynthesisSystem[C].ProceedingsoftheOriental-COCOSDA,2009:
116-121.
[2]赵九.语音信号处理[M].北京:
机械工业出版社,2011.
[3]DumansH,BonafonieA,KainA,vanSantenJ.Includingdynamicandphoneticinformationinvoiceconversionsystems.InTERSPEECH2004:
1193-1196.
[4]谭浩强.新世纪计算机基础教育丛书.C程序设计[M].清华大学出版社,2007
[5]万福君,潘松峰.单片微机原理系统设计及应用[M].合肥:
中国科学技术大学出版社,2001
[6]李波,王成友.语音转换及相关技术综述[J].通信学报.2004,5.
[7]胡航.语音信号处理[M].第4版,哈尔滨:
哈尔滨工业大学出版社,2009.
[8]冯志伟.语音合成中文本的归一化问题[J].北华大学学报,2010,第11卷,第2期:
41-49.
[9]谭浩强.新世纪计算机基础教育丛书.C程序设计[M].清华大学出版社,2007
[10]万福君,潘松峰.单片微机原理系统设计及应用[M].合肥:
中国科学技术大学出版社,2001
[11]张友德单片微型机原理、应用于实验[M].3版上海:
复旦大学出版社,2000.
[12]黄根春,陈小桥,张望先电子设计教程[M].北京:
电子工业出版社,2007.
[13]李玉贤.基于SPCE061A单片机的语音识别系统的研究[D].东北农业大学,2004.
附录
设计主要程序
while
(1)
{
switch(nAsrStatus)
{
caseLD_ASR_RUNING:
caseLD_ASR_ERROR:
break;
caseLD_ASR_NONE:
{
nAsrStatus=LD_ASR_RUNING;
if(RunASR()==0)/*启动一次ASR识别流程:
ASR初始化,ASR添加关键词语,启动ASR运算*/
{
nAsrStatus=LD_ASR_ERROR;
}
break;
}
caseLD_ASR_FOUNDOK:
/*一次ASR识别流程结束,去取ASR识别结果*/
{
nAsrRes=LD_GetResult();/*获取结果*/
User_handle(nAsrRes);//用户执行函数
nAsrStatus=LD_ASR_NONE;
break;
}
caseLD_ASR_FOUNDZERO:
default:
{
nAsrStatus=LD_ASR_NONE;
break;
}
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 LD3320 语音 控制系统 设计