书签分享收藏举报版权申诉 / 79

立即下载加入VIP,免费下载

当前位置：首页 > 外语学习 > 日语学习 > 语音识别小车.docx

语音识别小车.docx

文档编号：9907108
上传时间：2023-02-07
格式：DOCX
页数：79
大小：2.25MB

语音识别小车.docx

《语音识别小车.docx》由会员分享，可在线阅读，更多相关《语音识别小车.docx（79页珍藏版）》请在冰豆网上搜索。

语音识别小车.docx

语音识别小车

本科毕业设计论文

题目基于语音识别技术的智能小车

学生姓名学号0816014062

所在院（系）机械工程学院

专业班级测控技术与仪器082班

指导教师

2012年6月5日

本科毕业设计任务书

院（系）机械工程学院专业班级测控技术与仪器（测控082）学生姓名张杰

一、毕业设计题目基于语音识别技术的智能小车

二、毕业设计工作自___2011___年____11_月_1__日起至____2012____年5月__20___日止

三、毕业设计进行地点:

陕西理工学院（北区）机械学院实验中心

四、毕业设计内容要求：

1、设计课题简介

随着数字信号处理技术的发展，语音识别技术日趋成熟。

让人与机器进行语音交流，让机器明白人说什么，这是人们长期以来梦寐以求的事情。

所以语音识别技术迅速普及到各个领域之中。

用汉语语音识别技术驱动智能小车，就成为了普遍关注的问题。

让小车完成对特定汉语语音进行识别，同时对非特定汉语语音识别系统给出较恰当的解决方案，是本次毕业设计的难点。

要根据识别的语音对智能小车进行前进、后退、转弯、加减速、加大减小冲击扭矩等状态的切换；随着物联网技术的发展，多点监测和控制的应用极其广泛，搭建基于总线和组态软件的测控系统，实现对多个智能小车的监测和控制，都是本次毕业设计要解决的问题。

2、设计要求：

（1）能根据对语音的识别，对智能车进行指定动作的驱动。

（2）系统性价比高，可靠性强。

（3）智能化程度高，人机交互友好。

3、工作任务：

（1）了解并掌握语音识别技术的基本原理和实现方法。

（2）了解并掌握智能车控制的基本原理和实现方法。

（3）了解并掌握多地点总线的原理和实现方法。

（4）翻译约4000字符的相关英文资料。

（5）完成开题报告。

（6）论证方案，完成总体方案设计。

（7）完成各模块的原理图、程序的设计与仿真。

（8）完成系统的原理图并联调系统。

（9）完成毕业论文。

4、设计说明书格式要求：

设计说明书应包括：

序言、目录、摘要（中英文）、关键词（中英文）、正文（含设计方案论证、设计计算说明等）、结束语和参考文献等内容，并按照封页、设计任务书、序言、目录、摘要、关键词、正文、结束语、参考文献和封底的顺序装订。

指导教师翟任何系（教研室）测控技术与仪器

系（教研室）主任签名批准日期2011-12-31

接受设计任务开始执行日期学生签名

基于语音识别技术的智能小车

（陕西理工学院机械工程学院测控技术与仪器专业082班级，陕西汉中723003）

指导教师：

【摘要】本文对语音识别技术的智能小车概况做了阐述。

在硬件设计方面，主要以凌阳公司的SPCE061A单片机为控制核心，以全桥驱动控制电路板为辅，来控制小车的动作。

在软件方面，利用C语言进行编程，进行语音的“训练”和“识别”。

设计出具有如下功能的语音识别小车:

能够根据语音命令来控制小车的前进、停止、倒退、拐弯。

论文首先对系统的方案进行论证，然后对各单元的硬件工作原理进行了阐述，同时完成了软件设计的介绍，以及语音识别小车的联调和操作说明。

最后，针对非特定语音识别技术，提出了以LD3320专用语音芯片为核心的非特定语音识别系统的实现方案。

【关键词】SPCE061A；LD3320；语音识别；全桥驱动；智能小车

Intelligentcarbasedonthespeechrecognitiontechnology

Zhangjie

（Grade08,class2,TestingandMonitoringTechnologyandInstrumentation,SchoolofMechanics,shaanxiuniversityoftechnology,hanzhong,723003shaanxi）

Tutor:

zhaiRenhe

Abstract:

ThisarticlegivedadetailtotheSpeechrecognitionofIntelligentcar.Inthehardwaredesign,thedesignusedtheSunplus’sSPCE061Aasthecontrolofcore,andsupplementedbythefull-bridgedriverofthecarcontrolcircuitboardtocontrolthecar’smovements.Onthesoftware,weusedClanguageprogrammingforvoice"training"and"recognition".Ithasthefollowingfeatures:

Accordingtorecordedvoicecommandstocontrolthecartogo,stop,return,andturn.

Firstofall,thispaperconfirmedthesystemofprogram,andthendescribedtheunit'shardwareandtheworkingprincipleofthesituation.Atthesametime,completedtheintroductionofthesoftwaredesign,voicerecognitioncar’salignmentandoperatinginstructions.Finally,Fornon-specificspeechrecognitiontechnology,elaboratingtheImplementationofnon-specificbytheLD3320specialvoicechipasthecorespeechrecognitionsystem.Thisarticlegivedtheimplementationofnon-specificspeechrecognitionsystem.

Keywords:

SPCE061A,LD3320,SpeechRecognition,Full-bridgedriver,Intelligentcar.

1．绪论1

1.1引言1

1.2国内外研究状况2

1.3存在的不足或有待解决的问题2

1.4课题的目的任务和要求3

2．方案设计4

2.1系统方案选择4

2.2系统方案设计6

3．系统模块设计8

3.1SPCE061A介绍8

3.1.1SPCE061A最小系统及电源电路9

3.1.2SPCE061A强大的语音功能11

3.2SPCE061A的语音输入、播放模块13

3.2.1MIC输入13

3.2.2语音播放14

3.3SPCEO61A的语音识别模块16

3.3.1SPCEO61A的语音训练17

3.3.2SPCEO61A的语音识别20

3.4STC10LO8XE单片机模块22

3.5M-LD3320非特定语音识别模块23

3.5.1M-LD3320模块23

3.5.2LD3320的非特定语音识别25

3.6小车的H桥路控制模块29

3.6.1小车电机的控制原理30

3.6.2小车的动作子程序31

4．系统联调与分析总结37

4.1系统联调37

4.1.1硬件连接37

4.1.2软件调试及代码下载38

4.1.3训练小车38

4.1.4声控小车38

4.1.5重新训练38

4.2调试分析总结39

结束语41

致谢42

参考文献43

外文翻译44

附录52

附录A小车实物图52

附录B程序代码53

1．绪论

1.1引言

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

概括的说，语音识别技术可以分为两类：

一是对特定发音者的模式识别，使用者使用前需要进行简单的训练；二是对非特定发音者的模式识别，使用者无需训练即可使用，并可以进行识别，任何人皆可随时使用此技术。

语音识别技术不仅包括语音的录制和播放，还涉及语音的压缩编码和解码，语音的识别等各种处理技术。

以往做这方面的设计，一般有两个途径：

一种方案是单片机扩展设计，另一种就是借助于专门的语音处理芯片。

普通的单片机往往不能实现这么复杂的过程和算法，即使勉强实现也要加很多的外围器件。

专门的语音处理芯片也比较多，例如ISD系列、PM50系列等，但是专门的语音处理芯片功能比较单一，但想在语音之外的其他方面应用基本是不可能的。

而语音识别技术在这近五年来已经有很大的进步，最新的语音识别技术可以辨别90%以上的人类说出的字。

如今，微电子技术的高速发展，许多单片机内部集成有语音识别模块，例如DSP，SPCE061A等，这为实现语音控制功能提供了极大的方便。

在工业生产与生活中，智能小车作为最常用的行走机构得到了广泛的应用。

而语音识别小车即运用语音技术引导系统是基于移动小车平台上，实现对小车运动的控制。

语音识别技术就是让小车通过识别和理解过程把语音信号转变为相应的文本或命令的一种技术，其根本目的是研究出一种具有听觉功能的机器，这种小车能直接接受人的语音，理解人的意图，并做出相应的反应。

把这种具有语音信息处理能力的设备纳入人的语音交互对象，使之像人一样具备听、说、写功能，能对语音做出理解和反应，并在交互方式上不受时间和地点的限制，这是研究语音识别的重大意义。

本课题是研究的语音小车在运动中受语音控制，需要解决的是语音识别技术问题，它可运用于工业控制领域、航空航天领域等等。

它可替代人们繁重的劳动（如采掘、喷漆、焊接等），大大提高了劳动生产率，减轻了人们的劳动强度。

此外，它在高温、低温、深水、宇宙、放射性和其他有毒、污染的环境条件下进行操作，日益出现它的优越性。

1.2国内外研究状况

随着语音处理技术的发展，语音识别系统的实用性将进一步提高。

国外已有多种基于语音识别产品的应用，基于特定任务和环境的听写机也已经进入应用阶段。

许多发达国家，如美国、日本、韩国以IBM、APPLE、AT&T、Micr0Soft等著名公司都看好语音一识别的应用前景，为语音识别系统的实用化投以巨资，语音识别技术实用化进程大大加速。

21世纪初期的成果主要集中于实现机器（计算机）的同声传译系统以及多环境背景下的语音识别技术。

我国在语音识别技术领域发展进步很快，在近五到十年内语音识别系统的应用将更加广泛。

各种各样的语音识别系统产品将出现在市场上，如凌阳智能语音识别机器人，提高了语音信息处理速度，可以快速对语音进行应答。

采用了先进的非特定人语音识别技术，对口音和噪声不敏感。

更加入了独有的噪声检测技术，当环境噪声很大时，能给用户相应的提示；并且加入了可信度评估和拒识技术，对于命令以外的语音或者干扰声音可以拒识。

在语音交流的过程中，抗噪音能力得到了很大的提高。

随着语音识别技术与机器人技术的进一步结合，未来高智能的人机交流将不是梦想。

但在短期内还不可能造出具有和人相比拟的语音识别系统，要建成这样一个系统仍然是人类面临的一个大的挑战，我们只能一步步朝着改进语音识别系统的方向前进。

1.3存在的不足或有待解决的问题

声控技术虽然是一项比较先进的技术，但不可否认的是，声控技术在无限传输时的合成的质量不是很好，它尚需进一步提高，因为无线环境中的背景噪音太大了，当然还有其他方面的因素影响着声控功能的发挥，具体来说表现在以下几个方面：

（1）时效型。

从发出指令到执行指令，有一段延迟时间，虽已降低到尽可能的小，但还是很明显。

可行的方法就是改用高效的DSP芯片，这在经费上和时间上都是不允许的。

（2）对环境的适应。

如果环境噪声很大，或偶尔出现较大的噪声，则会出现误识。

这个不足之处还没有很有效的解决方案。

（3）多人识别。

各人的发音不尽相同，因此该系统还限于单人识别。

若要做多人识别，则识别的时效性会降低，即有很大的延迟。

另外，多人识别，也没有较为有效、成熟的算法供参考。

1.4课题的目的任务和要求

语音识别技术的智能小车顾名思义就是要实现语音识别和语音控制对小车系统进行全方位控制。

小车不仅具有前进、后退、左转、右转停车等基本功能，而且配合语音识别和语音控制，实现语音控制功能。

本次设计将展现一种基于具有语音功能的单片机控制小车，它具有机动性强，控制灵敏，语音识别，语音控制等优点。

主要是采用单片机语音识别及控制技术、定时功能、脉冲功能和中断功能对小车加以控制。

基于语音识别技术的智能小车研究只是其中很小的一点，但其成功实现将是语音识别及控制中前进的一步，对后续的研究有很多的帮助。

目前,特定人语音识别技术已发展到一定的成熟阶段,并出现了一些实用化的产品，人们更多地将重点转向了非特定人识别上。

因而，针对非特定语音识别技术，本文提出了非特定语音识别系统的设计与实现方案。

2．方案设计

2.1系统方案选择

方案一：

采用MCS-51系列中的80C51单片机。

以80C51为控制核心，利用声控传感器和专门的语音处理芯片，并采用桥式驱动电路来实现对小车的前进转向进行控制,并能够做出应答的功能。

80C51是一款八位单片机，应用范围广,价格便宜是其最大优点。

但由于80C51单片机的闪存（FLASH）只有8K,且无法内置DAC电路,必须通过外围电路实现。

另外，语音识别是一门新兴的技术,不止包括语音的录制和播放,还包括语音的压缩,编码和解码和语音的识别,这些都要进行大量的计算,如果用80C51来实现，需要扩展语音识别模块和语音播放模块，这样必然造成端口的资源紧张，而其实现起来比较困难且效率很低。

实现该方案结构如图2.1所示。

图2.1采用MCS-51系列单片机实现语音控制小车

方案二：

采用以TMS320VC5402这款DSP芯片为语音处理系统的核心部分来实现语音控制方案。

其主要优点包括：

采用改进的哈佛结构，带有专用硬件逻辑CPU（40位算术逻辑单元（ALU），包括1个40位桶形移位器和二个40位累加器；一个17×17乘法器和一个40位专用加法器，允许16位带或不带符号的乘法），片内存储器（八个辅助寄存器及一个软件栈），片内外专用的指令集，允许使用业界最先进的定点DSPC语言编译器。

最重要的是其运算处理速度的高效，可以快速处理大量的语音数据，实时性好，但费用价格昂贵。

该方案如图2.2所示。

图2.2基于TMS320VC5402的语音识别小车

方案三：

采用SPCE061A实现语音控制小车方案，由于SPCE061A内部集成有语音识别和语音播放功能模块，所以只需要扩展基本的MIC和语音功放即可，另外凌阳SPCE061A单片机提供32个I/O口，一片SPCE061A单片机即可实现所有功能，这为设计过程提供了极大方便。

该方案结构如图2.3所示。

图2.3基于SPCE061A的语音控制小车实现方案

比较以上三种方案可见,方案一应用范围广价格便宜但系统复杂且难以实现语音控制；方案二中TMS320VC5402这款DSP芯片虽然有强大的数据处理功能，但要完成语音识别功能，软件上实现起来比较复杂且价格昂贵；方案三应用范围一般价格略高，但凌阳SPCE061A单片机内部集成了D/A和A/D转换模块，重要的是SPCE061A单片机其具有语音识别的特色功能，拥有语音功能SPI函数库，软件易于编写，且能很好实现语音控制且可以使整个设计具备系统简洁,结构清晰简单,外围设备少，易于操作；因此，选择方案三。

2.2系统方案设计

根据设计任务要求，本次设计在特定语音识别系统的基础上同时增加了非特定语音识别部分，非特定语音部分主要由51单片机和M-LD330专用的非特定语音识别模块组成，该系统的结构框图如图2.4所示。

图2.4系统结构框图

系统组成主要包括以下五部分：

车体部分、SPCE061A精简开发板、51单片机部分、M-LD3320专用语音模块、电机驱动控制板。

车体部分：

小车车体主要为两个电机驱动装置，分前轮（方向驱动）和后轮（动力驱动）。

在车体的下面有一个可以安装4节AA电池的电池盒，整个小车的电源就是由它来提供的。

在小车的底部有一个小开关，它负责控制整个小车的电源开通与关断。

SPCE061A精简开发板：

凌阳SPCE061A单片机具有语音识别的特色功能，其内部集成有ADC、DAC、AGC等电路，以及兼有DSP芯片功能。

图中的语音输入部分MIC_IN、按键输入KEY、声音输出部分的功率放大环节等已经做到了精简开发板—SPCE061A板上，在硬件上为我们使用提供了很大的方便。

凌阳SPCE061A单片机在软件设计上，拥有针对语音播报、语音识别的语音函数库，这对使用者在编写语音识别的代码时程序能够非常容易。

51单片机部分：

51单片机选用STC10LO8XE芯片，使51单片机的并口与LD3320芯片连接通信，同时接收来自LD3320芯片触发信号进行分析处理，进而控制小车的运行状态。

M-LD3320专用非特定语音识别模块：

该模块将LD3320非特定语音芯片芯片与周围必要的容阻件集成在一块PCB上，将LD3320的芯片管脚通过2*20的排针引出。

可以直接将自己的主控MCU的管脚连接到M-LD3320模块的排针上，同时给M-LD3320模块提供3.3V电源和合适的晶振信号，就可以在主控MCU中编写程序运行LD3320的语音识别功能。

在电机的驱动方面，采用全桥驱动技术来设计小车的控制电路板，负责将来自61SPCE061A板的控制信号转化为能够驱动电动机的信号，主要利用四个I/O端口分为两组分别实现两个电机的正转、反转和停三态运行。

3．系统模块设计

本章首先对基于特定语音识别技术的智能小车的各个功能模块进行阐述说明，该系统主要围绕以SPCE061A单片机为控制核心，通过电机驱动H桥路来控制控制小车的动作状态。

并且对非特定语音识别技术原理作简单的介绍，并重点阐述实现非特定语音识别技术的方案。

该方案是以嵌入式微处理器为核心，外围加非特定人语音识别芯片及相关电路构成。

该方案的非特定语音识别芯片选用ICRoute公司的LD3320芯片。

3.1SPCE061A介绍

SPCE061A是凌阳科技研发生产的性价比很高的一款十六位单片机，该芯片带有硬件乘法器，能够实现乘法运算、内积运算等复杂的运算。

它不仅运算能力强，而且处理速度快，单周期最高可以达到49MHz。

该芯片拥有8路10位精度的ADC，其中一路为音频转换通道，MIC_ADC通道带有AGC自动增益环节，能够很轻松的将语音信号采集到芯片内部。

两路10位精度的DAC，只需要外接功放（SPY0030A）即可完成语音的播放。

SPCE061A的硬件内部结构如图3.1所示。

另外，凌阳十六位单片机具有一套易学易用的指令系统和集成开发环境，在此环境中，它支持标准C语言编程，也支持C语言与汇编语言的互相调用。

并且提供了语音录放的库函数，只要了解库函数的使用，就可以很容易的完成语音的录放、识别等功能，这些都为软件开发提供了方便的条件。

图3.1SPCE061A内部结构图

SPCE061A特性简介：

◆16位μ’nSP微处理器：

16位加法运算、16x16位硬件乘法、DSP的内积滤波运算

◆CPU时钟：

0.32MHz至49.152MHz；

◆内置2K字SRAM；

◆内置32K闪存ROM；

◆可编程音频处理；

◆2个16位可编程定时器/计数器（可自动预置初始计数值）；

◆2个10位DAC（数-模转换）输出通道；

◆7通道10位电压模-数转换器（ADC）和单通道声音模-数转换器；

◆32位通用可编程输入/输出端口；

◆14个中断源可来自定时器A/B及时基，2个外部时钟源输入，键唤醒；

◆具备触键唤醒的功能；

◆32768Hz实时时钟；

◆声音模-数转换器输入通道内置麦克风放大器和自动增益控制（AGC）功能；

◆具备串行设备接口；

◆低电压复位（LVR）功和低电压监测（LVD）功能；

◆内置在线仿真板。

3.1.1SPCE061A最小系统及电源电路

1.SPCE061A最小系统

SPCE061A最小系统模块系统接线如图3.2所示，在OSCO、OSCI端接上32768HZ的晶振及谐振电容，在锁相环压控振荡器的阻容输入VCP端接上相应的电容电阻后即可工作。

复位电路采用的是按键式复位模式，由一个按键和一个电阻及电容构成。

其它不用的电源端和地端接上0.1uF的去耦电容提高抗干扰能力。

而在SPCE061A开发板上除了具备单片机最小系统电路外，还包括有电源电路、复位电路、ICE电路、音频电路（含MIC输入部分和DAC音频输出部分）等，“SPCE061A板”可以采用电池供电。

SPCE061A开发板在硬件方面为实现语音识别控制小车提供了极大的方便，本次设计直接利用SPCE061A开发板来搭建整个系统，就能实现语音识别小车的基本功能。

图3.2SPCE061A最小系统原理图

2.电源电路

凌阳SPCE061A单片机内核电源电压要求为3.3V，设计中外接的电池盒电源通过SPY0029（相当于一般3.3V稳压器，SPY0029A的最高输入电压为7V。

）稳压到3.3V，为整个单片机内核供电，如图3.3所示。

而控制板直接采用电池盒供电VCC。

图中两个二极管，是为了防止误将电源接反造成不必要损失而设置的，在操作过程中千万不要将电源接反，因为反向电压超过一定的值，二极管将会被损坏，达不到保护的目的。

后面的零电阻及其电源、地分成不同的几路是为了减少电磁干扰设置的。

图中的VDDH3为SPCE061A的I/O电平参考，如果该点接SPCE061A的51脚，可使I/O输出高电平为3.3V；VDDP为PLL锁相环电源，接SPCE061A的7脚；VDD和VDDA分别为数字电源与模拟电源，分别接SPCE061A的15脚和36脚；AVSS1是模拟地，接SPCE061A的24脚；VSS是数字地，接SPCE061A的38脚；AVSS2接音频输出电路的AVSS2。

图3.3电源电路图

3.1.2SPCE061A强大的语音功能

SPCE061A具有DSP功能、语音特色的凌阳十六位单片机开发系统，不需任何外围器件就可以完成语音录、放、识别等功能。

在本次设计中，关键地问题之一在于人声的A/D转换存储与识别，SPCE061A提供了语音输入压缩以及辨识的先进技术。

（1）SPCE061A的语音压缩存储

将经A/D转换后的数据压缩存储，SPCEO61A单片机的16位DSP有很强的信息处理能力，最高时钟频率达49.152MHz，具备运算速度高等优势。

这些为语音的录放、合成及辨识提供了条件。

凌阳压缩算法中DVR可用于录、放音。

语音的编码、存储、解码处理是通过操作麦克风输人所生成的WAVE文件完成的，但在这个环节上会出现的一个问题为其占用的存储空间很大，对SPCEO61A单片机的32KFLASH来说想要存储大