DSP课程总结.docx
- 文档编号:9481176
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:10
- 大小:899.90KB
DSP课程总结.docx
《DSP课程总结.docx》由会员分享,可在线阅读,更多相关《DSP课程总结.docx(10页珍藏版)》请在冰豆网上搜索。
DSP课程总结
浅谈DSP及其应用
数字信号处理(DigitalSignalProcessing,简称DSP)是一门涉及许多学科而又广泛应用于许多领域的新兴学科。
二十世纪六十年代以来,随着计算机和信息技术的飞速发展,数字信号处理技术应运而生并得到迅速的发展。
在过去的二十多年时间里,数字信号处理已经在通信等领域得到极为广泛的应用。
数字信号处理是围绕着数字信号处理的理论、实现和应用等几个方面发展起来的。
数字信号处理在理论上的发展推动了数字信号处理应用的发展。
反过来,数字信号处理的应用又促进了数字信号处理理论的提高。
而数字信号处理的实现则是理论和应用之间的桥梁。
近来新兴的一些学科,如人工智能、模式识别、神经网络等,都与数字信号处理密不可分。
可以说,数字信号处理是把许多经典的理论体系作为自己的理论基础,同时又使自己成为一系列新兴学科的理论基础。
在学习信号处理与DSP应用课程的基础上,结合所学知识和课后查找资料,主要整理了DSP芯片的基本结构和特点、DSP系统的应用,并进行DSP芯片与单片机、ARM比较方面的内容。
一、DSP芯片的基本结构和特点
为了快速地实现数字信号处理运算,DSP芯片一般都采用特殊的软硬件结构。
以TMS320系列为例,其基本结构包括:
(1)哈佛结构;
(2)流水线操作;(3)专用的硬件乘法器;(4)特殊的DSP指令;(5)快速的指令周期。
这些特点使得TMS320系列DSP芯片可以实现快速的DSP运算,并使大部分运算(例如乘法)能够在一个指令周期内完成。
由于TMS320系列DSP芯片是软件可编程器件,因此具有通用微处理器具有的方便灵活的特点。
(一)采用哈佛结构
1.冯·诺伊曼(VonNeuman)结构
该结构采用单存储空间,即程序指令和数据共用一个存储空间,使用单一的地址和数据总线,取指令和取操作数都是通过一条总线分时进行。
当进行高速运算时,不但不能同时进行取指令和取操作数,而且还会造成数据传输通道的瓶颈现象,其工作速度较慢。
其结构图如图1所示
图1冯·诺伊曼(VonNeuman)结构
2.哈佛(Harvard)结构
该结构采用双存储空间,程序存储器和数据存储器分开,有各自独立的程序总线和数据总线,可独立编址和独立访问,可对程序和数据进行独立传输,使取指令操作、指令执行操作、数据吞吐并行完成,大大地提高了数据处理能力和指令的执行速度,非常适合于实时的数字信号处理。
与冯·诺伊曼结构处理器比较,哈佛结构处理器有两个明显的特点:
(1)使用两个独立的存储器模块,分别存储指令和数据,每个存储模块都不允许指令和数据并存。
(2)使用独立的两条总线,分别作为CPU与每个存储器之间的专用通信路径,而这两条总线之间毫无关联。
微处理器的哈佛结构如图2所示。
图2哈佛(Harvard)结构
3.改进型的哈佛结构
改进型的哈佛结构是采用双存储空间和数条总线,即一条程序总线和多条数据总线。
其特点如下:
(1)使用两个独立的存储器模块,分别存储指令和数据,每个存储模块都不允许指令和数据并存,以便实现并行处理。
(2)具有一条独立的地址总线和一条独立的数据总线,利用公用地址总线访问两个存储模块(程序存储模块和数据存储模块),公用数据总线则被用来完成程序存储模块或数据存储模块与CPU之间的数据传输。
(3)两条总线由程序存储器和数据存储器分时共用。
(二)流水线技术
DSP处理器流水线技术是将各指令的各个步骤重叠起来执行,而不是一条指令执行完成之后,才开始执行下一条指令。
每条指令可通过片内多功能单元完成取指、译码、取操作数和执行等多个步骤,实现多条指令的并行执行,从而在不提高系统时钟频率的条件下减少每条指令的执行时间。
其过程如图3所示
图3四级流水线操作
(三)配有专用的硬件乘法-累加器
DSP内部一般包括多个处理单元,如算术逻辑运算单元(ALU)、辅助寄存器运算单元(ARAU)、累加器(ACC)及硬件乘法器(MUL)等。
它们可以在一个指令周期内同时进行运算。
为了适应数字信号处理的需要,当前的DSP芯片都配有专用的硬件乘法-累加器,可在一个周期内完成一次乘法和一次累加操作,从而可实现数据的乘法-累加操作。
(四)具有特殊的DSP指令
为了满足数字信号处理的需要,在DSP的指令系统中,设计了一些完成特殊功能的指令。
如:
TMS320C54x中的FIRS指令等,专门用于完成系数对称的FIR滤波器算法。
(五)快速的指令周期
由于采用哈佛结构、流水线操作、专用的硬件乘法器、特殊的指令以及集成电路的优化设计,使指令周期可在20ns以下。
如:
TMS320C54x的运算速度为100MIPS,即100百万条/秒。
(六)硬件配置强
新一代的DSP芯片具有较强的接口功能,除了具有串行口、定时器、主机接口(HPI)、DMA控制器、软件可编程等待状态发生器等片内外设外,还配有中断处理器、PLL、片内存储器、测试接口等单元电路,可以方便地构成一个嵌入式自封闭控制的处理系统。
(七)支持多处理器结构
为了满足多处理器系统的设计,许多DSP芯片都采用支持多处理器的结构。
如:
TMS320C40提供了6个用于处理器间高速通信的32位专用通信接口,使处理器之间可直接对通,应用灵活、使用方便。
(八)省电管理和低功耗
DSP功耗一般为0.5~4W,若采用低功耗技术可使功耗降到0.25W,可用电池供电,适用于便携式数字终端设备。
二、DSP系统的应用
自从DSP芯片诞生以来,DSP芯片得到了飞速的发展。
DSP芯片高速发展,一方面得益于集成电路的发展,另一方面也得益于巨大的市场。
在短短的十多年时间,DSP芯片已经在信号处理、通信、雷达等许多领域得到广泛的应用。
目前,DSP芯片的价格也越来越低,性能价格比日益提高,具有巨大的应用潜力。
DSP芯片的应用主要有:
(1)信号处理,如:
数字滤波、自适应滤波、快速傅里叶变换、相关运算、频谱分析、卷积等。
(2)通信,如:
调制解调器、自适应均衡、数据加密、数据压缩、回波抵消、多路复用、传真、扩频通信、纠错编码、波形产生等。
(3)语音,如:
语音编码、语音合成、语音识别、语音增强、说话人辨认、说话人确认、语音邮件、语音储存等。
(4)图像、图形,如:
二维和三维图形处理、图像压缩与传输、图像增强、动画、机器人视觉等。
(5)军事,如:
保密通信、雷达处理、声纳处理、导航等。
(6)仪器仪表,如:
频谱分析、函数发生、锁相环、地震处理等。
(7)自动控制,如:
引擎控制、深空、自动驾驶、机器人控制、磁盘控制。
(8)医疗,如:
助听、超声设备、诊断工具、病人监护等。
(9)家用电器,如:
高保真音响、音乐合成、音调控制、玩具与游戏、数字电话/电视等。
3、DSP芯片与单片机的比较
单片机的内部结构一般包括:
CPU(主要是ALU和寄存器)、存储器(ROM和RAM)、I/O端口、定时器/计数器和中断系统等五部分。
通常情况下,MCU有很强的外围接口控制能力,可方便地实现RS232、RS485、CAN和12C等总线通讯与控制。
DSP的内部也集成了CPU,但是其中加入了乘法器、桶形移位寄存器等,此外还有存储器(包括DARAM、SARAM和ROM)、DMA、定时器、串口、PWM和HPI等,其外围接口能力也在不断提高。
而且DSP都采用内部多总线结构,使数据的存储和指令的执行更加快捷。
最重要的一点是,DSP具有快速的指令周期,TMS320系列已经从第一代的200ns降低到现在的5ns(1600MIPS)以下,其如此高的运算速度使其可以满足许多实时处理的需要。
对于MCU和DSP的结构和性能上差异,具体归纳如下表一所示。
(1)存储器结构及分配的比对
MCS一5l系列单片机和C54XDSP有着既相似又有别的程序存储器和数据存储器结构形式。
具体如下:
表1MCU一51单片机与C54X之存储器比对
比对项
机型
MCS-51单片机举例
C54X系列DSP举例
数据存储器
没有指令在程序存储器和数据存储器之间直接数据传送
程序存储器和数据存储器能直接传送
程序存储器
总寻址空间
程序64KB、数据64K
192k(其中程序64k、64k数据和64KI/O)
片内存储嚣类型
RAM和ROM
DARAM和ROM,可以通过
编程位安排作数据空间,也可以构成程序空间
堆栈
低向高增长
高向低增长
存储器与I\O空间
统一编址
各自独立编址
存储器映射
数据存储器
在内部数据区00-1FH
数据存储器的0-1FH
程序存储器
在内部数据区80-FFH
数据空间的20-5FH
地址数据复用
低八位地址和八位数据线采用分时复用
16位数据和地址线单独使用
(2)片内外设比对
DSP定时器的16位计数器的触发脉冲由预分频计数器提供,预分频计数器由CPU工作时钟决定。
单片机计数脉冲来源可以是机器周期(此时作定时器用),也可以是外部输入信号(此时作计数器用),由工作方式寄存器编程决定。
另外DSP还带有软件可编程等待状态发生器、可编程分区转换逻辑电路;这都是DSP为了适应外部存储器和外设接口的速度而设置的。
表2MCS一51单片机和C54X片内外设比对
外设
机型
MCS-51单片机举例
C54X系列DSP举例
定时器
2个十六位加1计数
2个十六位减1计数
串口
1个UART(异步接收、发送器)全双工串口
2个McBSP多通道缓冲串口
主机接口(HPI)
无
有
(3)典型指令的比对
DSP采用修正的哈佛结构,使处理器的性能大大提高,其独立的程序和数据总线,提供了高度的并行操作,可同时访问程序存储器和数据存储器,还町以在数据总线和程序总线之间相互传送数据。
这样DSP的指令功能就要丰富强大得多,如:
RPT、RPTB、MAC、MAS、MVDD、MVDM、MVDP等,因此采用最佳算法并利用它的指令来实现我们的目标是学好DSP的关键。
DSP有着特殊的内部结构、强大的信息处理能力及较高的运行速度。
表3MCS一51单片机和C54X典型指令比对
指令类
机型
MCS-51单片机举例
C54X系列DSP举例
数据传送
MOV
ST,LD
条件转移
CJNE,DJNZ
BC,BANZE
无条件转移
SJMP
B
加、减
SDD,SUB
ADD,SUB
乘
MUL
MPYU
输入、输出
MOVX
PORTW,PORTR
置位、复位
SETB,CLR
SSBX,RSBX
(4)程序读写过程的比对
各种集成开发环境,对于程序的编辑和调试提供了快捷便利的方法。
MCS一51系列单片机在开发环境下,经过汇编和链接后生成可执行文件“.HEX”,在RAM区进行调试;最后将调试通过的程序固化到EEPROM。
DSP程序在开发环境下,经过汇编及链接先生成可执行的输出文件”.OUT”,再转换为“.HEX”型,然后下载到EEPROM或者是烧到FLASH中。
且目前大多数的DSP在片内ROM固化了引导加载程序(BootLoader),加电复位时,DSP启动这一程序,将程序搬到片内程序RAM,再在RAM中运行程序,以提高运行速度。
表4MCS一51单片机和C54X程序读写过程的比对
比对项
机型
MCS-51单片机举例
C54X系列DSP举例
生成目标文件.OBJ
经过编辑和汇编
经过编辑(或编译)和汇编
链接后得到可执行文件类型
“.HEX”
先是“OUT”,在经格式转换工具转为“.HEX
复位后起始运行地址
0000H单元
0FF80H单元
固化程序存放
EPROM
EPROM或者FLASH
程序运行方式
从EPROM调出
可片内固化引导加载程序(BootLoader),加电复位后,这一程序被启动,将外EEPROM或FLASH的程序搬到片内RAM,再在RAM中运行。
4、DSP与ARM的比较
ARM具有比较强的事务管理功能,可以用来跑界面以及应用程序等,其优势主要体现在控制方面,而DSP主要是用来计算的,比如进行加密解密、调制解调等,优势是强大的数据处理能力和较高的运行速度。
FPGA可以用VHDL或verilogHDL来编程,灵活性强,由于能够进行编程、除错、再编程和重复操作,因此可以充分地进行设计开发和验证。
当电路有少量改动时,更能显示出FPGA的优势,其现场编程能力可以延长产品在市场上的寿命,而这种能力可以用来进行系统升级或除错。
单片机和arm的区别在于它的单位时钟频率不同,这2个都可以配合操作系统使用.能完成的功能和他外围的设计相关。
现在随着技术的发展,很多单片机里面也嵌入了DSP核,DSP里面也有了控制器核,所以单片机和DSP这个两个概念没有以前那么鲜明了。
ARM是通用处理器,和x86一样,可以在上面跑各种操作系统。
DSP根据名字就知道他是干嘛的了,一般用来作为专门处理数字信号。
单片机的工作ARM和DSP都能做,只是它便宜(而且有些单片机可靠性比arm和dsp都要强,比如工业控制用的单片机),主要当作简单的控制器来使用,比如工业中的温度控制等。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DSP 课程 总结