数字信号处理芯片的发展和应用方案.docx
- 文档编号:26118642
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:12
- 大小:45.03KB
数字信号处理芯片的发展和应用方案.docx
《数字信号处理芯片的发展和应用方案.docx》由会员分享,可在线阅读,更多相关《数字信号处理芯片的发展和应用方案.docx(12页珍藏版)》请在冰豆网上搜索。
数字信号处理芯片的发展和应用方案
数字信号处理芯片的发展和应用
数字信号处理芯片的发展和应用
关键词:
数字信号处理;芯片;发展;应用
摘要:
数字信号处理(DSP)系统由于受运算速度的限制,其实时性于相当的时间内远不如模拟信号处理系统。
从80年代至今的十多年中,DSP芯片于运算速度、运算精度、制造工艺、芯片成本、体积、工作电压、重量和功耗方面取得了划时代的发展,开发工具和手段不断完善。
DSP芯片有着非常快的运算速度,使许多基于DSP芯片的实时数字信号处理系统得以实现。
目前,DSP芯片已应用于通信、自动控制、航天航空及医疗领域,取得了相当的成果。
于载人航天领域,基于DSP芯片的技术具有广阔的应用前景。
数字信号处理作为信号和信息处理的壹个分支学科,已渗透到科学研究、技术开发、工业生产、国防和国民经济的各个领域,取得了丰硕的成果。
对信号于时域及变换域的特性进行分析、处理,能使我们对信号的特性和本质有更清楚的认识和理解,得到我们需要的信号形式,提高信息的利用程度,进而于更广和更深层次上获取信息。
数字信号处理系统的优越性表现为:
1.灵活性好:
当处理方法和参数发生变化时,处理系统只需通过改变软件设计以适应相应的变化。
2.精度高:
信号处理系统能够通过A/D变换的位数、处理器的字长和适当的算法满足精度要求。
3.可靠性好:
处理系统受环境温度、湿度,噪声及电磁场的干扰所造成的影响较小。
4.可大规模集成:
随着半导体集成电路技术的发展,数字电路的集成度能够作得很高,具有体积小、功耗小、产品壹致性好等优点。
然而,数字信号处理系统由于受到运算速度的限制,其实时性于相当长的时间内远不如模拟信号处理系统,使得数字信号处理系统的应用受到了极大的限制和制约。
自70年代末80年代初DSP(数字信号处理)芯片诞生以来,这种情况得到了极大的改善。
DSP芯片,也称数字信号处理器,是壹种特别适合进行数字信号处理运算的微处理器。
DSP芯片的出现和发展,促进数字信号处理技术的提高,许多新系统、新算法应运而生,其应用领域不断拓展。
目前,DSP芯片已广泛应用于通信、自动控制、航天航空、军事、医疗等领域。
DSP芯片的发展
70年代末80年代初,AMI公司的S2811芯片,Intel公司的2902芯片的诞生标志着DSP芯片的开端。
随着半导体集成电路的飞速发展,高速实时数字信号处理技术的要求和数字信号处理应用领域的不断延伸,于80年代初至今的十几年中,DSP芯片取得了划时代的发展。
从运算速度见,MAC(乘法且累加)时间已从80年代的400ns降低到40ns以下,数据处理能力提高了几十倍。
MIPS(每秒执行百万条指令)从80年代初的5MIPS增加到当下的40MIPS之上。
DSP芯片内部关键部件乘法器从80年代初的占模片区的40%左右下降到小于5%,片内RAM增加了壹个数量级之上。
从制造工艺见,80年代初采用4μm的NMOS工艺而当下则采用亚微米CMOS工艺,DSP芯片的引脚数目从80年代初最多64个增加到当下的200个之上,引脚数量的增多使得芯片应用的灵活性增加,使外部存储器的扩展和各个处理器间的通信更为方便。
和早期的DSP芯片相比,当下的DSP芯片有浮点和定点俩种数据格式,浮点DSP芯片能进行浮点运算,使运算精度极大提高。
DSP芯片的成本、体积、工作电压、重量和功耗较早期的DSP芯片有了很大程度的下降。
于DSP开发系统方面,软件和硬件开发工具不断完善。
目前某些芯片具有相应的集成开发环境,它支持断点的设置和程序存储器、数据存储器和DMA的访问及程序的单部运行和跟踪等,且能够采用高级语言编程,有些厂家和壹些软件开发商为DSP应用软件的开发准备了通用的函数库及各种算法子程序和各种接口程序,这使得应用软件开发更为方便,开发时间大大缩短,因而提高了产品开发的效率。
目前各厂商生产的DSP芯片有:
TI公司的TMS320系列、AD公司的ADSP系列、AT&T公司的DSPX系列、Motolora公司的MC系列、Zoran公司的ZR系列、Inmos公司的IMSA系列、NEC公司的PD系列等。
通用DSP芯片的特点
1.于壹个周期内可完成壹次乘法和壹次累加。
2.采用哈佛结构,程序和数据空间分开,能够同时访问指令和数据。
3.片内有快速RAM,通常能够通过独立的数据总线于俩块中同时访问。
4.具有低开销或无开销循环及跳转硬件支持。
5.快速中断处理和硬件I/O支持。
6.具有于单周期内操作的多个硬件地址产生器。
7.能够且行执行多个操作。
8.支持流水线操作,取指、译码和执行等操作能够重叠进行。
DSP芯片的应用
随着DSP芯片性能的不断改善,用DSP芯片构造数字信号处理系统作信号的实时处理已成为当今和未来数字信号处理技术发展的壹个热点。
随着各个DSP芯片生产厂家研制的投入,DSP芯片的生产技术不断更新,产量增大,成本和售价大幅度下降,这使得DSP芯片应用的范围不断扩大,当下DSP芯片的应用遍及电子学及和其关联的各个领域。
典型应用
(1)通用信号处理:
卷积,关联,FFT,Hilbert变换,自适应滤波,谱分析,波形生成等。
(2)通信:
高速调制/解调器,编/译码器,自适应均衡器,仿真,蜂房网移动电话,回声/噪声对消,传真,电话会议,扩频通信,数据加密和压缩等。
(3)语音信号处理:
语音识别,语音合成,文字变声音,语音矢量编码等。
(4)图形图像信号处理:
二、三维图形变换及处理,机器人视觉,电子地图,图像增强和识别,图像压缩和传输,动画,桌面出版系统等。
(5)自动控制:
机器人控制,发动机控制,自动驾驶,声控等。
(6)仪器仪表:
函数发生,数据采集,航空风洞测试等。
(7)消费电子:
数字电视,数字声乐合成,玩具和游戏,数字应答机等。
于医学电子学方面的应用如同其它数字图像处理壹样,DSP芯片已于医学图像处理,医学图像重构等领域,如CT、核磁成象技术等方面得到了广泛的应用,已取得了令人满意的效果。
于助听,电子耳涡等方面也取得了相当的进展(文献[1,2])。
国内、外也有关于脑电、心电、心音和肌电信号处理方面基于DSP芯片系统的报道(文献[4~7]),我们对1996年以前国外生物医学工程的部分核心期刊,如IEEETransactionsonBiomedicalEngineering,ComputersandBiomedicalResearch等核心期刊进行检索,有关基于DSP芯片处理系统的报道很少。
对国内生物医学工程的核心期刊,如《中国医疗器械杂志》、《中国生物医学工程杂志》、《生物医学工程学杂志》和《中国生物医学工程学报》等刊物进行检索,未见有关基于DSP芯片系统方面的报道。
对我所的光盘数据库进行检索,未见有关于航天医学方面应用的方案。
我们认为于生理信号处理领域基于DSP芯片的技术能够解决我们于实际工作中遇到的某些问题,如当生理信号数据量很大(如脑电,肌电等)且处理算法相对复杂时,现有的微机于实时采样、处理、存储和显示方面往往不能满足实际应用要求,而基于DSP芯片的高速处理单元和微机构成主从系统能够较好地解决这类问题。
载人航天领域中信号传输带宽的限制需要对生理数据进行实时压缩;大型实验中对庞大的数据进行实时处理依赖于数字处理系统的构成;载人航天中对数据处理精度,可靠性要求以及功耗、工作电压、体积、重量等方面的限制需要我们于构造处理系统中选择性能优良的芯片。
我们认为将DSP技术应用于载人航天领域具有十分重要的意义。
结束语
以DSP芯片为核心构造的数字信号处理系统,可集数据采集、传输、存储和高速实时处理为壹体,能充分体现数字信号处理系统的优越性,能很好地满足载人航天领域设备测量精度、可靠性、信道带宽、功耗、工作电压和重量等方面的要求。
目前,DSP芯片正于向高性能、高集成化及低成本的方向发展,各种各类通用及专用的新型DSP芯片于不断推出,应用技术和开发手段于不断完善。
这样为实时数字信号处理的应用——尤其是于载人航天领域中的应用提供了更为广阔的空间。
我们有理由相信,DSP芯片进壹步的发展和应用将会对载人航天信号处理领域产生深远的影响。
http:
//[参考文献]
[1]李小华,李雪琳,徐俊荣.基于DSP的数字助听器的研究.95年生物电子学[C],医学传感器等联合学术会议文集,,1995:
438~439
[2]候刚,徐俊荣.用于植入式多道电子耳涡的壹种数字实时语音特征分析系统的研究[M].生物医学工程前沿,合肥:
中国科技大学出版社,1993:
471~476
[3]邱澄宇,何宏彬.用于心电信号数据压缩的数字信号处理器[M].生物医学工程前沿,合肥:
中国科技大学出版社,1993:
463~466
[4]VijayaKrishnaG,PrasadSS,PatilKM.ANewDSP-BasedMultichannelEMGAcquisitionandAnalysisSystem[J].ComputersAndBiomedicalReserch,1996,29:
395~406
[5]刘松强.数字信号处理系统及其应用[M].:
清华大学出版社,1996:
223~228
[6]孙丽莎,沈民奋.基于高阶统计量的心音建模分析[C].第八届全国信号处理学组织委员会联合学术论文集,:
航空工业出版社,1997:
280~283基于DSP芯片的超光谱图像压缩技术
摘要基于DSP的超光谱图像压缩系统中,壹方面需要寻找优秀的算法,另壹方面需要结合DSP芯片的特点,选取合适设计方案,实现系统设计的功能。
本文结合目前现状,重点介绍了算法的设计,以及DSP芯片的选取方法,且讨论了如何有效地优化系统。
关键词DSP;图像压缩;超光谱图像
1引言
超光谱图像压缩技术是现代信息处理技术中壹项尤为重要的技术,近几年来基于DSP的图像压缩技术成为业内焦点。
然而,数据运算量大、处理数据突发性强是图像处理系统中最大的特点,尤其是超光谱图像,每幅图像壹般有着上百层的光谱信息。
同时,壹方面,现有的JPEG、JPEG2000等壹些标准算法且不适合超光谱图像压缩领域的要求,或者因为其算法的复杂度难于硬件实现等;另壹方面,DSP芯片的飞速发展,各芯片的性能有差异,完成的功能也不同。
因此,算法的寻找和芯片的选择,是系统设计的关键步骤,也是开发者十分关注的问题。
2系统的算法设计
图像压缩算法中,主要包括脉码调制、量化法、预测编码、变换编码、矢量量化、子带编码等。
于现有图像编码方法进壹步发展的同时,壹些新的具有重要发展前景的图像编码方法如模型基图像编码方法,分形图像编码和神经网络方法等,取得了引人注目的进展且取得了不少研究成果。
它们的显著特点是突破了常规编码技术所依据的信源编码理论的框架,效果更好。
2.1系统对算法的要求
目前,流行的图像压缩方法众多,至于这些方法哪些更好或者哪些不好,仍很难评价,而且各个算法的压缩效率也是和具体的图像数据和DSP芯片密切关联,无法下统壹的结论。
但总的来说,于图像压缩技术中,大多是多种方法结合使用,很少有用单纯壹种方法完成的。
壹般来说,压缩比越大,算法越复杂,实时压缩解压缩的困难程度越大,要求的硬件环境也越高。
比如于可视电话中,若原图像格式采用QCIF(176×144),则原始图像有4.5Mb/s的数据量,若最后用28.8kb/S的MODEM于PSTN上传输,则要提供150多倍的压缩。
当然,由于算法的复杂度增大,仍需付出大量的软件和硬件代价。
对于不同的应用系统,算法有相应的要求。
如遥感超光谱图像实时压缩系统中,壹般要求是无损压缩,且芯片体积小,性能稳定等;而于视频图像压缩系统中,则要求较大的压缩比,即使丢掉壹些信息也是允许的,且芯片处理速度要快,能够达到系统实时性的要求。
即使于确定的系统中,选择合适的算法也有着重要的意义。
比如采用ADI公司Blackfin533系列DSP(定点DSP),当处理壹幅大小为720×576的灰度图片时,采用改进后的DCT算法共耗时252ms。
如果采用传统的DCT变换方法,仅DCT变换耗时就达到330ms。
可见,算法的选择对系统的性能有着非常重要的作用。
2.2算法的选取
到2007年为止,基于DSP的图像压缩技术中,最常见的是变换编码和熵编码。
前者通过变换,重新组织数据,使图像能量相对集中于较少的几个系数,而其他的系数值只具有很小能量,这样通过抑制能量小的系数,即可实现数据压缩,压缩方法是有损仍是无损也由变换编码中是否丢弃壹些高频能量来决定,如小波变换和离散余弦变换等;后者则是于编码过程中不丢失信息量,即要求保存信息熵,是根据消息出现概率的分布特性而进行的,是无损压缩编码。
于超光谱图像压缩系统中,往往是要求无损或近无损,壹般采用传统的预测编码(DPCM)方法,它不经过变换,直接探索像素和像素之间的关联性和波段和波段之间的关联性。
壹般于波段之间采用预测编码,波段内采用变换编码,去掉波段和像素之间的关联性,然后再采用熵编码。
对于DSP硬件系统来说,最擅长的工作是算法简单的加法和移位运算。
如果需要保持较高的编码效率,则要尽可能采用运算简单,避免乘法、查找和判断的算法,尽量保持软硬件的流水线结构。
因此,目前能于DSP平台实现的图像编码中,采用的算法大多具有这些特点。
。
比如变换编码中的整数小波变换,乘法器占用很大的硬件资源,不利于芯片实现,但由于小波滤波器的系数是固定的,因此把乘法操作优化为移位寄存器和加法器操作,即只存于简单的移位和加法操作,速度很快,占用内存少,非常利于硬件实现。
而熵编码中的算术编码,2001年就有人提出壹种改进的Q-coder算术编码算法[2],采用重整化方法,能够用来解决硬件实现中的进位翻转问题,采用移位加来代替原算法中的乘法,能够于硬件花费较少的情况下显著提高算法的编码效率。
3系统的芯片选择
于系统设计过程中,选择DSP芯片是非常重要的壹个环节。
只有选定了DSP芯片,才能进壹步设计其外围电路及系统的其他电路。
超光谱图像压缩系统中DSP芯片的选择应考虑实际应用的需要而确定。
第壹,要确定采用哪个公司或哪个系列的芯片。
DSP的主要供应商有TI,ADI,Motorola,Lucent和Zilog等,其中TI占有最大的市场份额。
另外ADI公司也占有壹定的市场,和TI公司相比,ADI公司的DSP芯片系统时钟壹般不经分频直接使用,串行口带有硬件压扩,可从8位EPROM引导程序,可变成等待状态发生器等。
由于工作时钟较高的原因,TI公司的DSP芯片于单芯片处理能力上优于ADI公司的产品,可是于多芯片集成处理上ADI公司的DSP芯片性能更好壹些。
其他如ALTEAR公司的产品也有着部分市场。
例如,APEX20K系列的APEX20K200EFC484-2X器件,于H.264标准中,先对算术编码的结构做了改进,用查表代替了乘法操作,且采用流水线结构实现,它的算术编码器的速度能够达到0.2bit/cycle[3]。
图像压缩领域中,我国市场上最常见的是TI公司的C6000系列芯片。
尽管C5000系列芯片也可用于图像处理系统,但满足不了实时性的要求。
比如于指令周期为10ns的C5402上对壹个1M大小的二进制数据流进行算术编码,需0.4s[4],若处理壹副512*512*8的图像,最少需要800多秒,不能满足实际的应用。
另外仍有C8x系列多核DSP集成系统等,但由于价格昂贵和开发复杂也将被淘汰。
第二,确定选择定点或是浮点DSP。
系统采用的数据格式决定了它所处理信号的精度、动态范围和信噪比,且不同数据格式的易用性和开发难度也不壹样。
目前定点DSP品种最多,处理速度为20~2400MIPS;浮点DSP基本由TI公司和ADI公司垄断,处理速度为40M~1GFLOPS。
http:
//浮点DSP和定点DSP相比,有以下几个方面的区别:
首先,浮点运算DSP比定点运算DSP的动态范围要大很多。
比如,对于处理8bit/pixel的灰度图来说,用16bit定点DSP即可;如果大于16bit/pixel,则需选用浮点DSP来捕捉更大的动态范围。
其次,浮点DSP处理速度大大高于定点DSP,这壹优点于实现高精度复杂算法时尤为突出。
比如做JPEG标准这样复杂的算法,壹般采用浮点DSP。
2005年有人使用TI的C6711芯片,实现了JPEG算法,尽管处理时间为5~6秒,但若充分发挥芯片的潜能,处理速度仍能够得到大幅度改善[5]。
另外,浮点DSP的寻址空间比定点DSP大得多。
这壹方面为大型复杂算法提供了可能,另壹方面也为高级汇编语言编译器、DSP操作系统等高级工具软件的应用提供了条件。
能够见出,浮点DSP的处理速度和精度、存储器的容量、编程的灵活性和方便性要好于定点DSP;但于功耗、成本、体积上定点DSP有它显著的优势,且易于实现,稳定性好。
第三,其他因素。
除了上面的因素外,超光谱图像压缩系统选择DSP芯片仍需综合考虑片内资源、开发工具、芯片价格、封装形式、质量标准、供货情况、生命周期等。
尤其是对于芯片的体积,封装形式和生命周期等方面的要求,比壹般的图像处理系统要高。
目前采用最多的,也是压缩性能较好的是整数小波变换和算术编码。
其改进的算法有着不错的效果,且能用定点DSP实现,如TMS320C62x和C64x,尤其是对于整数小波变换,几乎所有的C6000系列均能够实现;可是对于比较复杂和需要查表壹类的算法,采用浮点的比较多,如JPEG和JPEG2000标准算法,Huffman编码等等,则需要选用如C67x浮点DSP。
例如,对壹幅大小512×512,24位真彩图作为标准测试图像,可选择TMS320C6711DSP(浮点DSP),若使用JPEG2000标准进行压缩,则优化后的压缩时间约为4.8s,解码时间约为2.2s,压缩率为20倍,同时主观视觉效果良好[6]。
4系统性能优化
系统的性能优化包括软件优化和硬件优化。
于图像处理算法中,存于大量的循环操作,因此充分地利用软件流水线技术,能极大地提高程序的运行速度,仍能够节约硬件成本,使系统变得简单,提高系统的稳定性。
例如,于模板匹配算法中,对于模板大小为32×16,匹配范围为112×56,采用最小绝对差和判定法(SAD)进行逐点匹配,假设采用TMS320C6203芯片,所有的运算和操作均串行执行,且耗时均只1个CPU时钟周期,则总共需要512×5×3200=8192000个CPU时钟周期,耗时32ms。
而进行软件优化后,处理速度提高了约21.8,效果是十分明显的[7]。
另外于2006年有人研究了去关联、内联函数、短整型数据用整型处理和软件流水技术,解决了软件效率问题,采用基于DSP核及其数据链路特征的优化方法,能够使软件效率提高5~15倍。
且把这些优化技术应用于基于DSP6416平台的实时图像压缩系统中,于输入数据率82Mbyte/s~110Mbyte/s、输出码流29Mbyte/s的条件下,使该系统达到了实时处理的能力,该算法已于国家某重点项目中成功运用。
硬件优化方面,需要考虑存储空间,充分利用快速存储器,尽量节省程序和数据的存储空间。
壹般把核心的代码和常用函数放于速度较快的内部RAM中,能够提高系统的速度;若数据放于速度较慢的片外存储空间,读取数据时便会造成DSP流水线的停顿。
因此,能够利用DMA模块将待处理数据搬移到片内存储空间,能够大大提高处理性能。
如2006年提出的壹种采用乒乓缓存策略的二维整型提升小波的且行体系结构,用移位操作代替乘法操作,大大减少了算法的运算量。
整个结构采用流水线设计,提高了硬件资源的利用率和降低了算法的中间存储量,和原算法相比,速度提高了15倍,达到了每秒85帧;重构图像的峰值信噪比也达到了42dB之上[8]。
总之,系统优化的时候,要针对具体芯片的特点,把软件算法和硬件结构融合,才能大大提高系统的效率。
以C64x为例,由于C64x具有双16位扩充功能,能于壹个周期内完成双16位乘法、加减法、比较、移位等操作,因此能够将短整型数据用整型处理或更长的数据类型进行处理,这样壹次能够把俩个16位的数据读入壹个32位寄存器,然后用内联函数进行处理,充分利用C64x的双16位扩充功能,效率能够提高60多倍[9]。
5总结和展望
目前,图像压缩技术发展越来越快。
壹方面,压缩算法不断的完善;另壹方面,DSP性能的不断提高,使得基于DSP的图像压缩技术成为业内关注的焦点。
本文结合当前DSP芯片于图像压缩领域中的应用现状,给出了超光谱图像压缩系统设计过程中,算法的设计和芯片的选择方法,提出了解决软件算法和硬件结构之间的矛盾的思路,且讨论了系统的优化。
能够预料,今后DSP将朝着系统高度集成、高速高性能、可灵活编程、和网络结合的方向发展,同时,开发人员也更专注开发专用DSP,将它应用于如遥感超光谱图像压缩、医学图像处理等领域,于实际应用中发挥它的巨大优势。
参考文献
[1]蒋青松,王建宇.多光谱图像的信息分析及数据压缩[J].红外技术,2004,Vol.26(No.1):
44-47
[2]彭云,任俊彦,叶凡,周翔.壹种适于硬件实现的算术编码算法[J].通信学报,2001,Vol.22(No.2):
49-53
[3]陈光化,陆桂富,武凯.基于上下文的自适应二进制算术编码的硬件实现[J].微电子学和计算机,2006,Vol.23(No.11):
16-25
[4]罗钧,张国彬.JPEG2000中的二进制算术编码及其DSP实现[J].重庆大学学报,2003:
Vol.26(No.4):
34-37
[5]苏艳玲,孙德辉.基于DSP的图像编码和实现[D].北方工业大学,2005:
69-71
[6]李忠锋,曹丹华,吴裕斌.基于TMS320C6711DSP的JPEG2000图像压缩[J].计算机工程,2005,Vol.31(No.20):
188-190
[7]何迪.实时图像跟踪系统中TMS320C6X的软件优化[J].电子科技,2005,No.4:
28-33
[8]陈升来,黄廉卿,郭静寰.基于整型提升小波变换的图像处理及DSP实现[J].光学精密工程2006,Vol.14(No.3):
498-502
[9]孟占红,赵宝军.基于DSP的实时图像压缩软件优化技术研究[J].Vol.34(No.9):
1558-1561
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字信号 处理 芯片 发展 应用 方案