图像有损压缩技术的研究.docx
- 文档编号:8007594
- 上传时间:2023-01-27
- 格式:DOCX
- 页数:31
- 大小:196.42KB
图像有损压缩技术的研究.docx
《图像有损压缩技术的研究.docx》由会员分享,可在线阅读,更多相关《图像有损压缩技术的研究.docx(31页珍藏版)》请在冰豆网上搜索。
图像有损压缩技术的研究
编号:
审定成绩:
XX大学XX学院
毕业设计(论文)
设计(论文)题目:
图像有损压缩技术的研究
单位(系别):
学生姓名:
专业:
班级:
学号:
指导教师:
答辩组负责人:
填表时间:
2013年06月
摘要
有损压缩技术是利用了人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全回复原始数据,但是所损失的部分对理解原始图像的影响缩小,却换来了大得多的压缩比。
常见的声音、图像、视频压缩基本都是有损的。
在多媒体应用中,常见的压缩方法有:
预测编码,变换编码,矢量量化编码,分形编码等,混合编码是近年来广泛采用的方法。
有损数据压缩方法是经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法。
有损数据压缩又称破坏型压缩,即将次要的信息数据压缩掉,牺牲一些质量来减少数据量,使压缩比提高。
它是与无损数据压缩对应的压缩方法。
根据各种格式设计的不同,有损数据压缩都会产生丢失:
压缩与解压文件都会带来渐进的质量下降。
本文首先论述了数字图像压缩技术的概况及发展趋势,详细介绍了现代图像压缩技术的标准、分类及主要算法。
其次着重就图像的有损压缩技术进行了研究和讨论。
通过查阅大量文献,系统的分析了有损压缩技术,介绍了主要有损压缩的方法:
预测编码、变换编码、基于模型编码等有损压缩的主要技术,最后通过结合无损压缩从精确度及压缩比率等方面与损压缩进行详细比较,更深层次的对损压缩技术进行了解。
并得出图像有损压缩技术的特点和优势,以及在未来压缩领域中的应用方向。
【关键词】有损压缩无损压缩压缩编码技术比较变换编码
ABSTRACT
Lossycompressionistousethehumanisnotsensitivetoimageorsoundwavesofcertainfrequencycomponentsofthefeaturesthatallowcompressionlossintheprocessofcertaininformation;Althoughnotfullyrecovertherawdata,butthelossofpartofunderstandingtheinfluenceoftheoriginalimageisnarrow,butthemuchlargercompressionratio.Commonvoice,imageandvideocompressionarehurt.Inmultimediaapplications,thecommoncompressionmethodare:
predictivecoding,transformcoding,vectorquantizationcodingandfractalcoding,etc.,hybridcodingisawidelyusedmethodinrecentyears.
Lossydatacompressionmethodiscompressedanddecompresseddatawithdifferentbutveryclosetotheoriginaldatacompressionmethod.Lossydatacompressionisalsocalleddestructivenesscompression,datacompressionisofsecondaryimportance,sacrificesomequalitytoreducetheamountofdata,toimprovethecompressionratio.Itiscorrespondingcompressionandlosedatacompressionmethod.Accordingtodifferentvariousformatdesign,thelostcanproducelossydatacompression:
compressanddecompressfilesbringswithitagradualdeclineinthequality.
Thispaperfirstdiscussesthegeneralsituationanddevelopmenttrendofdigitalimagecompressiontechnology,introducedthemodernstandards,classificationandmainalgorithmofimagecompressiontechnology.Secondlyemphasizeimagelossycompressiontechniquesarestudiedanddiscussed.Throughconsultingalargenumberofliterature,systematicanalysisoflossycompressiontechnology,introducesthemainlossycompressionmethods:
predictivecoding,transformcoding,basedonthelossycompressionofmaintechnologysuchasmodelcode,finallythroughacombinationoflosscompressionfromprecisionandcompressionratiocomparedwithlossofcompressionindetail,atadeeperleveltounderstandlosscompressiontechnology.Andconcludethecharacteristicsofimagelossycompressiontechniqueandadvantages,aswellascompressionapplicationsinthefieldofdirectioninthefuture.
【Keywords】LossycompressionLosslesscompressionCodingandcompressingtechnologyComparetransformcoding
前言
在我们的生活中无论是普通人还是一些工作在科研领域的科技工作者,都会对数据信息进行传输与存储有所接触。
随着数字时代的到来,影像的制作、处理和存储都脱离了传统的介质,相比传统方式,数字图像有着传统方式无法比拟的优越性。
而对大量图像数据进行传输要保证其传输的质量、速度等,对其进行存储也要考虑其大小容量等。
所以,要解决大量图像数据的传输与存储,在当前传输媒介中,存在传输带宽的限制,故在一些限制条件下传输尽可能多的活动图像,如何能对图像数据进行最大限度的压缩,并且保证压缩后的重建图像能够被用户所接受等问题,就成为研究图像压缩技术的问题之源。
图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。
利用图像压缩可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。
图像数据之所以可以进行压缩,主要是因为一般原始图像数据是高度相关的,都含有大量的冗余信息。
图像压缩编码的目的就是消除各种冗余,并在给定的畸变下用尽量少的比特数来表征和重建图像,使它符合预定应用场合的要求。
虽然人们总是期望无损压缩,但冗余度很少的信息对象,用无损压缩技术并不能得到可接受的结果。
当使用的压缩方法会造成一些信息损失时,关键的问题是看这种损失的影响。
有损压缩经常用于压缩音频、灰度或彩色图像和视频对象等,因为它们并不要求精确的数据。
在由音频、彩色图像、视频以及其他专门数据组成的多媒体对象中,可以单独使用有损压缩技术,也可与无损压缩技术共同使用。
有损压缩编码不具有可恢复性和可逆性,该编码在压缩时舍弃冗余的数据。
所以有损压缩技术也走进了人们的视野。
第一章图像压缩技术的研究及进展
第一节图像压缩技术概述
图像压缩就是减少表示数字图像时需要的数据量。
是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码[1]。
在我们的生活中无论是普通人还是一些工作在科研领域的科技工作者,都会对数据信息进行传输与存储有所接触。
随着数字时代的到来,影像的制作、处理和存储都脱离了传统的介质(纸、胶片等),相比传统方式,数字图像有着传统方式无法比拟的优越性。
但是每种技术出现的同时,都有制约其发展的一面。
比如数字电视、遥感照片、由雷达、飞机等提供的军事侦察图像、可视电话、会议电视和传真照片,在教育、商业、管理等领域的图文资料、CT机、X射线机等设备的医用图像、天气云图等等,无论是利用哪种传输媒介进行传输的信息,都会遇到需要对大量图像数据进行传输与存储的问题。
而对大量图像数据进行传输要保证其传输的质量、速度等,对其进行存储也要考虑其大小容量等。
所以,要解决大量图像数据的传输与存储,在当前传输媒介中,存在传输带宽的限制,故在一些限制条件下传输尽可能多的活动图像,如何能对图像数据进行最大限度的压缩,并且保证压缩后的重建图像能够被用户所接受等问题,就成为研究图像压缩技术的问题之源。
图像数据之所以可以进行压缩,主要是因为一般原始图像数据是高度相关的,都含有大量的冗余信息。
图像压缩编码的目的就是消除各种冗余[2],并在给定的畸变下用尽量少的比特数来表征和重建图像,使它符合预定应用场合的要求。
第二节图像压缩技术标准
一、静止图像压缩标准
①JPEG标准:
JPEG全名为JointPhotographicExpertsGroup,是一个在国际标准组织(ISO)下从事静止图像压缩标准制定的委员会。
JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT(AdaptiveDiscreteCosineTransform)方式为基础的算法作标准,于1991年3月提出10918号标准“连续色调静止图像的数字压缩编码”,即JPEG标准。
它在较低的计算复杂度下,能提供较高的压缩比与保真度[3]。
JPEG采用4种编解码方式:
串行DCT[4](DiscreteCosineTransform)方式、渐进浮现式DCT方式、无失真方式和分层方式。
由于JPEG优良的品质,使它在短短几年内就获得极大的成功。
随着多媒体应用领域激增,传统的JPEG压缩技术已无法满足人们对多媒体影像资料的要求。
因此,更高压缩率以及更多功能的新一代静止影像压缩技术JPEG2000就诞生了。
②JPEG2000:
JPEG2000[5],正式名称为“ISO15444”,亦是由JPEG组织负责制定。
自1997年3月开始筹划,2000年规定基本编码系统的最终协议草案才提出。
JPEG2000与JPEG最大的不同,在于它放弃了JPEG所采用的以DCT为主的区块编码方式,而改用以DWT(DiscreteWaveletTransform)为主的多分辨率编码方式。
JPEG2000的新特征有:
JPEG2000作为JPEG的升级版,具有良好的低比特率性能,特别是对细节丰富的图像以0.25bpp的比特率进行压缩时,总体上其压缩率比JPEG高约30%左右;
JPEG2000同时支持有损和无损压缩;而JPEG只支持有损压缩;
JPEG2000能实现渐进传送。
它先传输图像的轮廓,然后逐步传输图像数据的细节,接收端重构图像时让图像由朦胧到清晰显示,而不像JPEG那样由上到下由左到右的显示;
JPEG2000支持所谓的“感兴趣区域”编码(Regionofinterestcoding)。
可任意指定图像上感兴趣区域的压缩质量,亦可以选择指定的部分先解压缩以突出重点。
二、运动图像压缩标准
(一)MPEG系列
MPEG(MovingPictureExpertsGroup)运动图像专家组成立于1988年,专门从事运动图像和伴音编码的标准制定。
MPEG最初的三个任务是制定1.5Mb/s,10Mb/s,40Mb/s的压缩编码标准,即MPEG-1、MPEG-2、MPEG-3,后因MPEG-2的功能使MPEG-3多余,故MPEG-3被撤消。
MPEG-4于1994年开始制定,其目的是实现甚低码率的音/视频压缩编码。
MPEG-1是1991年11月提出草案,1992年11月通过,1993年8月公布的。
它适用于1.5Mb/s速率的数字存储媒体的运动图像及伴音的压缩编码。
MPEG-1追求高的压缩比,去除图像序列的时间冗余度,同时满足多媒体等随机存取的要求。
它的图像类型有三种:
I图像,采用内部编码,不参照其他图像,亦称内部编码图像[6];P图像,采用预测编码,参照前一幅I或P图像作运动补偿编码,亦称预测编码;B图像,采用双向预测编码,参照前一幅和后一幅I或P图像作双向运动补偿编码,亦称双向预测图像。
MPEG-2制定于1994年,其设计目标是高级工业标准的图像质量以及更高的传输率。
它进一步提高了压缩比,改善了音频、视频质量,采用的核心技术是分块DCT和帧间运动补偿预测技术。
MPEG-2所能提供的传输率在3~10Mb/s间,在NTSC制下的分辨率可达720×486;可提供广播级的视像和CD级的音质;向下兼容MPEG-1,使得大多数MPEG-2解码器可播放MPEG-1格式的数据,如VCD;MPEG-2除了作为DVD的指定标准外,还可以用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频;MPEG-2可提供一个较广范围的压缩比,以适应不同画面质量、存储容量以及带宽的要求。
MPEG-4是对数字音/视频数据进行压缩、通信、存取和操作管理等的新标准,并为各种通信环境提供一种通用的技术解决方案。
MPEG专家组深入分析了信息领域中计算机、通信以及以电视为代表的消费电器即3C交叉融合的方式后,认为MPEG-4应提供用于通信的新方式,其中心是基于内容的AV信息存储、处理与操作,支持交互性、高压缩比以及通用存储性等功能。
在其结构上应具有适应性与可扩张性,以适应软、硬件技术的不断发展,及时融合新的技术。
由于MPEG-4的中心是基于内容与交互性的,它就不再对低码率范围做出特别要求。
MPEG-4在通信信息描述中,首次提出了对象的概念,如视频对象VO(VideoObject)、音频对象AO(AudioObject)等,这是一个新的飞跃。
在编码方案上,MPEG-4仍是以块为基础的混合编码。
MPEG-4标准主要应用于视频电话、视频电子邮件和电子新闻等,其传输速率要求较低,在4.8~64kb/s之间,分辨率为176
144。
MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少数据获得最佳图像质量。
MPEG-4更适用于交互AV服务以及远程监控。
MPEG-7由MPEG委员会于1998年10月提出提议,2001年9月正式成为国际标准,又称为“多媒体内容描述接口(MultimediaContentDescriptionInterface)”,其目标是建立对多媒体信息内容的标准化描述,试图规范不同种类多媒体信息的描述而不受表达形式的限制。
这些描述要与信息内容直接相关以便用来快速有效的查询、访问各种多媒体信息。
MPEG-7的应用范围广泛,既可以应用于存储,也可用于流式应用(如广播、将模型加入Internet等)。
它可以在实时或非实时环境下应用,如数字图书馆、多媒体编辑等。
另外,MPEG-7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。
MPEG-21是基于“多媒体框架(MultimediaFramework)标准”的,其最终目的是建立一个多媒体框架,以通过预购网络和设备使多媒体资源在用户之间透明方便的使用。
MPEG-21的基本框架要素包括数字项目说明、内容表示、数字项目的识别和描述、内容管理和使用、知识产权管理和保护、终端和网络、事件报告等。
它支持的功能有:
通过网络存储,使用并交互操作多媒体对象;实现多种业务模型,包括对版权和交易的自动管理;对内容进行隐私的尊重等。
目前,这一标准仍处于开发当中。
(二)H.26X系列
1984年国际电报电话咨询委员会的第23研究组建立了一个专家组专门研究电视电话的编码问题。
经过研究与努力,1988年形成草案,1990年12月通过ITU-T的H.261[7]建议。
H.261是ITU-T针对可视电话和会议、窄带ISDN等要求实时编码和低延时应用提出的一个编码标准。
它允许“采用p
64kbit的图像业务的图像编解码”,因而H.261简称p
64。
其中p是一个整数,取值范围为1~30,对应比特率为64kb/s~1.92Mb/s。
它建议采用中间格式CIF(CommonIntermediateFormat)和QCIF(QuarterCIF)解决不同制式通信的矛盾;解决了编码算法问题。
H.261采用了运动补偿预测和离散余弦变换相结合的混合编码方案,获得很好的图像压缩效果。
1995年,在H.261的基础上,ITU-T总结当时国际上视频图像压缩编码的最新进展,针对低比特率视频应用制定了H.263标准。
它提高了运动补偿的精度,常用于超低速率的图像传输,被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结果。
之后,ITU-T又对其进行了补充,以提高编码效率,增强编码功能。
补充修订的版本有1998年的H.263+,2000年的H.263++。
H.263采用第一代编码技术,在低速率视频传输质量,抗误码能力方面有明显提高,在视频业务传输中得到广泛应用。
与H.261只能工作在CIF、QCIF两种格式不同,H.263的信源编码器可以工作于5种图像格式:
QCIF、Sub-QCIF、CIF、4CIF、16CIF。
另外,H.263还在H.261基本编码算法的基础上提供了四种可选编码模式:
非限制运动矢量模式、基于语法的算术编码模式、高级预测模式以及PB帧模式。
由于仅限于五种固定图像大小、形状和时钟频率,它应用的灵活性较低。
H.263+[8]即ITU-T在1998年通过的H.263第二版,增加了12个新的高级模式,修正了第一版中的非限制运动矢量模式。
修订版首先在视频格式多样性上做了改进,还提出一些新技术:
如附加增强信息模式和增强参考帧再采样模式,进一步扩大适用范围,支持图像冻结和快照,以及多分辨率视频的应用,同时还增加了一些新技术来增强抗误码的能力:
如分片结构模式、增强参考帧选择模式等,使视频信号经过压缩编码后能够在具有较大噪声干扰的窄带信道PSTN(IntegrateServicesDigitalNetwork)和无限移动信道等上传输。
通过使用去方块效应滤波器,降低分辨率更新模式和修正量化模式等新技术,重建图像的主观质量显著提高。
由于H.263+的高级模式有些不能同时使用,有些需结合使用,如何选择合适的编码模式结合,对使用者来说很困难,因此ITU-T于2000年11月提出了H.263++,称为H.263的第三版。
它在H.263+的基础上增加了三个高级模式。
H.26L[9]标准是ITU-T和ISO/IEC联合制定的最新的图像压缩编码标准,它最先由ITU-T的VCEG于1997年提出的,它的目标是提出一种更高性能的视频质量有实质性提高的视频编码标准。
该标准于2003年3月完成,在ITU-T中被称为RecommendationH.264而在ISO/IEC中成为MPEG-4标准的第10部分(ISO/IEC14496-10AVC,简称MPEG-4-10)。
H.26L的一个基本概念是引入了两个不同的层次:
视频编码层(VCL:
VideoCodingLayer)以及网络适配层(NAL:
NetworkAdapterLayer),前者负责对视频进行高效的压缩,后者则负责根据网络的传输需要进行编码数据的打包。
H.26L相对于其他标准有以下的特点:
低码率、高质量、可达到比H.263+提高一倍以上的编码效率;广阔的应用范围,既可用于严格时延限制的实时通信,可用于对时延要求不高的其他应用;稳健性,在网络中传输时,有较强的抗误码性能;对各种网络的友好性,提供了友好的网络接口。
第三节图像压缩技术分类
图像压缩的优点在于,如抗干扰、处理精度高、灵活性好等,其中主要缺点是数据量太大,传输中占频带太宽。
数字图像数据量的压缩按应用不同可分为以下三类:
①信息保持型数据压缩(无损压缩):
它要求压缩图像的比特数而不丢失任何信息。
主要用在图像信息保存中,要求图像存储能保持信息并能快速存取图像。
例如短时随机存取主要用于处理过程中的各个环节的存储,它要求经过不同存储介质多次重复不变质、不失真。
又如遥感图像,摄取地球上许多地区,因来不及处理,可暂时保存以便以后处理。
②保真度型数据压缩:
传送的图像应该能够适应通信的通道限制,若接收端是人观看的情况,由于人眼的生理特性不需要过高的空间分辨率和灰度分辨率,因此在压缩过程中允许丢失一些人感觉不到的信息,这就是一种允许微量失真的图像压缩。
数字电视、图像传输和多媒体中常用这种压缩。
③特征保持型数据压缩(有损压缩):
许多图像处理的目的是为了计算机的识别、分析、控制,这时并不需要图像的全部细节及灰度细节。
只要能保存图像中的感兴趣的特征信息,无用信息都可丢掉。
例如识别军舰类型、巡航导弹地形识别等只要轮廓信息就可以了。
又如在机场跑道的识别中农田、房屋信息皆可丢掉,只保留跑道的图像信息即可。
这些图像信号可以进行特征保持型数据压缩。
图像编码也可以根据编码所在数据域划分为空间域编码和变换域编码。
第四节图像压缩技术的发展趋势
从国际数据压缩技术的发展尤其是MPEG的发展可以看出,基于内容的图像压缩编码方法是未来编码的发展趋势。
它不仅能满足进一步获得更大的图像数据压缩比的要求,而且能够实现人机对话的功能。
另外,任意形状物体的模型建立的关键问题还没有解决,这严重影响其应用的广泛性。
通过元数据进行编码也是今后编码的发展方向。
元数据是指详细的描述音/视频信息的基本元素,利用元数据来描述音视频对象的同时也就完成了编码,因为此时编码的对象是图像的一种描述而不再是图像本身。
从另一个角度来说,进一步提高压缩比,提高码流的附属功能(码流内容的可访问性、抗误码能力、可伸缩性等)也将是未来的编码的两个发展方向。
第五节本章小结
图像压缩技术已经为开拓全新的应用领域打下了坚实的基础。
图像压缩技术的基本应用在更深更广层次上的应用就成为我们研究的热点。
本章重点对现代图像压缩技术进行概括性介绍。
图像压缩就是减少表示数字图像时需要的数据量。
是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。
其次介绍了静态与动态图像的压缩标准。
最后分别介绍了图像压缩技术的分类。
第二章图像有损压缩技术
随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 有损 压缩 技术 研究