多媒体期末论文.docx
- 文档编号:10555788
- 上传时间:2023-02-21
- 格式:DOCX
- 页数:14
- 大小:193.31KB
多媒体期末论文.docx
《多媒体期末论文.docx》由会员分享,可在线阅读,更多相关《多媒体期末论文.docx(14页珍藏版)》请在冰豆网上搜索。
多媒体期末论文
JPEG2000压缩率控制算法
计算机09912009957007乔飞
摘要:
JPEG2000是一种新型的图像编码标准,它具有优于JPEG标准的率-失真性能.但JPEG2000标准的压缩后率失真(PCRD)优化算法效率较低,尤其在低比特率时JPEG2000编码的熵编码部分(EBCOTTier-1)将有很大一部分计算浪费,因为许多经过编码的比特流在经过JPEG2000压缩码率控制算法后被截断丢弃.提出一种有效的压缩码率控制算法,它利用率-失真斜率的两个属性得到优化的截断点,不需要所有的编码过程,并给出了整个处理过程.与JPEG2000原有的PCRD算法相比,所提出算法可以快速搜索到优化截断点并可减少存储空间尺寸,还可获得与PCRD算法几乎相同的图像质量。
关键词:
压缩后率失真(PCRD)优化;带优化截断的嵌入式块编码(EBCOT);JPEG2000
AnEfficientRateControlSchemeforJPEG2000
Abstract:
JPEG2000isanewimagecodingstandardwhichcanprovidebetterrate-distortionperformancethantheJPEGstandard.Butthepost-compressionrate-distortion(PCRD)optimizationschemeinJPEG2000isinefficient.Mostofthecomputationintheentropycoder(EBCOTTier-1)ofJPEG2000isawasteespeciallyatlowerbit-rate.Thatisbecausemanycodedbit-streamwillbetruncatedaftertheratecontrolmethodofJPEG2000.AnefficientschemeforJPEG2000ratecontrolisproposed.Thisschemeutilizesthetwopropertiesoftherate-distortionslopetoachievetheoptimizedtruncationpointsandalsothewholeprocessingstepsoftheratecontrolschemeisgiven.ComparedwiththestandardPCRDalgorithm,theproposedalgorithmcanquicklysearchingfortheoptimumtruncationpointsandnotrequireencodingallthecodingpasses.Usingthisscheme,thecomputationcomplexityandthememorysizewillbegreatlyreduced.Moreover,theproposedschemecanachievethesameimagequalityasthePCRDalgorithmusedbyJPEG2000now.
Keywords:
Post-CompressionRate-Distortion(PCRD)optimization;EmbeddedBlockCodingwithOptimizedTruncation(EBCOT);JPEG2000
随着多媒体技术的不断运用,图像压缩要求更高的性能和新的特征。
为了满足静止图像在特殊领域编码的需求,JPEG2000作为一个新的标准处于不断的发展中。
它不仅希望提供优于现行标准的失真率和个人图像压缩性能,而且还可以提供一些现行标准不能有效地实现甚至在很多情况下完全无法实现的功能和特性。
这种新的标准更加注重图像的可伸缩表述。
所以就可以在任意给定的分辨率级别上来提供一个低质量的图像恢复,或者在要求的分辨率和信噪比的情况下提取图像的部分区域。
JPEG2000作为一种新型图象编码系统,跟它的前身JPEG相比,JPEG2000的压缩优越性跟它的先进的编码技术是密切相关的。
大体说来分为六个方面:
1.JPEG2000可以方便地实现渐进式传输,这是JPEG2000的重要特征之一。
看到这种特性,我们就会联想到GIF格式的图像可以做到在WEB上实现"渐现"效果。
也就是说,它先传输图像的大体轮廓,然后逐步传输其他数据,不断地提高图像质量。
这样图象就由朦胧到清晰显示出来,从而节约、充分利用有限的带宽。
而传统的JPEG无法做到这一点,只能是从上到下逐行显示。
2.JPEG2000既支持有损压缩,也支持无损压缩方式。
而JPEG只能做到有损压缩,压缩后数据不能还原。
因此JPEG2000在保存不可以丢失原始信息,而又强调较小的图象文档尺寸的情况下能扮演很重要的角色。
3.JPEG2000另外一个非常有趣而又实用的特征,就是它支持对你希望的特定区域进行特别的压缩处理。
你可以指定图像上任意区域的压缩质量,还可以指定哪个部份先进行解压处理。
这在大大降低图象尺寸方面起到很大作用。
4.实际上,JPEG2000作为JPEG家族的继承者,就不能不追求很高的压缩比。
在具有和传统JPEG类似质量的前提下,JPEG2000的压缩率比JPEG高20%-40%左右。
也就是说,假如有一天我们的JPEG图片全部换成JPEG2000编码方式,在同样的网络带宽下,我们的对于图片下载的等待时间将大大缩短。
5.JPEG2000在颜色处理上,具有更优秀的内涵。
与JPEG相比,JPEG2000同样可以用来处理多达256个通道的信息。
而JPEG仅局限于RGB数据。
也就是说,JPEG2000可以用单一的文件格式来描述另外一种色彩模式,比如CMYK模式。
6.JPEG2000能使基于WEB方式多用途图象简单化。
由于JPEG2000图象文件在它从服务器下载到用户的WEB页面时,能平滑地提供一定数量的分辨率基准,WEB设计师们处理图象的任务就简单了。
例如我们经常会看到一些提供图片欣赏的站点,在一个页面上用缩略图来代理较大的图象。
浏览者只需点击该图象,就可以看到较大分辨率的图象。
不过这样WEB设计师们的任务就在无形中加重了。
因为缩略图与它链接的图象并不是同一个图象,需要另外制作与存储。
而JPEG2000只需要一个图象就可以了。
用户可以自由地放缩、平移、剪切该图象而能得到他们所需要的分辨率与细节。
本文先介绍下JPEG,然后通过比较JPEG2000,给出一种有效的JPEG2000压缩率控制算法,它利用率-失真斜率的两个属性,快速搜索截断点,并且不需要所有的编码过程,这大大减少Tier-1部分的计算,但能达到与PCRD算法几乎相同的峰值信噪比(PSNR).
1JPEG
JPEG与JPEG格式是目前网络上最流行的图像格式,是可以把文件压缩到最小的格式,在Photoshop软件中以JPEG格式储存时,提供11级压缩级别,以0—10级表示。
其中0级压缩比最高,图像品质最差。
即使采用细节几乎无损的10级质量保存时,压缩比也可达5:
1。
以BMP格式保存时得到4.28MB图像文件,在采用JPG格式保存时,其文件仅为178KB,压缩比达到24:
1。
经过多次比较,采用第8级压缩为存储空间与图像质量兼得的最佳比例。
JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。
目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。
JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩。
JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。
此外,JPEG2000还支持所谓的"感兴趣区域"特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。
在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采用低压缩比,而感兴趣区域之外采用高压缩比,在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是基于感兴趣区域的编码方案所采取的压缩策略。
其优点在于它结合了接收方对压缩的主观需求,实现了交互式压缩。
而接收方随着观察,常常会有新的要求,可能对新的区域感兴趣,也可能希望某一区域更清晰些。
JPEG2000和JPEG相比优势明显,从无损压缩到有损压缩可以兼容,而JPEG不行,JPEG的有损压缩和无损压缩是完全不同的两种方法。
JPEG2000即可应用于传统的JPEG市场,
如扫描仪、数码相机等,又可应用于新兴领域,如网路传输、无线通讯等等。
JPEG(JointPhotographicExpertsGroup)是在国际标准化组织(ISO)领导之下制定静态图像压缩标准的委员会,第一套国际静态图像压缩标准ISO10918-1(JPEG)就是该委员会制定的。
由于JPEG优良的品质,使他在短短几年内获得了极大的成功,被广泛应用于互联网和数码相机领域,网站上80%的图像都采用了JPEG压缩标准。
然而,目前的JPEG静止图像压缩标准,具有中端和高端比特速率上的良好的速率畸变特性,但在低比特率范围内,将会出现很明显的方块效应,其质量变得不可接受。
JPEG不能在单一码流中提供有损和无损压缩,并且不能支持大于64×64K的图像压缩。
同时,尽管当前的JPEG标准具有重新启动间隔的规定,但当碰到比特差错时图像质量将受到严重的损坏。
JPEG格式是目前网络上最流行的图像格式,是可以把文件压缩到最小的格式,在Photoshop软件中以JPEG格式储存时,提供11级压缩级别,以0—10级表示。
其中0级压缩比最高,图像品质最差。
即使采用细节几乎无损的10级质量保存时,压缩比也可达5:
1。
以BMP格式保存时得到4.28MB图像文件,在采用JPG格式保存时,其文件仅为178KB,压缩比达到24:
1。
经过多次比较,采用第8级压缩为存储空间与图像质量兼得的最佳比例。
JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。
目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。
JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩。
JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。
此外,JPEG2000还支持所谓的"感兴趣区域"特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。
在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采用低压缩比,而感兴趣区域之外采用高压缩比,在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是基于感兴趣区域的编码方案所采取的压缩策略。
其优点在于它结合了接收方对压缩的主观需求,实现了交互式压缩。
而接收方随着观察,常常会有新的要求,可能对新的区域感兴趣,也可能希望某一区域更清晰些。
针对这些问题,自1997年3月起,JPEG图像压缩标准委员会开始着手制定新一代的图像压缩标准以解决上述问题。
2000年3月的东京会议,确定了彩色静态图像的新一代编码方式JPEG2000图像压缩标准的编码算法。
下面就介绍一种详细的JPEG2000压缩率控制算法。
2 2000压缩率控制算法
2.1 JPEG2000编码算法
一个经典的JPEG2000编码运算法则包含三个部分:
小波变换、画布坐标系统、EBCOT编码。
原始图像数据首先进行画布坐标标定,然后在画布坐标的基础上进行划分:
第一步先划分为不同的分量(component),第二步将画布区域划分为大小相同的矩形(tile),这两个步骤可以互换。
在画布坐标系统预处理之后,就是进入JPEG2000的核心阶段之一:
离散小波分析(DWT)。
小波分析被直接运用于各个片,这样每个片区域都被DWT分析,形成不同的分辨率级别,每个分辨率级别中含有四个子带,这样就为JPEG2000的分辨率递进的功能提供了可能。
在这之后,就进入了JPEG2000的第二个核心阶段:
嵌入式优化截断编码(EBCOT)。
首先将各个子带进行EBCOT的预处理过程:
量化。
量化对图像有损压缩负责,而此过程可有可无,用户可以自由选择,因而JPEG2000对有损和无损压缩兼容。
预处理过后,进入EBCOT的核心编码阶段,该阶段分为两次,一次编码主要是码块划分和熵编码,二次编码主要是分层打包的过程。
最后,码流将会以封包流(pack-stream)的形式传输,包的主头描述了原始图像和不同的分解及编码类型以便查找、提取、解码和重构指定分辨率级、保真度、感兴趣区域和其他特点的图像部分。
JPEG2000编码系统[6]主要由3个主要部分组成:
离散小波变换(DWT)、量化和EBCOT.一般的图像压缩标准中量化用来执行码率控制,而JPEG2000却主要是用来调整不同子带间的权重.每一子带中经过量化的DWT系数被分成许多不重叠的编码块,每一编码块则通过EBCOT进行编码.EBCOT包含了Tier-1和Tier-2两个部分,Tier-1通过基于上下文自适应算术编码算法将每一个编码块压缩成相应的子比特流.在得到所有经过Tier-1的压缩子比特流后,Tier-2负责根据给定的比特率进行压缩率控制优化,然后形成
JPEG2000压缩数据.
EBCOT的Tier-1算法对每个编码块独立编码,每一个编码块则从最高有效位平面(MSB)到最低有效位平面(LSB)逐个位平面进行编码,而一般压缩算法是逐个像素进行处理.一个位平面中的每一个比特数据采用3个编码过程之一进行编码,这3个编码过程分别是:
显著性过程、量值优化过程和清除过程.经过编码过程的数据采用基于上下文的算术编码器(MQ)进行编码形成每一个编码块的比特流.每一个编码块的比特流可以通过率控制进行截断以满足目标比特率要求.一个编码块中的每一个编码过程都有可能是一个截断点.对于给定的目标比特率,可以为每一个编码块选择一个截断点,而舍弃截断点之后的所有编码过程,以达到目标比特率要求.对于如何选择每一个编码块的截断点,JPEG2000没有对压缩率控制方法进行限制,但给出了一种率控制优化算法———PCRD.
2.2 PCRD率控制优化算法
图像经过量化后分成许多不重叠的编码块{Bi}i=1,2,…,对于每一个编码块,经过Tier-1所有位平面从MSB到LSB进行编码形成子比特流.该比特流中存在一组可能的截断点,每一个截断点在一个编码过程的结束处.用ni表示第i个编码块Bi可能的截断点,ni=k对应于从MSB开始第k个截断点.对于编码块Bi,比特流可以在任何可能的截断点ni被截断,而产生相应的比特率Rnii.利用截断后的比特流进行图像重建后产生的失真表示为Dnii(即均方误差,MSE).率控制优化过程选择所有编码块中的截断点以最小化重建图像的失真D:
而对比特率的限制为:
其中:
表示目标比特率.这一问题等同于利用Lagrange乘数方法[7]最小化式(3):
因此,要找到一个λ值使得选取的截断点集合{ni(λ)}i=1,2,…最小化式(3),同时使得R=Rtarget.λ和截断点集合的优化基于这样的原理,即:
不可能在不提高比特率的条件下减小失真.
PCRD是一种简单的用于寻找优化截断点的算法.在任何可能的截断点ni,PCRD计算率-失真(R-D)斜率
ΔDnii和ΔRnii分别表示第ni和第(ni-1)个截断点之间MSE值的减少值和比特率的增加值.用Ni表示编码块Bi所有可能截断点的集合,对于任意λ值,PCRD通过式(5)得到截断点ti(λ):
随着ni增加,截断点将从最高有效位平面向最低有效位平面移动,因此,R-D斜率具有递减趋势,即
对于给定的目标比特率Rtarget,在得到所有截断点的斜率值后,可以循环计算以得到最小λ值,表示为λopt,使得对于所有的编码块Snii>λ,并满足式
(2)[4].然后根据式(5)就可以得到经过优化的截断点集合.在PCRD算法中,所有可能截断点的R-D斜率信息是预先计算并存放在存储器中.这就需要Tier-1编码所有经过量化的系数,并存储整个编码后的比特流,即使其中很大一部分数据在优化截断后不会被包含在最终的码流中.这样在较低比特率需求情况下,大部分的计算和存储器空间都被浪费.而最小λ值的计算也必须在所有编码块完成Tier-1计算后进行,而此后才能进行编码流的输出,这样PCRD就会造成很大的编码延迟.前面的编码块完成Tier-1编码后也不能输出,而必须等到所有编码块完成Tier-1编码.
3 PMSD算法
为了解决上述PCRD算法存在的问题,提出一种改进的最小斜率截断的压缩后率控制(PMSD)算法.这一算法基于上述R-D斜率的两个属性[8]:
(1)一个编码块中的斜率值是单调递减的;
(2)在选定了优化截断点之后,所有包含编码过程的斜率值都大于λopt.PMSD算法通过式(6)得到截断点ti(λ).
其中Smin为最小斜率值.如果选取所有R-D斜率值小于或者等于Smin的可能截断点,并将数据进行编码,则可以保证这一截断点的集合足以获得与PCRD算法相同的优化率分配,这样就无需编码那些斜率小于Smin的编码过程数据.PMSD算法的具体流程图如图1所示.算法的主要步骤描述如下:
图1 PMSD算法流程图
Fig.1 PMSDalgorithmprocessingflow
(1)对一个编码块逐个编码过程进行编码,计算该编码过程斜率值Ski和当前累加的比特率.比较当前的累加比特率是否大于目标比特率,如果大于则转到步骤
(2),小于则继续步骤
(1).
(2)寻找已编码的编码块中最小斜率值.根据R-D斜率的属性,只需要比较每一个已编码的编码块中最后一个编码过程的斜率值即可.将最小斜率值的编码过程数据丢弃,以减小累加比特率,如果此时累加比特率依旧大于目标比特率则继续步骤
(2).若小于则进入步骤(3).
(3)如果具有最小斜率值编码过程属于当前编码块,则终止本编码块的编码,进行下一编码块的编码.否则继续本编码块编码.
可见,当所有编码块完成Tier-1部分编码时,率-失真优化算法也同时完成,因为所有截断点都已经得到.由于不必计算小于最小斜率值的编码过程数据,Tier-1部分的计算量将大大减少,而且需要存储用于率控制的数据大幅减少.而且与PCRD算法相比,PMSD算法还不必计算所有的斜率值,也不必存储那些斜率值小于最小斜率值的编码过程产生的数据,编码码流可以直接送给Tier-2编码模块进行打包处理,所以本算法在编码速度和资源的损耗等性能上要比传统JPEG2000中使用的PCRD压缩率分配算法更好.
4 试验结果
对于所提出的PMSD算法,对6幅512像素×512像素的测试图像(包括Lena,BarBara,
Peppers,Boat,Woman,Caf)进行分析和比较,结果如表1所示.PMSD算法的实现利用了
JPEG2000推荐的Jasper软件[9].对于所有图像,使用9/7小波,并进行5级DWT分解,而编码块的大小为64像素×64像素.算法实现平台为P4-2G512MRAM和WindowsXP操作系统.
表1 试验比较结果(0.25bit/pixel)
Table1 Experimentcomparisonresult
所有6幅测试图像经过PMSD算法和现有PCRD算法实现码率控制后Tier-1部分的平均计算时间和存储空间比较,如图2所示.由图2可见,PMSD算法可以减少的Tier-1部分计算时间最大可以达到80%,而存储空间的节省则可以达到90%.表1给出几幅测试图像在比特率为0.25bit/pixel时采用PMSD算法与PCRD算法的比较结果.
图2 PMSD算法和PCRD比较
Fig.2 ComparisonofPMSDandPCRD
PMSD算法和PCRD算法之间的平均PSNR差异比较结果如图3所示.由图3可以看出两者PSNR差异小于0.2dB,即采用PMSD算法获得的图像质量与PCRD基本相同.
图3 PMSD和PCRD算法平均PSNR差异
Fig.3 PSNRComparisonsbetweenPMSDandPCRD
由于PMSD实现了在编码的同时进行截断,被截断后的编码过程就不必进行编码,而且不需要等到所有编码块编码完成后才能进行最优截断点搜索,因此,编码的实时性得到了很大的提高.当比特率为0.25bit/pixel时,PMSD、文献[3]和[4]算法与PCRD算法的试验结果比较如表2所示.从资源损耗和系统的实时性而言,PMSD算法比文献[3]和[4]在算法和图像质量方面都要好.由于计算量和存储空间的大量降低,并满足了实时处理的要求,PMSD算法更适合于硬件实现.
表2 PMSD、文献[3]和[4]算法在计算量、存储空间和
PSNR方面与PCRD算法的比较
Table2 ComparisonofPMSD,Literature[3]and[4]
incomputation,memorysizeandPSNR
5 结 语
本文首先介绍了JPEG,然后再对比JPEG2000,提出一种有效的JPEG2000码率压缩控制算法.与已有的PCRD算法相比,它大大减少了EBCOTTier-1部分的计算量,实现了在编码的同时进行实时截断,使得被截断部分位平面不必再编码;无需存储被截断的码流和R-D斜率,节省了存储器资源.从试验结果可以看出,本文算法的图像质量与PCRD优化算法所得结果几乎一致.此外,由于本算法实现了实时截断,并减少了计算量和存储空间,使得压缩码率控制部分可采用硬件实现.
参 考 文 献
[1]TAUBMAND.HighPerformanceScalableImageCompressionwithEBCOT[J].IEEETransonImageProcessing,2000,9
(2):
1158-1170.
[2]CHENKF,LIANCJ,CHENHH,etal.AnalysisandArchitectureDesignofEBCOTforJPEG2000[C]//InProcIEEEIntSympCircuitsandSystems,2001:
765-768.
[3]MASUZKAIT,TSUTSUIH,IZUMIT,etal.JPEG2000AdaptiveRateControlforEmbeddedSystem[C]//InProcIEEEIntSympOnCircuitsandSystems,2002:
333-336.
[4]YEUNGYM,OSCARCA.EfficientRateControlforJPEG2000ImageCoding[J].IEEETransactionsandSystemsforVideoTechnology,2005,15(3):
335-344.
[5]杜伟娜,孙军,倪强.基于JPEG2000的高效率控制算法[J].上海交通大学学报,2006,40
(1):
16-19.
[6]JPEG
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 期末 论文