MATLAB图像压缩处理技术研究报告与实现论文.docx
- 文档编号:26640246
- 上传时间:2023-06-21
- 格式:DOCX
- 页数:36
- 大小:306.94KB
MATLAB图像压缩处理技术研究报告与实现论文.docx
《MATLAB图像压缩处理技术研究报告与实现论文.docx》由会员分享,可在线阅读,更多相关《MATLAB图像压缩处理技术研究报告与实现论文.docx(36页珍藏版)》请在冰豆网上搜索。
MATLAB图像压缩处理技术研究报告与实现论文
长 沙 学 院
CHANGSHAUNIVERSITY
毕业设计<论文)资料
设计<论文)题目:
基于MATLAB的图像压缩处理技
术的研究与实现
系 部:
电子与通信工程系
专业:
通信工程
学生姓名:
班级:
指导教师姓名:
最终评定成绩
第一部分毕业论文
一、毕业论文
第二部分外文资料翻译
一、外文资料原文
二、外文资料翻译
第三部分过程管理资料
一、毕业设计<论文)课题任务书
二、本科毕业设计<论文)开题报告
三、本科毕业设计<论文)中期报告
四、毕业设计<论文)指导教师评阅表
五、毕业设计<论文)评阅教师评阅表
六、毕业设计<论文)答辩评审表
2009届
本科生毕业设计<论文)资料
第一部分毕业论文
-
<2009届)
本科生毕业论文
基于MATLAB的图像压缩处理技术的研究与实现
系 部:
电子与通信工程系
专业:
通信工程
学生姓名:
马娟
班级:
05通信2
学号2005043204
指导教师姓名:
刘光灿
职称教授
王路露
职称助教
最终评定成绩
2009年6月
长沙学院本科生毕业论文
基于MATLAB的图像压缩处理技术的研究与实现
系部:
电子与通信工程系
专业:
通信工程
学号:
2005043204
学生姓名:
马娟
指导教师:
刘光灿教授
王路露助教
2009年6月
摘要
图像是一种重要的二维信号,由于其数据量很大,在存储和传输的时候要对其进行压缩处理。
离散余弦变换是一种新兴的数学工具,基于离散余弦变换的图像压缩技术正受到广泛的关注和研究。
图像经过离散余弦变换以后,在时域和频域都具有良好的局部化特性,重建图像中可以克服采用离散余弦变换编码所固有的方块效应,而且与人类视觉特性相一致。
论文主要研究了基于MATLAB的图像压缩算法,完成了以下一些工作:
介绍了图像压缩的原理和方法,列举了常用的图像压缩的评价标准和技术标准,在理论分析的基础上深刻理解了图像压缩算法。
重点研究了离散余弦算法的基本原理和实现步骤,对基于DCT变换的图像压缩技术的算法进行了研究,并用MATLAB进行了算法仿真,同时,利用MATLAB程序形象设计出图形用户界面,形象直观的看到了图像压缩前后的鲜明对比,取得了较为理想的效果。
关键词:
图像压缩,DCT变换,MATLAB仿真
ABSTRACT
Imageisimportanttwo-dimensionsignal.Becauseofthehugedataitcontains,imagemustbecompressedwhenitisstoredortransported.Thediscretecosinetransform(DCT>isrisingmathematicaltool.Thetechnologyofimagecompressionbasedondiscretecosinetransformhasdrawnmuchattentionandhasbeenresearchedbroadly.Whenaimageistransformedbythediscretecosinetransform,ithasfavorablelocalizecharacteristicinbothtime-domainandfrequence-region.Andintherebuildimagetheconnaturaldiamondsaffectionofthediscretecosinetransformcanbeovercame.Furthermore,theWTisidenticaltoHumanVisualSystem.
ThispaperismainlyabouttheimagecompressionalgorithmbasedonMATLAB,andcompletethesework:
Introducedthetheoryandtechniqueofimagecompression,Enumeratedtheprevalentimagecompressionalevaluationcriteriaandtechnicalstandards,basedonthetheoreticalanalysisIunderstandingtheimagecompressionalgorithmprofoundly.ThepaperdiscussesthebasicprinciplesandimplementationstepsofimageDCTtransformtechnique.carriesresearchonthealgorithmofimagecompressionbasedonDCT.Atthesametime,ThenthealgorithmissimulatedbyMATLAB,usingMATLABprogramdesignedthegraphicaluserinterfacevividly.Intuitiveimagetoseetheimageinsharpcontrasttobeforeandaftercompression,andachievedbetterresults.
Keywords:
Imagecompression,DCTtransform,SimulationbyMATLAB
第1章绪论
1.1论文研究背景及意义
人们在自然界中感受到的最重要的信息就是图像信息,随着多媒体技术和通讯技术的日益发展,图像也成为了信息技术所处理的重要对象。
近些年来,图像技术发展十分迅速,这也推动了多媒体娱乐、多媒体通信、数码相机、数码摄像头和高清晰度电视等各类与图片和视频相关的产品的发展。
图像信息的数据量非常的大,随着各种成像设备的分辨率的不断提高,单幅图像所包含的数据量也越来越大,大数据量的图像信息会给存储器的存储容量、通信信道的带宽以及计算机的处理速度增加极大的压力。
为了解决这个问题,必须对图像进行压缩处理。
数字图像压缩编码的目的就是要以尽可能少的比特数来表征图像,同时保持恢复图像的质量,对图像编码和解码算法的研究,己经受到人们越来越多的关注,成为近些年信息技术中的热点。
1.2图像压缩技术的历史与现状
图像压缩编码技术始于二十世纪四十年代末的电视信号数字化,至今己有将近六十年的历史。
在这几十年的时间内,出现了大量的图像压缩方法和理论M.Kunt将图像压缩的编码理论及方法分为两代:
传统的压缩编码方法和新型图像编码方法。
传统编码技术包括脉码调制、量化法、熵编码、预测编码、变换编码、矢量编码等十余种编码方法。
然而随着人们对这些传统编码方法的深入应用,也逐渐发现了这些方法的许多缺点:
比如在传统的编码方法中由于正交变换时频局域性很差,变换后的系数失去了对原图像精细结构的描述,从变换图像得不到原图像边缘轮廓等局部信息,因此,在量化编码时无法采用特殊方法;高压缩比时它还导致图像的边缘轮廓模糊显现和出现严重的方块效应;而且人类视觉系统(HumnaVisualSysetm,即HVS>的特性也不易被引入到压缩算法中。
这些缺点使得它们不适应于需要较高压缩比的应用场合。
80年代中后期,人们结合模式识别、计算机图形学、计算机视觉、神经网络、小波分析和分形几何等理论,开始探索图像信号压缩编码的新途径。
同时考虑到人类的视觉心理特性,新型图像压缩编码方法相继提出:
M.Kuni于1985年提出基于人眼视觉特性的第二代图像编码技术,1988年M.Barnsley提出基于迭代函数系统的分形图像编码技术,以及90年代初发展起来的基于模型的图像编码方法。
其中离散余弦变换不仅是现在研究的热点,而且这方面的编码也取得了一些引人注目的成功。
如离散余弦变换技术己经作为联合图像专家组新的图像压缩标准JPEG2000的核心技术[1]。
1.3离散余弦变换及其在图象压缩中的应用
离散余弦变换(DCTforDiscreteCosineTransform>是与相关的一种变换,它类似于离散变换(DFTforDiscreteFourierTransform>,但是只使用实数。
离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶进行的(因为一个实偶函数的傅里叶变换仍然是一个实偶函数>,在有些变形里面需要将输入或者输出的位置移动半个单位。
有两个相关的变换,一个是离散正弦变换(DSTforDiscreteSineTransform>,它相当于一个长度大概是它两倍的实奇函数的离散傅里叶变换;另一个是改进的离散余弦变换(MDCTforModifiedDiscreteCosineTransform>,它相当于对交叠的数据进行离散余弦变换。
离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图像(包括静止图像和运动图像>进行有损数据压缩。
这是由于离散余弦变换具有很强的“能量集中”特性:
大多数的自然信号(包括声音和图像>的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程(Markovprocesses>的统计特性时,离散余弦变换的去相关性接近于K-L变换(Karhunen-Loève变换——它具有最优的去相关性>的性能。
例如,在静止图像编码标准JPEG中,在运动图像编码标准JPEG和MPEG的各个标准中都使用了离散余弦变换。
在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。
这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8×8块的每行进行变换,然后每列进行变换,得到的是一个8×8的变换系数矩阵。
其中(0,0>位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类[2]。
1.4论文研究的主要内容
本文主要研究如何利用MATLAB软件开发一个基于离散余弦算法的图像压缩处理界面,为初学者提供一个图像压缩处理技术的DCT算法演示及模拟开发的GraphicalUserInterface(图形用户界面>平台,供大家学习并研究图像压缩处理的技术方法。
本文的主要内容如下:
第一章是绪论部分,介绍了论文的研究背景和意义,并简要介绍了图象压缩技术的历史与现状以及离散余弦变换在图像压缩中的应用,概述了本论文的主要研究工作;第二章介绍了图象压缩技术的基本理论知识,包括图象压缩的评价标准、技术标准及分类,论述了图像压缩的基本原理和基本模型;第三章介绍了离散余弦变换的MATLAB实现,简单介绍了MATLAB的图像处理工具箱,然后介绍了离散余弦变换的基本原理和算法,最后实现了离散余弦变换的图像压缩实现;第四章介绍了离散余弦变换的界面实现,简单介绍了图形用户界面的功能,论述了本设计采用MATLAB程序进行图像压缩界面操作的实现过程;第五章显示了利用离散余弦变换的算法实现和界面实现的运行结果,并概述了在设计过程中的疑难及改进;最后是对全文的总结,提出了需要进一步解决的问题及改进方向。
第2章图像压缩的基本原理
数字图像从表面上看可以表达丰富多彩的内容,但实质上可以看作在视觉空间灵敏度范围内对图像进行空间采样的一个个像素组成,每个象素点都可以用一组一维或多维的数字来表示,如nbit的灰度图像的每个象素由0~2n~l之间的某个数值来表示,而真彩色图像的象素值则由红(R>,绿(G>,蓝(B>三种颜色的值来联合表示。
由于图像采集设备的迅速发展,图像的尺寸和分辨率不断提高,导致了图像数据量变得非常大,例如,一幅单色数字卫星遥感图像由10,000×10,000个像素(pixel>组成,如果每个像素的灰度用12bit表示,那么这幅图像就要用1.2GB表示。
直接存储和传输如此庞大的数据,不仅要消耗巨大的磁盘空间和网络带宽而且还会极大地增加处理器的负担,因此对图像进行大幅度的数据压缩就显得尤为重要[3]。
2.1图象压缩评价标准
对图像进行压缩,不可避免的要引入失真。
我们要做的就是在图像信号的最终用户觉察不出或能够忍受这些失真的前提下,进一步提高压缩比,以换取更高的编码效率。
这就需要引入一些失真的测度来评估重建图像的质量。
重建图像的质量评价标准可分为客观标准和主观标准两种。
通过这些标准可以比较各种方法的优劣[1]。
2.1.1客观标准
假设原始图像表示A=f(i,j>,其中i=l,2,…M;j=1,2,…N,经压缩解压后的图像为A’=f’(i,j>,i=1,2,…M;j=1,2,…N,可以用下列指标进行评价:
(1>均方误差MSN
<2.1)
(2>规范化均方误差NMSN
<2.2)
其中
(3>对数信噪比SNR
<2.3)
(4>峰值信噪比PSNR
<2.4)
评价图像压缩效果的另外一个重要指标是压缩比C,它指的是表示原始图像每象素的比特数同压缩后平均每象素的比特数的比值,也常用每象素比特值(bpp>来表示压缩效果。
2.1.2主观标准
图像的主观质量就是以人作为图像的观察者,对图像的优劣做出主观评价。
主观标准采用平均判分MOS(meanopinionscore>或多维计分等方法进行测试,即组织一群足够多的实验人员(一般10人以上>,通过观察来评定图像的质量,观察者给判定图像打上一定的质量等级比较损伤程度给予图像进行比较等方法,根据不同的质量打上5级、6级或7级的评分制,最后用平均的办法得到图像的分数,这样的评分虽然很花时间,但比较符合实际。
表2.1列出了一个5级的主观评价的评分尺度。
表2.1图像质量主观评价尺度
图像质量
评分
评价尺度
非常好的图像
5分
丝毫看不出图像质量变坏
好的图像
4分
能看出质量变坏,但不妨碍观看
中等的图像
3分
清楚看出图像质量变坏,稍妨碍观看
差的图像
2分
对观看较有影响
非常差的图像
1分
非常严重的质量变坏,基本不能观看
主观评价和客观评价之间有一定联系,但不能完全等同,由于客观评价比较便,很有说服力,故在一般的图像压缩研究中被采用。
主观评价很直观,符合人眼的视效果,比较实际,但是打分尺度很难把握,不可避免有人为因素。
2.2图像压缩技术标准
信息技术的突出特点是互操作性和全球联网。
随着全球范围内的信息传输和交换越来越重要,统一的技术标准成为实现全球范围信息传输和交换的关键。
统一的国际标准是不同国家地区和厂商的产品能够相互兼容和协调的基础。
近些年来,图像编码技术得到了迅速的发展和广泛的应用,并且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,有关图像压缩编码已有的国际标准<或建议)有H.261、H.263、JPEG、JPEG2000、MPEG-l、MPEG-2、MPEG-4等,涉及到二值图像传真、静态图像传输、可视电话、会议电视、VCD、DVD、常规数字电视、高清晰度电视、多媒体可视通信、多媒体视频点播与传输等广泛应用领域。
这些标准图像编码算法融合了各种性能优良的传统图像编码方法,是对传统编码技术的总结,代表了目前图像编码的发展水平。
各种图像编码的标准实际上都是博采各种方法之所长的优化组合的混合编码系统。
有关图像编码的若干国际标准<建议)的名称、主要目标和内容以及应用范围如下[4]:
(1>H.261建议
H.261建议是CCITT于1990年7月通过的有关图像<视频)压缩编码的第一个国际标准化建议,其全称为“p×64kbit/s(p=1~30>视听业务的视频编解码器”。
H.261的主要对象是m×64kbit/s和n×354kbit/s两类码率。
其应用目标是可视电话和会议电视,其对图像质量的要求不很高。
(2>JPEG标准
JPEG是ISO和CCITT于1986年成立的联合图像专家组 1992年作为静止图像压缩算法的国际标准正式推出。 它适用于不同类型不同分辨率要求的彩色和黑白静止图像,有多种编码模式和数据格式。 主要应用于彩色产值、静止图像、可视通讯、印刷出版、新闻图片、医学和卫星图像的传输、检索和存储。 (3>JPEG2000标准 JPEG2000是21世纪的压缩标准,它把JPEG的四种模式<顺序模式、渐进模式、无损模式和分层模式)集成在一个标准中,在编码端以最大的压缩质量和最大的图像分辨率压缩图像,在解码端可以从码流中以任意的图像质量和分辨率解压图像。 JPEG2000的主要特征如下: ⅰ.高压缩率: 由于采用离散小波变换,图像可以转换成一系列“小波”,压缩比可比JPEG提高10%~30%,而且压缩后的图像显得更加细腻平滑。 ⅱ.JPEG2000提供无损和有损两种压缩方式。 ⅲ.渐进传输: 采用JPEG2000格式的图像支持渐进传输。 所谓渐进传输就是先传输图像轮廓数据,然后再逐步传输其他数据来不断提高图像质量。 ⅳ.感兴趣区域压缩: 可以指定图片上感兴趣的区域 ⅴ.码流的随机访问和处理: 这一特征允许用户随机定义感兴趣区域,使得这一区域的图像质量高于其它区域。 ⅵ.容错性。 ⅶ.开放的框架结构。 ⅷ.基于内容的描述。 JPEG2000的应用领域包括互联网、彩色传真、打印、扫描、数字摄像、遥感、移动通信、医疗图像和电子商务等。 (4>MPEG-1标准 MPEG是活动图像专家组MovingPictuerExpertsGroup的简称。 MPEG-l的全称是ISO/IECCDIl72,CodingofMovingPictureandAssoeiatedAudiofordigitalstoragemediaatupto1.5Mbit/s,中文译为“用于数字存储媒体、码率约为1.5Mbit/s的活动图像及其伴音的编码”。 它是MPEG专家组的第一阶段成果,1993年正式通过为国际标准。 MPEG-1包括系统、视频、音频以及测试和软件实现等。 MPEG-1主要面向数字存储媒体,应用于多媒体计算机、教育与训练、演示与咨询服务、创作与娱乐、电子出版物、数字视听系统VCD以及VOD、交互式电视ITV等领域。 (5>MPEG-2标准 MPEG-2标准的全称是ISO/IECDIS13818,GenerieCodingofMovingPicturesandAssoeiatedAudioInformation,中文名为“活动图像及其伴音信息的通用编码<标准)”,1993年11月正式推出。 MPEG-2包括系统、视频、音频和测试,与MPEG-1后向兼容。 MPEG-2的视频编码部分码率为4~10Mbit/s,图形质量接近演播室质量。 MPEG-2在技术、功能、语法结构、选择项、可分级性和应用范围等方面比MPEG-1、H.261有重大改进和发展。 因此成为一种从多媒体计算机到家用消费数字音像电子产品、从宽带数字通信到数字视频广播以及HDTV的“通用”共性关键技术。 MPEG-2从技术上促进了计算机、广播电视、数字通信三大领域的交汇融合,并发挥出了巨大的作用。 (6>H.263建议 全称是ITU-TRecommendationH.263,VideoCodingofLowBitrateCommunation。 它是ITU-TH.324“TerminalforLowBitrateMultimediaCommunation”的主要组成部分。 其面向低码率多媒体通信,原来的目标为在PSTN上运行低于64Kbit/s以下码率的新的视频压缩标准。 由于低码率下实现多媒体通信在技术上更为困难和复杂,因此H.263采用了多种先进技术以降低码率,提供各种业务,后来又推出了H.263+和H.263++。 (7>MPEG-4和MPEG-7 MPEG-4的目标是交互式的多媒体应用。 其特点有: ⅰ.基于内容的交互性: 基于内容的多媒体数据访问、基于内容的码流操作和编辑。 ⅱ.高效的压缩算法。 ⅲ.自然的与合成的图像编码及其混合编码。 ⅳ.通用的可接入性: 包括恶劣环境下强大的抗差错能力,基于内容的可分级。 2.3图像压缩的分类 图像压缩的效果好与不好,关键要看三样指标: 一是压缩比要大,二是压缩算法简单、速度快,三是恢复效果好。 数字图像数据量的压缩按照应用不同可分为两大类: 无损压缩和有损压缩。 无损、冗余压缩: 可逆,压缩比较高,信息保持型数据压缩。 有损、熵压缩: 不可逆,压缩比较低,又分为保真度型数据压缩和特征保持型数据压缩。 图像编码也可以按照编码所在数据域主要分为空间域编码和变换域编码两大类,此外还有模型编码、矢量量化编码和神经网络编码等众多方法。 下面简要介绍几种压缩编码方法[5]: (1>预测编码: 根据离散信号之间存在着一定并联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差值<预测误差)进行编码。 对预测的要求是必须较为准确。 预测编码消除的是空间冗余和时间冗余。 属于这类编码的主要有DPCM、ADPCM等。 (2>变换编码: 先对信号进行某种函数变换,从一种信号<空间)变换到另一种信号<空间),然后再对变换后的信号进行采样编码。 变换编码可以消除空间冗余和时间冗余。 属于变换编码的有K-L变换、DFT变换、DCT变换、WHT变换等。 (3>统计编码: 主要用于对相互独立、无相关性的消息序列构成的无记忆信源进行压缩。 它根据消息出现概率的分布特性而进行的压缩编码,宗旨是在消息和码字之间找到明确的一一对应关系,以便在恢复时再现出来。 统计编码消除的是信息熵冗余。 属于这类编码的有Huffman编码、Shannon-Fano编码、算术编码等。 (4>模型编码: 利用模型的方法,对需传输的图像进行参数估测。 它消除的是结构冗余和知识冗余。 属于这类编码方法的如分形编码等。 (5>其他编码: 如行程编码,计算信源符号出现的行程长度,然后将行程长度转换成代码;Lempel-Zel和Welsh编码,查找冗余字符串和将此字符串用较短的符号标记替代的技术,从而达到数据压缩的目的,其压缩率很高。 图2.1给出了按数据域划分归类的主要压缩方法[6]。 图2.1图像压缩方法的分类 2.4图像压缩处理技术基本理论 2.4.1图像压缩的基本原理 图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。 大类,前者在解码时可以精确地恢复原图像,没有任何损失;后者在解码时只能近似原图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。 压缩技术分为无损压缩和有损压缩两图像,不能无失真地恢复原图像。 假设有一个无记忆的信源,它产生的消息为{ai},1≤i≤N,其出现的概率是已知的,记为P(ai>。 则其信息量定义为: (2.5> 由此可见一个消息出现的可能性越小,其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 图像 压缩 处理 技术研究 报告 实现 论文