基于matlab的图像形状与分类毕业设计 精品.docx
- 文档编号:6597527
- 上传时间:2023-01-08
- 格式:DOCX
- 页数:34
- 大小:303.84KB
基于matlab的图像形状与分类毕业设计 精品.docx
《基于matlab的图像形状与分类毕业设计 精品.docx》由会员分享,可在线阅读,更多相关《基于matlab的图像形状与分类毕业设计 精品.docx(34页珍藏版)》请在冰豆网上搜索。
基于matlab的图像形状与分类毕业设计精品
天津职业技术师范大学本科生毕业设计
基于matlab的图像形状与分类
ImageshapeandclassificationbasedonMatlab
2012年6月
摘要
数字图像处理是一门新兴技术,随着计算机硬件的发展,数字图像的实时处理已经成为可能,由于数字图像处理的各种算法的出现,使得其处理速度越来越快,能更好的为人们服务。
数字图像处理是一种通过计算机采用一定的算法对图形图像进行处理的技术。
数字图像处理技术已经在各个领域上都有了比较广泛的应用。
图像处理的信息量很大,对处理速度的要求也比较高。
MATLAB强大的运算和图形展示功能,使图像处理变得更加的简单和直观。
本文介绍了MATLAB语言的特点,基于MATLAB的数字图像处理环境,介绍了如何利用MATLAB及其图像处理工具箱进行数字图像形状的边缘提取和识别分类。
论文主要论述了利用MATLAB实现对图像中的三角形,正方形,圆,椭圆,菱形的边缘提取和自动识别分类。
关键词:
MATLAB;数字图像处理;图像形状;图像分类
ABSTRACT
Digitalimageprocessingisanemergingtechnology,withthedevelopmentofcomputerhardware,real-timedigitalimageprocessinghasbecomepossibleduetodigitalimageprocessingalgorithmstoappear,makingitfasterandfasterprocessingspeed,betterforPeopleservices.Digitalimageprocessingisusedbysomealgorithmscomputergraphicsimageprocessingtechnology.Digitalimageprocessingtechnologyhasbeeninvariousareashavearelativelywiderangeofapplications.Imageprocessinglargeamountofinformationontheprocessingspeedrequirementisrelativelyhigh.MATLABpowerfulcomputingandgraphicsdisplaycapabilities,sothatimageprocessingbecomesmoresimpleandintuitive.ThispaperintroducescharacteristicsofMATLABlanguageandthisdigitalimageprocessingenvironmentbasedonMATLAB,describeshowtousetheMATLABImageProcessingToolboxforitsdigitalimageprocessing,Theedgeofthedigitalimageshapeextractionandrecognitionofclassification.ThispapermainlydiscussestheuseofMATLABtoachievetheedgeoftheimagetriangle,square,circle,ovaldiamondextractionandclassificationofautomaticidentification.
KeyWords:
MATLAB;DigitalImageProcessing;Imageshape;ImageClassification
1引言
本章简略介绍课题的研究目的及意义,该课题国内外研究现状以及论文内容安排等。
1.1课题研究目的及意义
随着信息化多媒体时代的到来及世界范围内Internet的风行,人们在工作和生活中越来越多的接触到大量的各种各样的图像信息。
图像作为一种重要的信息载体,具有直观、内容丰富、无语言限制和便于国际交流等特点,是组成多媒体信息的重要内容。
图像处理技术已经广泛深入的应用于各行各业中。
设计制造、医疗卫生、艺术文化、建筑工程、地理、公安等领域相继建立了各种图像库。
在浩如烟海的信息中,寻找感兴趣的资料是极其耗时的,人们对信息检索和系统的依赖日益加强。
图像的特征提取是基于内容的图像检索系统部分的核心内容。
本文研究的重点就是如何从静态图像中提取出图像的形状特征。
典型框架是:
对图像的形状进行人工标注分类。
这种方法当图像数量不大时,不失为一种简单易行的方法。
然而,当图像数据量非常庞大时,基于文本的图像检索存在着诸多困难,此时图像形状的自动识别就派上用场了。
1.2国内外研究现状
因为图像特征提取及识别具有很强的实用性,国内外测绘界、计算机视觉、模式识别与人工智能等领域都对其进行了深入研究。
国外如美国的Mckeown实验室、英国的VGG实验室、德国的波恩大学、奥地利的格拉茨大学等,国内如清华大学、北京大学、中科院等,在这方面都做了许多工作,取得了很大的成绩,有的成果己具备初步的实用价值。
在上述研究的基础上,近年来国内外推出了一系列图形图像软件,它们具备了较强的图像特征提取和识别的功能。
国外流行的图像特征提取及识别的软件,例如:
德国softelec公司的VPStudio,日本日立公司的Imageseries,美国GTX公司的GTXRasterseries,挪威Rasterex公司的RxAutoImagePro2000等。
国内图像特征提取及识别软件,例如:
东大阿尔派的SEAS系统,华中理工大学的EDIS工程图信息系统,西工大CAD中心的NPPU-EDRS工程图智能输入与识别系统,清华紫光的TH-DAIMS图纸处理系统等。
从上面特征提取和识别的研究现状来看,由于特征提取及识别问题本身的多样性和复杂性,现有的理论和方法离实际要求还有相当距离,一些根本的问题还有待进一步深入研究。
现有的特征提取和识别算法基本上还是处于实验阶段,其实用性、通用性、准确性等方面离大规模实际应用的要求还有一定差距。
所有这些应用都是和问题的性质密不可分的,至今还没有发展成统一、有效的可应用于所有模式识别的理论。
虽然各特征提取与识别算法的处理能力、特征提取能力、特征识别能力的效果方面各有所长,但是仍然在算法的性能、通用性、自动化程度、准确率方面存在很多不足。
因此,为了弥补这些不足,对于图像特征提取及识别技术的研究需要更多的关注,付出更多的努力。
1.3本课题研究工作与结构安排
本文主要以MATLAB为工具来实现数字图像形状方面的研究与分类。
全文共分3章,结构安排如下:
第一章引言,介绍了课题研究目的及意义和国内外研究现状。
第二章介绍了对数字图像进行预处理的基本步骤。
第三章介绍了图像形状的基本特征及其分类识别。
2数字图像形状及预处理
2.1概述
形状特征是对图像中边界清晰的目标的最好表达方式。
是图像目标的一种显著特征,在实际中通常利用形状特征或主要边界对图像进行检索和分类。
图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。
图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。
人的视觉系统对于景物的最初认识是物体的形状,能从二维图像中识别出许多物体。
在人的视觉感知、识别和理解中,形状是一个重要参数。
形状是刻画物体的本质特征之一,也是描述图像内容的一个重要特征。
对图像的形状描述是一个非常复杂的问题,在二维情况下,形状可以定义为二维范围内一条简单连接曲线位置和方向的函数。
因此形状的描述涉及到对封闭曲线的描述,或对轮廓所包围区域的描述。
图像目标的边缘称为轮廓。
轮廓是形状知觉中最基本的概念,它与形状有密切的联系。
人在知觉一个形状以前一定先看到轮廓。
当我们看到一个物体的形状时,就是看见了一个轮廓,这个轮廓把该物体与视野中的其它部分区分开来。
直观的说,对形状的知觉要求在亮度不同的可见区域之间有一个线条分明的轮廓。
轮廓的构成用数学语言来说是轮廓对应亮度的二阶导数,仅仅有亮度的线性变化并不产生轮廓。
当人注意物体的形状时,倾向于固定的看某一些区域;而当人注意轮廓时,则把轮廓看成一条要追踪的路线,所以从轮廓到形状的知觉有一个“形状构成”的过程。
可以这么说,轮廓只是边界,是一个局部概念,而形状是全体,是一个总体概念。
Matlab是非常好用的图像处理软件。
Matlab是由美国MathWorks公司开发的集数值计算、符号计算和图形可视化三大基本功能于一体的,功能强大、操作简单的语言。
是国际公认的优秀数学应用软件之一。
Matlab的基本数据单位是矩阵,它的指令表达式与数学,工程中常用的形式十分相似,故用Matlab来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多。
Matlab包括拥有数百个内部函数的主包和三十几种工具包(Toolbox)。
工具包又可以分为功能性工具包和学科工具包。
功能工具包用来扩充Matlab的符号计算,可视化建模仿真,文字处理及实时控制等功能。
学科工具包是专业性比较强的工具包,控制工具包,信号处理工具包,通信工具包等都属于此类。
开放性使Matlab广受用户欢迎。
除内部函数外,所有Matlab主包文件和各种工具包都是可读可修改的文件,用户通过对源程序的修改或加入自己编写程序构造新的专用工具包。
本文正是要使用Matlab从“轮廓”这个局部中找出特征来判断“形状”这个总体。
2.2数字图像的预处理
2.2.1数字图像
所谓数字图像就是把传统图像的画面分割成如图2-1所示的被成为像素(pictureelement,简称pixel。
有时候也用pel这一简写词)的小的离散点,各像素的灰度值也是用离散值即整数值来表示的。
数字图像(digitalimagine)和传统的图像即模拟图像(picture)是有差别的。
图2-1数字图像
常见的数字图像格式有以下几种:
(1)PCX(WindowsPaintbrush)格式。
可处理1,4,8,16,24位等图像数据。
文件内容包括:
文件头(128字节),图像数据、扩展颜色映射表数据。
(2)BMP(WindowsBitmap)格式。
有1,4,8,24位非压缩图像,8位RLE(Run-lengthEncoded)图像。
文件内容包括:
文件头(一个BITMAPFILEHEADER数据结构),位图信息数据块(位图信息头BITMAPINFOHEADER和一个颜色表)和图像数据。
(3)HDF(HierarchicalDataFormat)格式。
有8位,24位光栅数据集。
(4)JPEG(JointPhotographicExpertsGroup)格式,是一种成为联合图像专家组的图像压缩格式。
(5)TIFF(TaggedImageFileFormat)格式。
处理1,4,8,24位非压缩图像,1,4,8,24位packbit压缩图像,一位CCITT压缩图像等。
文件内容包括:
文件头,参数指针表与参数域,参数数据表和图像数据四部分。
(6)XWD(XWindowsDump)格式。
1,8位Zpixmaps,Xybitmaps,1位Xypixmaps。
(7)PNG(PortableNetworkGraphics)格式。
为了从一般的照片,景物等模拟图像中得到数字图像,需要对传统的模拟图像进行采样与量化两种操作(二者统称为数字化)。
数字图像处理(DigitalImageProcessing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。
数字图像处理的产生和迅速发展主要受三个因素的影响:
一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。
对数字图像经行处理要用到Matlab程序,它在数字图像方面的用处巨大。
图像处理工具包是由一系列支持图像处理操作的函数组成的。
所支持的图像处理操作有:
图像的几何操作、邻域和区域操作、图像变换、图像恢复与增强、线性滤波和滤波器设计、变换(DCT变换等)、图像分析和统计、二值图像操作等。
下面就Matlab在图像处理中各方面的应用分别进行介绍。
(1)图像文件格式的读写和显示。
Matlab提供了图像文件读入函数imread(),用来读取如:
bmp、tif、tiffpcx、jpg、gpeg、hdf、xwd等格式图像文;图像写出函数imwrite(),还有图像显示函数image()、imshow()等等。
(2)图像处理的基本运算。
Matlab提供了图像的和、差等线性运算,以及卷积、相关、滤波等非线性算。
例如,conv2(I,J)实现了I,J两幅图像的卷积。
(3)图像变换。
Matlab提供了一维和二维离散傅立叶变换(DFT)、快速傅立叶变换(FFT)、离散余弦变换(DCT)及其反变换函数,以及连续小波变换(CWT)、离散小波变换(DWT)及其反变换。
(4)图像的分析和增强。
针对图像的统计计算Matlab提供了校正、直方图均衡、中值滤波、对比度调整、自适应滤波等对图像进行的处理。
(5)图像的数学形态学处理。
针对二值图像,Matlab提供了数学形态学运算函数;腐蚀(Erode)、膨胀(Dilate)算子,以及在此基础上的开(Open)、闭(Close)算子、厚化(Thicken)、薄化(Thin)算子等丰富的数学形态学运算。
以上所提到的Matlab在图像中的应用都是由相应的Matlab函数来实现的,使用时,只需按照函数的调用语法正确输入参数即可。
具体的用法可参考Matlab丰富的帮助文档。
图像边缘对图像识别和计算机分析十分有用,在Matlab中,函数edge()用于灰度图像边缘的提取,它支持六种不同的边缘提取方法,即Sobel方法、Prewitt方法、Robert方法,Laplacian2Gaussian方法、过零点方法和Canny方法。
基本的图像类型分为以下几种:
(1)索引图像
索引图像包括图像矩阵与颜色图数组,其中,颜色图是按图像中颜色值进行排序后的数组。
对于每个像素,图像矩阵包含一个值,这个值就是颜色图中的索引。
颜色图为m*3双精度值矩阵,各行分别指定红绿蓝(RGB)单色值。
Colormap=[R,G,B],R,G,B为值域为[0,1]的实数值。
图像矩阵与颜色图的关系依赖于图像矩阵是双精度型还是uint8(无符号8位整型)类型。
如果图像矩阵为双精度类型,第一点的值对应于颜色图的第一行,第二点对应于颜色图的第二行,依次类推。
如果图像矩阵是uint8,有一个偏移量,第0点值对应于颜色图的第一行,第一点对应于第二行,依次类推;uint8长用于图形文件格式,它支持256色。
(2)灰度图像
在MATLAB中,灰度图像是保存在一个矩阵中的,矩阵中的每一个元素代表一个像素点。
矩阵可以是双精度类型,其值域为[0,1];也可以为uint8类型,其数据范围为[0,255]。
矩阵的每个元素代表不同的亮度或灰度级。
(3)二进制图像
二进制图像中,每个点为两离散值中的一个,这两个值代表开或关。
二进制图像保存在一个由二维的由0(关)和1(开)组成的矩阵中。
从另一个角度讲,二进制图像可以看成为一个仅包括黑与白的灰度图像,也可以看作只有两种颜色的索引图像。
二进制图像可以保存为双精度或uint8类型的双精度数组,显然使用uint8类型更节省空间。
在图像处理工具箱中,任何一个返回二进制图像的函数都是以uint8类型逻辑数组来返回的。
(4)RGB图像
与索引图像一样,RGB图像分别用红,绿,蓝三个亮度值为一组,代表每个像素的颜色。
与索引图像不同的是,这些亮度值直接存在图像数组中,而不是存放在颜色图中。
图像数组为M*N*3,M,N表示图像像素的行列数。
2.2.2采样
采样(sampling)就是把在时间上和空间上连续的图像变成离散点(采样点,即像素)的集合的一种操作。
图像基本上是在二维平面上连续分布的信息形式要把它输入到计算机中,首先要把二维信号变成一维信号,因此要进行扫描(scanning)。
最常用的扫描方法是在二维平面上按一定间隔顺序地从上方顺序地沿水平方向的直线(扫描线)扫描,从而取出浓淡值(灰度值)的线扫描(Laster扫描)。
对于由此得到的一维信号,通过求出每一特定间隔的值,可以得到离散的信号。
对于运动图像除进行水平,垂直两个方向的扫描以外,还有进行时间轴上的扫描。
通过采样,如设横向的像素数为M,纵向的像素数为N,则画面的大小可以表示为“M*N”个像素。
2.2.3量化
经过采样,图像被分解成在时间上和空间上离散分布的像素,但是像素的值(灰度值)还是连续值。
像素的值,是指白色-灰色-黑色的浓淡值,有时候也指光的强度(亮度)值或灰度值。
把这些连续的浓淡值或灰度值变为离散的值(整数值)的操作就是量化。
如果把这些连续变化的值(灰度值)量化为8bit,则灰度值被分成0-255的256个级别,分别对应于各个灰度值的浓淡程度,叫做灰度等级或灰度标度。
在0-255的值对应于白-黑的时候,有以0为白,255为黑的方法,也有以0为黑,255为白的方法,这取决于图像的输入方法以及用什么样的观点对图像进行处理等,这是在编程时应特别注意的问题。
但在只有黑白二值的二值图像的情形,一般设0为白,1为黑。
对连续的灰度值赋予量化级的,即灰度值方法有:
均匀量化(uniformquantization),线性量化(linerquantization),对数量化,MAX量化,锥形量化(taperedquantization)等。
2.2.4采样、量化和图像细节的关系
上面的数字化过程,需要确定数值N和灰度级的级数K。
在数字图像处理中,一般都取成2的整数幂,即:
(2-1)
(2-2)
一幅数字图像在计算机中所占的二进制存储位数b为
(2-3)
例如,灰度级为256级(m=8)的512×512的一幅数字图像,需要大约210万个存储位。
随着N和m的增加,计算机所需要的存储量也随之迅速增加。
由于数字图像是连续图像的近似,从图像数字化的过程可以看到。
这种近似的程度主要取决于采样样本的大小和数量(N值)以及量化的级数K(或m值)。
N和K的值越大,图像越清晰。
2.3几种典型的形状特征描述方法
对形状分析和分类的方法技术有许多。
通常来说,形状特征表示方法可以分为两类:
基于边界的和基于区域的。
前者使用形状的外部边界,而后者使用整个区域。
这两类形状特征的最典型的方法分别是傅立叶描述符、变形模板匹配和形状不变矩。
此外轮廓匹配方法还有几何参数法、边界方向直方图法、小波重要系数法和小波轮廓表示法等。
几种典型的形状特征描述方法:
(1)边界特征法
该方法通过对边界特征的描述来获取图像的形状参数。
其中Hough变换检测平行直线方法和边界方向直方图方法是经典方法。
Hough变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点—线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。
(2)傅里叶形状描述符法
傅里叶形状描述符(Fouriershapedescriptors)基本思想是用物体边界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。
由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。
(3)几何参数法
形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shapefactor)。
在QBIC系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。
需要说明的是,形状参数的提取,必须以图像处理及图像分割为前提,参数的准确性必然受到分割效果的影响,对分割效果很差的图像,形状参数甚至无法提取。
(4)形状不变矩法
利用目标所占区域的矩作为形状描述参数来进行分类。
(5)其它方法
近年来,在形状的表示和匹配方面的工作还包括有限元法(FiniteElementMethod或FEM)、旋转函数(TurningFunction)和小波描述符(WaveletDescriptor)等方法。
3形状特征及提取分类
本文主要采用的是几何参数法来判断给出的的图像是什么形状。
对于图像分类问题,特征提取的好坏是决定分类性能的关键因素。
提取物体的形状特征前,首先要对图像进行边缘提取,以获得物体的轮廓边界,然后需要把轮廓边界区域的特征抽取出来。
在这些特征里面,有一部分可以用数字量值来描述,但更多的特征是一些没有明显特征的几何图形。
为了便于图像的匹配,需要对这些几何图形进行进一步的描述。
图像中物体的性质不能因为图像的平移、旋转、比例尺度的改变而发生变化。
所以,在进行形状描述时,选择的描述符应具有平移不变性、旋转不变性、尺度不变性等特点。
不但如此,选择的描述符还应该能够刻画形状的本质特点,使得该描述符具有良好的可分辨能力。
图像特征选择的原则特征提取是对模式所包含的输入信息进行处理和分析,将不易受随机因素干扰的信息作为该模式的特征提取出来。
特征提取过程是去除冗余信息的过程,具有提高识别精度,减少运算量和提高运算速度的作用。
良好的特征应具有四个特点:
(1)区别性
在理想情况下,分属于不同类别的对象的特征值应有明显差异。
不同类别的某一特征值相差越大,则以这个特征区分不同类别的能力越强,特征的可区别性可以用类间距离来度量。
如三角形和圆这两类,有面积计算得到的类间距比较小,而形状指数的类间距离非常大,由于两类样本各自内部的形状指数基本相同,特征方差接近为0,因此类间距离表现为比较大。
如果选择特征“形状指数”作为分类的依据,其可区别性较高;如果选择特征“面积”作为分类依据,其可区别性就较低。
(2)可靠性
在同一类别内的所有对象的某一特征值应尽可能地接近。
类内特征值越接近,表明用这个特征值来识别这类对象的可靠性越高。
如一组不同大小的圆,若选择特征“面积”作为将其和其他类别相区分的依据,其可靠性较低,同一圆类内的不同样本的面积相差较大,而选择特征“形状指数”作为分类的依据,其可靠性就很高,同一圆类内各个个样本的形状指数基本相同。
特征的可靠性是类别内样本属性趋同性的直接表现。
(3)独立性
如果必须采用多个特征进行分类时,这些特征之间应当尽可能是互不相关的。
如两个高度相关的特征基本上反映了对象的同一属性,则可将其组合,而不宜单独采用。
如在几何形状分类时,形状面积和周长这两个特征之间高度相关,而形状面积和形状指数之间也有一定的相关性,但相关程度比较低。
在一个识别系统中,特征的可区别性、可靠性和独立性都是针对整个系统的组成而言。
对于单个对象,特征的可区别性、可靠性没有参照和对比意义。
3.1矩形度
用目标图像的面积和包围该图像的最小的矩形面积之比作为目标矩形度的一种度量参数,记为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于matlab的图像形状与分类毕业设计 精品 基于 matlab 图像 形状 分类 毕业设计