数学形态学图像分割方法研究报告.docx
- 文档编号:5632072
- 上传时间:2022-12-29
- 格式:DOCX
- 页数:43
- 大小:1.77MB
数学形态学图像分割方法研究报告.docx
《数学形态学图像分割方法研究报告.docx》由会员分享,可在线阅读,更多相关《数学形态学图像分割方法研究报告.docx(43页珍藏版)》请在冰豆网上搜索。
数学形态学图像分割方法研究报告
基于数学形态学的图像分割方法研究
专业:
电子信息科学与技术
班级:
2005级1班
姓名:
杨晓琦
摘要
本文运用形态学方法对车牌定位算法和车牌字符分割算法进行了系统的研究。
这两种算法的研究为车牌识别做了先期准备,是智能交通中非常重要的组成部分。
在车牌定位算法部分,提出了一种基于二值面积形态学的车牌定位算法。
首先将车牌的灰度图像二值化,然后逐步缩小车牌候选区的面积,计算车牌图像中连通区域的面积,并根据车牌图像的实际情况确定面积阈值,并用形态学的方法对车牌图像进行处理运算,以实现车牌的精确定位。
仿真实验结果表明此算法定位精度高,而且能适应复杂天气环境,能达到满意的定位效果。
在字符分割算法部分,对投影分割算法进行了改进,将其与数学形态学分割算法进行了结合。
首先将车牌图像二值化,然后用数学形态学分割方法结合水平与垂直投影分割方法,确定车牌字符宽和高并校正车牌实际位置,通过两次投影,校正车牌角度,去除车牌边框,确定车牌上下边界及中心点,最后分割提取车牌字符。
实验结果表明该算法能有效的保持车牌字符边缘,获得较好的分割效果。
关键词:
图像分割;数学形态学;车牌定位;字符分割;Matlab
Abstract
Inthispaper,thelicenseplatelocationalgorithmandthelicenseplatecharactersegmentationalgorithmbasedonmorphologicalmethodarestudiedsystematically.Theresearchofthesetwoalgorithmisanimportantpartofintelligencetrafficandservesforthefirststepoflicenseplaterecognition.Inlicenseplatelocation,analgorithmbasedontwo-valuedareamorphologyispresented.Firstly,thegrayimageoflicenseplateisbinary.thentheareasofcandidateregistrationisnarrowedgradually,theareaofregionalconnectivityiscalculated.Accordingtotheactualsituationoflicenseplatedeterminestheareathresholding,andusemorphologymethodprocessinglicenseplateimage,achieveaccuratepositioning.Thesimulationresultsshowthealgorithmhasahighpositioningaccuracyandadaptstothecomplexweatherandenvironment,canachievesatisfactoryresults.Incharactersegmentationalgorithm,theprojectionalgorithmisimproveandcombinedwithmathematicalmorphologysegmentationalgorithm.Firstlythelicenseplateisbinary,thenmathematicalmorphologysegmentationalgorithmiscombinedwithhorizontalandverticalprojectionsegmentationmethod,todeterminethelicenseplatecharacterwidthandtheheight,andcalibrateitslocationthroughtwotimesprojection.Thelicenseplateangleiscalibrated,licenseplateframeareremoved,theupperandlowerboundariesandthecenteroflicenceplatearedetermined.Finally,thelicenseplatecharacteraredivisionalandextractedExperimentalresultsshowthealgorithmcanremainthelicenseplatecharacterandobtaingoodsegmentationresult.
Keywords:
Imagedivision。
mathematicsmorphology。
vehicleplatelocation。
charactersegmentation。
Matlab
引言
近年来,我国汽车数量迅猛增加。
来自中国汽车工业协会的统计显示,2008年,我国汽车销售总量为938万辆,是2005年汽车销售总量590万辆的1.59倍。
根据中国汽车工业协会预计,2009年我国汽车市场仍将保持继续增长。
随着汽车数量的逐年递增,摆在我们面前的是巨大的城市交通压力。
如何高效地进行交通管理,越来越成为我们现实生活中的焦点问题。
针对此问题,人们运用先进的科学技术,相继研制开发出了各种交通道路监视、管理系统,这些系统一般都包括车辆检测装置。
而车牌的定位和图像分割技术正是先进的交通检测系统的一项重要技术,因为它是车牌识别的前期准备,而车牌识别是交通管理系统中最为核心的技术。
可以通过车牌的识别对过往的车辆实施检测,提取相关车牌数据,用于达到监控、管理和指挥交通的目的。
车牌定位就是从包含车牌的图像中,采用图像处理技术定位出车牌区域的精确位置。
在采集到车牌图像之后,要提高车牌定位的准确率,只能依靠车牌定位算法的准确性。
为了尽量提高车牌定位算法的准确率,我们应该把图像采集步骤和车牌定位步骤结合起来考虑。
例如我们应该尽量提高采集到图像的清晰度,减少光照变化对采集图像的影响,使采集到的图像的背景尽量简单,不要包含与汽车牌照类似的区域。
如果现场采集到的图像中背景比较简单,车牌区域占整幅图像的面积比例较高,图像中车牌没有发生几何畸变,车牌定位可以采用一步定位法。
即直接对图像中的车牌进行搜索,定位出车牌的位置。
如果图像的背景复杂,车牌又有一定的变形,则采用一步定位方法很难得到车牌的精确边界。
这种情况下,我们一般要采用两次定位方法,首先设计算法初步定位出车牌的位置,然后对利用数学形态学方法对初定位的车牌进行二值化、几何校正等处理。
如果初定位得到不止一个车牌区域,必须对这些区域进行判断,去除伪车牌。
然后对初定位的车牌进行二次定位,精确确定车牌的上下边界和左右边界,得到车牌的精确定位结果。
图像分割的研究多年来一直受到人们的高度重视,至今已经提出了上千种各类型的分割方法。
随着各学科的发展,人们将许多新的理论和方法用于图像分割中,得到一些新的图像分割技术,包括基于数学形态学的分割方法、基于神经网络的分割方法、基于小波变换的分割方法、基于分型理论的分割方法、另外,由于成像设备和技术的发展,人们也深入的研究了一些特殊的图像分割技术,如三维图像、彩色图像、纹理图像、视频图像等分割方法。
图像分割是图像处理进入到图像分析的关键步骤。
对特征提取和目标识别有十分重要的影响,本文就数学形态学的图像分割方法进行了研究和探讨。
另外,利用数学形态学技术进行车牌分割还有一个十分显著的特点,那就是所采用分割算法的好坏直接影响到识别的正确率和识别速度。
所以,研究基于数字图像处理的车牌分割识别方法,努力提高车牌识别算法的性能具有十分重要的实际意义。
数学形态学是一门建立在严格数学理论基础上,分析研究空间结构的形状、框架的学科。
它主要以积分几何、集合代数及拓扑论为理论基础,此外还涉及随机集论、是近代数和图论等一系列数学分支[1]。
数学形态学的理论虽然很复杂,被称为“惊人的数学”,但它的基本思想却是简单而完美的。
数学形态学的基于集合的观点是极其重要的。
这意味着它的运算由集合运算(如并、交、补等>来定义,并且所有的图像都必须以合理的方式转换为集合。
这一基于集合观点的一个自然的结果是:
形态学算子的性能主要以几何方式进行刻画,传统的理论却以解读的方式来描述,而几何描述的特点似乎更适合视觉信息的处理和分析。
最基本的形态学算子有:
膨胀、腐蚀、开、闭。
用这些算子及其组合来进行图像形状和结构的分析及处理,可以解决抑制噪声、特征提取、边缘检测、形状识别、纹理分析、图像恢复与重建等方面的问题。
从形态学图像处理的基本思想不难看出,它有其独有的特性。
它反映的是一幅图像中像素点间的逻辑关系,而不是简单的数值关系。
它是一种非线性的图像处理方法,并且具有不可逆性。
它还可以并行实现,并可以用来描述和定义图像的各种集合参数和特征。
基于数学形态学的方法对车牌图像进行分割是使用一定的结构元素,利用数学形态学中的开运算与闭运算来对图像进行处理,得到多个可能是车牌的区域,然后在处理后的图像中用多区域判别法在多个可能是车牌的区域中找到车牌的正确的位置。
字符分割的方法主要有基于车牌字符特征的投影法和基于聚类分析的车牌字符分割方法以及气泡法等。
投影法首先计算牌照字符的垂直投影,利用投影直方图得到一个阈值,然后再结合车牌字符固定宽度、间距的比例关系等先验知识来分割字符。
基于聚类分析的车牌字符分割方法按照属于同一个字符的像素构成了一个连通域的原则,再结合牌照的先验知识来进行字符分割。
气泡法是一种适用于二值图像的区域增长法。
它把一幅图像分成许多小区域,这些初始的区域可能是小的邻域甚至是单个像素。
在每个区域中,对经过适当定义能反映一个物体内成员隶属程度的性质(度量>进行计算。
首先给每个区域一组参数来反映这些区域分别属于哪个物体。
接下来对相邻区域的所有边界进行考查,相邻区域的平均度量之间的差异是计算边界强度的一个尺度,经过反复迭代,每一步都重新计算被扩大区域的物体成员的隶属关系,并消除弱边界,当没有可以消除的弱边界时,区域合并的过程结束。
本文所做的主要工作如下:
(1>.研究了用于车牌图像分割的基础理论,如数字图像处理、数学形态学等。
重点研究了数学形态学图像分割算法,包括图像的二值化、灰度变换增强、图像边缘检测等。
(2>.查阅了大量文献和资料,在研究近年来一些典型车牌图像分割算法的基础上,确定利用数学形态学进行车牌图像分割。
(3>.对文中的车牌图形定位和分割算法在Matlab下进行编程实现,并进行了仿真,并对实验和结果进行分析。
1图像分割基本理论
1.1图像分割的概念
图像技术在广义上是对各种与图像有关技术的总称。
图像技术的种类很多,跨度很大,但可以将它们归在一个整体的框架——图像工程之下。
根据抽象程度和研究方法的不同,图像工程可分为三个层次:
图像处理,图像分析,图像理解。
图像处理着重强调在图像之间进行变换以改善图像的视觉效果。
图像分析则主要是对图像的描述。
图像理解的重点是在图像分析的基础上,进一步研究图像中各个目标的性质和他们之间的相互关系,并得出对原始图像或客观场景的解释,从而指导规划行动。
图像处理,图像分析和图像理解具有不同的操作对象,图像处理是比较低层次的操作,它主要在图像像素级上进行处理。
图像分析则进入到了中层,侧重于对像素集合—目标的表达测量描述。
图像理解主要是高层操作,基本上是对从描述中抽象出来的数据符号进行运算推理。
在对象的研究和应用中,人们往往仅对图像中的某些部分感兴趣。
这些部分常称为目标或前景<其他部分称为背景),他们一般对应图像中特定的、具有独特性质的区域。
为了辨识和分析目标,需要将它们分离提取出来,在此基础上才有可能对目标进一步利用。
图像分割就是把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。
这里的特性可以是像素的灰度,颜色,纹理等,预先对应的目标可以是单个区域,也可以是多个区域。
多年来人们对图像分割提出了不同的解释和表达,可以借助集合的概念对图像分割给出比较正式的定义[2]:
令集合R代表整个图像区域,对R的分割可以看作将R分成N个满足以下五个条件的非空子集<子区域)
(1>.
;
(2>.对所有的i和j,i≠j,有
;
(3>.对i=1,2,…,N,有
;
(4>.对i≠j,有
;
(5>.对i=1,2,…,N,
是连通的区域。
<1-1)
式中:
----对所有在集合
中元素的逻辑谓词;
----空集。
条件1指出在对一幅图像分割结果中全部子区域的总和<并集)应能包括图像中的所有像素<就是原图像)或者说分割应将图像中每个像素都分进某一个子区域中;条件2指出再分割结果中各个子区域是互不重叠的,或者说再分割结果中一个像素不能同时属于两个区域;条件3指出在分割结果中每个子区域都有独特的特性,或者说属于同一个区域中的像素应该具有某些相同特性;条件4指出在分割结果中,不同的子区域具有不同的特性,没有公共元素,或者说属于不同区域的像素应该具有一些不同的特性;条件5要求分割结果中同一子区域内的像素应当是连通的,即同一个子区域内的任两个像素在该子区域内互相连通,或者说分割得到的区域是一个连通的组元。
另外,上述这些条件不仅定义了分割,也对分割有指导作用。
对图像的分割总是根据一些分割准则进行的。
条件1和条件2说明正确的分割准则应可适用于所有区域和所有像素,而条件3和条件4说明合理的分割准则应能帮助确定各区域像素有代表性的特性,条件5说明完整的分割准则应直接或间接地对区域内像素的连通性有一定的要求或限定。
需要指出的是,实际应用中图像分割不仅要把一幅图像分成满足以上五个条件的各具特性的区域,而且需要把其中感兴趣的目标区域提取出来,只有这样才算是真正的完成了图像分割任务。
在图像工程中,图像分割是由图像处理过渡到图像分析的关键步骤:
一方面,它是目标表达的基础,对特征测量有重要影响;另一方面,因为图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形式,使得更高层的图像分析和理解成为可能。
图像分割在实际中已得到广泛的应用,例如在工业自动化,在线产品检测,生产过程控制,文档图像处理,遥感和生物医学图像分析,保安监视,以及军事,体育,农业工程等方面。
概括来说,在各种图像应用中,只要需对图像目标进行提取,测量等都离不开图像分割。
可见,图像分割在图像工程中有着十分重要的地位和影响。
1.2传统的图像分割方法
1.2.1基于边界的分割方法
基于边界的分割方法是利用不同区域间像素灰度不连续的特点检测出区域间的边缘,从而实现图像分割。
边缘检测是所有基于边界分割方法的第一步,根据处理的顺序,边缘检测可分为并行边缘检测和串行边缘检测。
图像中相邻的不同区域间总存在边缘,边缘处像素的灰度值不连续,这种不连续性可通过求导数来检测到。
对于阶跃状边缘,其位置对应一阶导数的极值点,对应二阶导数的过零点(零交叉点>。
因此常用微分算子进行边缘检测,它是一种并行边界技术。
常用的一阶微分算子有Roberts、Prewit、和Sobel算子、二阶微分算子有Laplace和Kirsh算子等。
在实际中各种微分算子常用小区域模板来表求,微分运算是利用模板与图像卷积来实现。
这些算子对噪声敏感,只适合于噪声较小不太复杂的图像。
由于边缘和噪声都是灰度不连续点,在频域均为高频分量,直接采用微分运算难以克服噪声的影响。
因此用微分算子检测边缘前要对图像进行平滑滤波。
Log算子和Canny算子是具有平滑功能的二阶和一阶微分算子,边缘检测效果较好。
其中Log算子是采用Laplacian算子求高斯函数的二阶导数。
Canny算子是高斯函数的一阶导数,它在噪声抑制和边缘检测之间取得了较好的平衡。
串行边界查找法是先检测边缘再串行连接成闭合边界的方法,这种方法在很大程度上受起始点的影响。
图搜索是其中一种典型的方法,边界点和边界段可以用图结构表示。
通过在图中进行搜索对应最小代价的路径可以找到闭合边界,它是一种全局的方法。
在噪声较大时效果仍很好,但这种方法比较复杂,计算量也很大。
在许多情况下,为加快运算速度常常使用动态规划的优化方法,它是借助有关具体问题的启发性知识减少搜索,只求次优解的方法。
1.2.2基于阈值的分割方法
阈值分割方法的历史可追溯到近40年前,现己提出了大量算法,对灰度图像的阈值分割就是先确定一个处于图像灰度取值范围之中的灰度阈值,然后将图像中各个像素的灰度值都与这个阈值相比较,并根据比较结果将对应的像素分为两类。
这两类像素一般分属图像的两类区域,从而达到分割的目的。
从该方法中可以看出,确定一个最优阈值是分割的关键。
现有的大部分算法都是集中在阈值确定的研究上。
阈值分割方法根据图像本身的特点,可分为单阈值分割方法和多阈值分割方法;也可分为基于像素值的阈值分割方法、基于区域性质的阈值分割方法和基于坐标位置的阈值分割方法。
若根据分割算法所有的特征或准则,还可以分为直方图与直方图变换法、最大类间方差法、最小误差法与均匀化误差法、共生矩阵法、最大熵法、简单统计法与局部特性法、概率松弛法、模糊集法、特征空间聚类法、基于过渡区的阈值选取法等。
阈值分割的优点是计算简单,运算效率较高,速度快。
全局阈值对于灰度相差很大的不同目标和背景能进行有效的分割。
当图像的灰度差异不明显或不同目标的灰度值范围有重叠时,应采用局部阈值或动态阈值分割法。
另一方面这种方法只考虑像素本身的灰度值,一般不考虑空间特征,因而对噪声很敏感。
在实际应用中,阈值法通常与其他方法结合使用。
1.2.3基于区域分割的图像分割方法
区域分割的实质就是把具有某种相似性质的像素连通起来,从而构成最终的分割区域。
它利用了图像的局部空间信息,可有效的克服其它方法存在的图像分割空间不连续的缺点,但它通常会造成图像的过度分割。
在此类方法中,如果从全图出发,按区域属性特征一致的准则,决定每个像元的区域归属,形成区域图,这常称之为区域生长的分割方法;如果从像元出发,按区域属性特征一致的准则,将属性接近的连通像元聚集为区域是区域增长的分割方法;若综合利用上述两种方法,就成为分裂一合并的方法。
区域生长法的基本思想是将具有相似性质的像素合起来构成区域,具体做法是先给定图像中要分割的目标物体内的一个小块或者说种子区域,再在种子区域的基础上不断将其周围的像素点以一定的规则加入其中,达到最终将代表该物体的所有像素点结合成一个区域的目的,该方法的关键是要选择合适的生长或相似准则。
生长准则一般可分为3种:
基于区域灰度差准则、基于区域内灰度分布统计性质准则和基于区域形状准则。
区域生长法要解决的主要问题是区域生长准则的设计和算法的高效性。
生长准则往往和具体问题有关,直接影响最后形成的区域,如果选取不当,就会造成过分割和欠分割的现象。
区域生长法的优点是计算简单,对于较均匀的连通目标有较好的分割效果。
它的缺点是需要人为确定种子点,对噪声敏感,可能导致区域内有空洞。
另外,它是一种串行算法,当目标较大时,分割速度较慢。
因此在设计算法时,要尽量提高效率。
分裂合并法是先将图像看成很多的一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的。
分裂合并法的基本思想是从整幅图像开始通过不断分裂合并得到各个区域。
分裂合并法的关键是分裂合并准则的设计。
这种方法对复杂图像的分割效果较好,但算法较复杂,计算量大,分裂还可能破坏区域的边界。
1.3特殊理论工具的图像分割方法
图像分割至今为止尚无通用的自身理论。
近年来,随着各学科许多新理论和新方法的提出,人们也提出了许多与一些特定理论、方法和工具相结合的分割技术。
(1>.基于数学形态学的分割技术。
其基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。
如基于图像最大内切圆的数学形态学形状描述图像分割算法和基于目标最小闭包结构元素的数学形态学形状描述图像分割算法、分水岭区域分割法和聚类快速分割法等。
由于形态学对图像分割具有优异的特性,使其在未来的图像分割中起主导作用。
但该方法的主要缺陷还不能很好地解决耗时问题,将其与一些节约时间的措施结合起来,是图像分割的一种趋势。
(2>.基于模糊技术的图像分割方法。
基于模糊集合和逻辑的分割方法是以模糊数学为基础,利用隶属解决图像中由于信息不全面、不准确、含糊、矛盾等造成的不确定性问题,该方法在医学图像分析中有广泛的应用。
(3>.基于人工神经网络技术的图像分割方法。
基于神经网络的分割方法的基本思想是通过训练多层感知机来得到线性决策函数,然后用决策函数对像素进行分类来达到分割的目的。
近年来,还出现了人工神经网络技术和模糊技术结合应用于图像分割中的方法。
(4>.遗传算法在图像分割中的应用。
遗传算法是基于进化论自然选择机制的、并行的、统计的、随机化搜索方法。
(5>.基于小波分析和变换的分割技术,是一种多尺度多通道分析工具,比较适合对图像进行多尺度的边缘检测。
1.4图像分割的评价
1.4.1各种图像分割方法分割图像的基本依据和条件
分析各种图像分割方法可以发现以下几方面:
(1>.分割的图像区域应具有同质性,它们分割图像的基本依据和条件有以下如灰度级别相近、纹理相似等。
(2>.区域内部平整,不存在很小的小空洞。
(3>.相邻区域之间对选定的某种同质判据而言,应存在显著差异性。
(4>.每个分割区域边界应具有齐整性和空间位置的准确性。
现有的大多数图像分割方法只是部分满足上述判据。
如果加强分割区域的同性质约束,分割区域很容易产生大量小空洞和不规整边缘;若强调不同区域间性质差异的显著性,则极易造成非同质区域的合并和有意义的边界丢失。
不同的图像分割方法总有在各种约束条件之间找到适当的平衡点。
1.4.2图像分割评价
图像分割评价对于指导分割任务具有极为重要的意义。
通过对图像分割算法的对比评价,可以帮助针对特定的分割任务选择最优的分割算法;通过对分割结果进行评价,可以进一步分析所选算法的有效性,或评判新的图像分割算法的分割性能。
图像分割评价可以使用主观评价与客观评价,主观评价易受到观察者的主观因素影响,且不易量化,不易被计算机自动运算。
客观评价方法需要定义合适参数,客观性强,便于量化计算,但参数的定义往往针对具体问题,目前还没有统一的量化标准。
把图像分割评价方法分为三类:
分析方法,经验好坏方法,经验差异度方法。
其中分析方法主要对算法本身进行参数分析,如算法复杂度等,复杂度越大说明算法运算时间越长,算法越差。
经验好坏评价方法不需要客观分割结果,使用区域非均匀性、熵等参数评价分割结果的好坏。
经验差异度方法需要客观真实的分割结果作为参照进行评价,所涉及的参数衡量的是实际分割结果与理想分割结果的“差异”,常见的差异度参数有最终测量精度、错分概率、变形率等。
经验好坏的评价未使用参考图像,其结果受不同图像的影响较大。
经验差异度是一种经常使用的客观评价方法,但客观真实分割结果一般由人工分割得到,本身具有一定的主观性且工作量较大,差异度参数的构造往往也是局限于某类图像的评价。
提出一种包含性能分析、图像合成、算法测试三个模块的分割评价框架,该框架可用于评价大多数分割算法,并有助于选择合适的图像分割方法。
尽管已经提出了许多图像分割评价算法,图像分割的研究仍缺乏可靠的、通用的评价手段,仍需要新的图像分割评价框架、评价指标的研究。
2数学形态学基本理论
2.1形态学的概念
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 形态学 图像 分割 方法 研究 报告