图像分割技术的研究报告文档格式.docx
- 文档编号:16529221
- 上传时间:2022-11-24
- 格式:DOCX
- 页数:14
- 大小:58.63KB
图像分割技术的研究报告文档格式.docx
《图像分割技术的研究报告文档格式.docx》由会员分享,可在线阅读,更多相关《图像分割技术的研究报告文档格式.docx(14页珍藏版)》请在冰豆网上搜索。
计科0906
学号
04091178
时间
至
2012年10月14日
2012年12月28日
图像分割技术的前景及研究意义:
在计算机视觉,模式识别中,常常要将一些图像分割成一些有意义的区域,或者将图像中的有意义的特征提取出来,以便机械识别和检验。
因此,图像分割是图像处理中最基本最重要的技术之一,它是任何理解系统和自动识别系统必不可少的一个重要环节。
数字图像处理技术是一个跨学科的领域。
随着计算机科学技术的不断发展,图像处理和分析逐渐形成了自己的科学体系,新的处理方法层出不穷,尽管其发展历史不长,但却引起各方面人士的广泛关注。
首先,视觉是人类最重要的感知手段,图像又是视觉的基础,因此,数字图像成为心理学、生理学、计算机科学等诸多领域内的学者们研究视觉感知的有效工具。
其次,图像处理在军事、遥感、气象等大型应用中有不断增长的需求。
图像分割技术的需求分析:
分水岭分割方法:
分水岭的计算过程是一个迭代标注过程。
分水岭比较经典的计算方法是L.Vincent提出的。
在该算法中,分水岭计算分两个步骤,一个是排序过程,一个是淹没过程。
首先对每个像素的灰度级进行从低到高排序,然后在从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。
区域增长算法:
对格网数据点逐格网单元扫描,当找不到这样的地物点时结束操作;
把这个点同周围的8-邻域点比较,若小于阈值,则合并到同一区域,并对合并的地物点赋予该区域的标记;
从新合并的地物点开始,反复进行上述的操作;
反复进行上述两部的的操作,直到不能合并为止;
返回最初的操作,寻找新区域出发点。
K均值聚类算法:
K-均值聚类算法的基本思想随机选取K个点作为初始聚类中心,计算各个样本到聚类中心的距离,把样本归到离它最近的那个聚类中心所在的类,对调整后的新类计算新的聚类中心。
如果相邻两次的聚类中心没有任何变化说明样本调整结束,聚类准则函数已经收敛。
K-均值聚类算法中重要的一步是初始聚类中心的选取,一般是随机选取待聚类样本集的K个样本,聚类的性能与初始聚类中心的选取有关,聚类的结果与样本的位置有极大的相关性。
一旦这K个样本选取不合理,将会增加运算的复杂程度,误导聚类过程,得到不合理的聚类结果。
通过粗糙集理论提供,K-均值聚类所需要的初始类的个数和均值,提高了聚类的效率和分类的精度
基于拓扑结构图的分割:
定义扫掠面周长在扫掠结点之间的积分为骨架树中分支的面积并将此面积定义为几何函数定义拓扑函数为相邻两个扫掠面拓扑差异的符号函数。
并定义了基于微分几何和拓扑函数的关键点。
整个过程无需用户干涉。
图像分割技术可行性分析:
图像分割技术的研究,了解图像分割技术的实际应用,与图像分割方法,支持向量机构和原理研究,用Matlab编程实现图像分割技术,具体用支持向量机方法来实现,使用Matlab进行编程。
并直观展现图像分割结果。
分水岭算法的可行性实现:
分水岭变换得到的是输入图像的集水盆图像,集水盆之间的边界点,即为分水岭。
显然,分水岭表示的是输入图像极大值点。
因此,为得到图像的边缘信息,通常把梯度图像作为输入图像,即
g(x,y)=grad(f(x,y))={[f(x,y)-f(x-1,y)]2[f(x,y)-f(x,y-1)]2}0.5
式中,f(x,y)表示原始图像,grad{.}表示梯度运算。
分水岭算法对微弱边缘具有良好的响应,图像中的噪声、物体表面细微的灰度变化,都会产生过度分割的现象。
但同时应当看出,分水岭算法对微弱边缘具有良好的响应,是得到封闭连续边缘的保证的。
另外,分水岭算法所得到的封闭的集水盆,为分析图像的区域特征提供了可能。
为消除分水岭算法产生的过度分割,通常可以采用两种处理方法,一是利用先验知识去除无关边缘信息。
二是修改梯度函数使得集水盆只响应想要探测的目标。
为降低分水岭算法产生的过度分割,通常要对梯度函数进行修改,一个简单的方法是对梯度图像进行阈值处理,以消除灰度的微小变化产生的过度分割。
即
g(x,y)=max(grad(f(x,y)),gθ)
式中,gθ表示阈值。
区域增长算法的可行性实现:
1)对格网数据点逐格网单元扫描,当找不到这样的地物点时结束操作;
(2)把这个点同周围的8-邻域点比较,若小于阈值,则合并到同一区域,并对合并的地物点赋予该区域的标记;
(3)从新合并的地物点开始,反复进行
(2)的操作;
(4)反复进行
(2)、(3)的操作,直到不能合并为止;
(5)返回
(1)操作,寻找新区域出发点。
K均值聚类算法的可行性实现:
第一步:
选K个初始聚类中心,z1
(1),z2
(1),…,zK
(1),其中括号内的序号为寻找聚类中心的迭代运算的次序号。
聚类中心的向量值可任意设定,例如可选开始的K个模式样本的向量值作为初始聚类中心。
第二步:
逐个将需分类的模式样本{x}按最小距离准则分配给K个聚类中心中的某一个zj
(1)。
假设i=j时,,则,其中k为迭代运算的次序号,第一次迭代k=1,Sj表示第j个聚类,其聚类中心为zj。
第三步:
计算各个聚类中心的新的向量值,zj(k+1),j=1,2,…,K
求各聚类域中所包含样本的均值向量:
其中Nj为第j个聚类域Sj中所包含的样本个数。
以均值向量作为新的聚类中心,可使如下聚类准则函数最小:
在这一步中要分别计算K个聚类中的样本均值向量,所以称之为K-均值算法。
第四步:
若,j=1,2,…,K,则返回第二步,将模式样本逐个重新分类,重复迭代运算;
若,j=1,2,…,K,则算法收敛,计算结束。
基于拓扑结构图的分割的可行性实现:
通过微积分反复计算定义面积的拓扑函数,找出拓扑结构的函数,过程无需用户干预。
对图像分割算法的研究已有几十年的历史,借助各种理论至今已提出了上千种各种类型的分割算法。
尽管人们在图像分割方面做了许多研究工作。
但由于尚无通用分割理论,因此现已提出的分割算法大都是针对具体问题的,并没有一种适合于所有图像的通用的分割算法。
但是可以看出,图像分割方法正朝着更快速、更精确的方向发展,通过各种新理论和新技术结合将不断取得突破和进展.
参考文献
TheDevelopmentofAKindofOnlineImageCodeRecognitionSystem
Abstract:
Thispaperdescribesthedesignandtheimplementofonlineimagecodingcharrecognitionsystem.Itanalysesandresearchestheimportantcontentsaboutthesystem.Thenitprovidesthesolutionsofmainproblems.Inrecognitionalgorithm,combiningtemplatematchingwithfeaturerecognition,itputforwordanimprovedtemplatematchingalgorithmbasedonfeatureweights.Thealgorithmcanobviouslyimprovethecharrecognitionratio.
Keyword:
imageprocessing;
patternrecognition;
featureweights;
softwaredesign
0Introduction
Characterrecognitionofimagecodingisstillthesubjectofintensestudyathomeandabroad,ithasbroadapplications,suchasAutomaticnumberplaterecognition,postalcodeoftheautomaticidentification,automaticreadingpapers,reports,automaticprocessing,becauseofthisonlineimagecodedcharacterrecognitionhassomecommon,thispaperonlinetirecodingcharacterrecognitionsystemforthegeneralimagecodingcharacterrecognitionsystemhasbeenelaboratedonthekeylinkoftheresearchandanalysis,themethodoftheotheronlineimagecodedcharactersystemDevelopmentofguidingsignificance.
1Anonlineimagecodingidentificationsystemprocesses
Onlineimagecodingcharacterrecognitionsystemincludesdigitalimagecapture,storage,imagepreprocessing,encodingtheimageextraction,featureextractioncoding,codingidentificationandfollow-uptreatmentofsomeaspectsofitsflowchartshowninFigure1.
Figure1-linecharacterrecognitionimagecodingsystemflowchart
Onlinetireimagecodingcharacterrecognitionsystemrequirestheproductionpipelinethroughtheacquisitionofeachtirewithtireencodedimage,andthenthroughimageprocessing,codingtoextractfeaturesofthetire,usingtheappropriaterecognitionalgorithmtoidentifyeachcodedcharacter.Tirecodingcharactersasacertaindeformationinthetires,anddifferentcameraangles,arealsogreatdifferencesinthecodingimages,regularityispoor,socodedimagepreprocessingandrecognitionalgorithmsofselectionisveryimportant.
2ImageAcquisitionandStorage
Linecodingcommonlyuseddigitalcameraimages,digitalcameras,digitalvideocamerascaptureandprocessedincomputer,thesystemusesQuickCamPro4000tirecodingdigitalcameraimagecapture,directlyfromJPGformat.
CodedimagesgenerallymustfirstconvertBMPimageformat,becausetheBMPformathasbecomethedefactostandardPCinthefield-almostalloftheWindowsoperatingsystemdesignedforimageprocessingsoftwaretosupportthisformatoftheimage.BMPistheoriginalWindowsbitmapformat,whichcanbeusedtosaveanytypeofdigitalmapdata,cansupportallWindowssupportedscreenresolutionandcolorcombination.Undernormalcircumstances,inordertoensurethedisplayofhighefficiency,itdoesnothaveanycompressedimagedata,soasmallbitmapmayoccupyconsiderablespace.
BMPbitmapfileincludesthebitmapfileheader,bitmapinformationheader,palette,bitmapdataareaoffourparts,bitmapfileheaderfrom14bytesconstitutethebitmapheaderfrom40bytescomposition,tonecolorpalettedependsonthenumberofmonochromecolorimages.
Boardaccountedfor8bytes,16-colorpaletteimagesaccountedfor64bytes,256-colorpaletteimage1024bytestotal,224-colorimageswithoutcolorpalette,thebitmapdatafromtheregionundertheorderofthedatabyrowandonthearrangementfromlefttoright.
3Preprocessing
Imagepreprocessingincludesare:
grayimage,imagenoisereductionandenhancement,coding,edgedetection,imagegeometrycorrection,imagecodingregionofextraction,encodingimagebinarization,charactersegmentation,characternormalizationandsoon.Herearesomekeyaspectsoftheprocess.
3.1grayimageprocessing
Imagesareusuallycolorcoded,theactualidentificationwiththeimageisgrayscale,wheretheneedtoconvertfirstcolor-codedimagestograyscale.IntheRGBcolormodel,ifR=G=B,thencolor(R,G,B)indicatesaBlackwhitecolor,inwhichR=G=Biscalledthevalueofgrayvalue,graylevelprocessingistomakethecoloroftheR,G,Bcomponentvalueequaltotheprocess.Gray-scaleprocessingmethodsarecommonlyusedweightedaveragemethod,thatis,
R=G=B=(WRR+WGG+WBB)/3
Which,WR,WG,WBaretheR,G,Btheweightofexperimentalandtheoreticalproof,whenWR=0.3,WG=0.59,WB=0.11,thatiswhenR=G=B=0.30R+0.59G+0.11B,canbethemostreasonablegrayscale.
3.2imageenhancementprocessing
3.2.1Directgray-scaletransformation
①lineargrayleveltransformation:
iftheimagegrayscaleislinear,asintheoriginalimagef(x,y)gray-scalerangeof[a,b],askedthetransformedimageintensityrangeofupto[c,d],Accordingtothelinearlaw,thetransformedimageg(x,y)as:
(1)
②nonlineartransformation--logtransformationandexponentialtransformation:
Whentheneedtoexpandlowgrayzone,grayzoneofhighcompressionusedonthelogtransformation,whentheneedtoexpandtheuseofhighgrayareaindextransformation.
3.2.2smoothingfilter-NoiseReduction
Asthenoiseintheareacorrespondingtotheedgeoftheimagegrayvalueofsuchrapidchangewithalargerpartisahighfrequency,sotheuseoflow-passfilter(ie,smoothingfilter)noise.Atthesametimecanmaketheimagefuzzysmoothingisbeneficialtothelargergoaloftheextractionpriortoremovalofthesmallerdetailsortotargetthesmallinterruptionlink.
Smoothingnoisereductionmethodistousethetemplateontheimageconvolutionoperation,linearsmoothingfilteristhemostcommonlyusedtemplateisshowninFigure2ofthe3×
3template,thistemplateandimageinpixelsbythefollowingmethodofconvolution,getsmoothimagenoisereduction.
1Inthefigure,roamingthetemplateandthetemplatecenterandmaplocationofeachpixeloverlap;
2thetemplateonthecoefficientmultipliedwiththetemplateunderthecorrespondingpixel;
3addalltheproduct;
4Itwillassignthefigurecorrespondstothetemplateandthecenterofthepixel.
Themostcommonlyusednon-linearsmoothingfilterismedianfilter,itwillallofthevaluesoftheregionaresortedaccordingtosize,willbesortedinthemiddleofthepixelvaluesgiventothecenterpixel.Medianfiltercaneffectivelyremovetherandomnoise,cangetabettervisualeffect.
3.3Edgedetectioncoding
Edgeistheresultofdiscretegrayvaluecanbeusedtorequestthefirstandsecondderivativemethodtodetect.Becausethederivativeoftheedgeofalargearea,ratherthanthelocalderivativeoftheedgeofthesmall.Asthedigitalimageisdiscrete,notthederivative,convolutionmethodcanreplacethedifferentialwiththedifferentialapproximation.
IsbetterSobeledgedetectionalgorithmisoperator.Sobeloperatorisagradientamplitude
respectively,usingverticaloperatorSx,Syoperatortoobtainthelevelofthecodingregionoftheverticaledgesandhorizontaledges,thatis,thehorizontalandverticaldirectio
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 分割 技术 研究 报告