智能图像信息处理技术及应用分析.docx
- 文档编号:27341960
- 上传时间:2023-06-29
- 格式:DOCX
- 页数:218
- 大小:8.74MB
智能图像信息处理技术及应用分析.docx
《智能图像信息处理技术及应用分析.docx》由会员分享,可在线阅读,更多相关《智能图像信息处理技术及应用分析.docx(218页珍藏版)》请在冰豆网上搜索。
智能图像信息处理技术及应用分析
智能图像信息处理技术及应用分析
摘要
信息的自动识别和理解是智能图像模式识别系统的核心技术,它涉及到图像处理、神经科学、心理科学以及人工智能等多个交叉学科,是未来人工智能发展的重点,具有广阔的应用前景。
本文对人脸检测识别和车辆牌照识别这两种典型的智能图像模式识别系统进行了深入的研究,对其中的一些关键环节进行了大胆的创新.提出了一些新颖的具有独创性的思路和方法。
本论文在以下几个方面对实际的图像模式识别技术作了大胆的研究和探索:
第一是人脸识别系统中的人脸定位技术,主要鉴于往往人脸定位比人脸识别更为困难.在该方面投入较大的精力。
对真彩色人脸图像检测,分析了肤色样本的色彩特征及其在各个色彩空间的分布情况和分割特性,分别构造了基于RGB空间和YIQ空间的肤色模型。
并且针对可能存在大量非肤色干扰的情况提出了一种利用人脸轮廓和纹理特征来缩小分割区域的分割方法。
在此过程提出了一种简易的基于轮廓和纹理特点的区域填充方法,~种独创的依据人脸长宽信息的区域修整方法,以及两种完整的彩色人脸图像分割的流程。
实验表明这些方法是高效且可靠的。
对于非真彩色或肤色信息不可利用的人脸检测,分析了人体的轮廓分布特点,并据此提出了一种完全依赖轮廓和纹理特征的人脸区域分割方法。
在此过程中提出了一种独创的对狭窄带:
嵌区域敏感的区域填充方法,一种全新的基于人体轮廓分布的区域修整方法,以及完整的不依赖肤色信息的人脸区域分割流程。
第二,对于人脸特征检测,提出了~种改进的基于瞳孔特征的眼部区域定位技术。
在此过程中进一步改进和完善了基于轮廓和纹理特点的区域填充技术。
第三,对于车牌照识剐系统中的牌照定位技术,简要分析了目前常用的牌照定位方法的优缺点,提出了一种独创的全新的基于牌照形状和纹理特性的牌照分割定位方法。
该方法的特点是
a、定位精确.无须针对特定环境设置专用的参数,只需要一个流程就可以
分割定位出车牌:
b、不依赖于颜色和光照,并且同时适用于多种颜色、灰度、大小、规格的车牌照.对复杂背景具备极高的抗干扰能力和分割鲁棒性。
c、算法核心简单,运算量小,满足实时的帧量级的处理,并且易于机器编
程实现。
并且在此过程中提出了多值填充的思想以及动态差分和动态长度的概念。
第四,针对真彩图像的特点,提出了一种改进的真彩色增强方法,介绍了光线补偿
的思想和具体实现。
介绍了图像质量评价的方法和进行了具体的实验。
过程中刨造性地提出利j{}j连通区域消除字符嗓声的心恕,提出利用字符纹理、长宽、间距
信息作为定位基础的高效字符分割方法和字符分裂俞并方法。
第六,根据车牌烈识别系统中的倾斜问题,刨造性地提出了基于二值字符纹理和统计特点,完全不依赖丁边缘检测的水平倾斜矫正方法羽』垂直倾斜矫正方法,在此过程中提出了跨栏模型的概念,窄孔投射的概念。
它*】包括:
一
a、基于跨栏模型的水平倾斜检测方法;b、基于窄孔投射模型的垂直倾斜检测方法。
它们的优点在于完全摆脱了传统倾斜检测方法如Hough变换对边缘的依赖,同时由于它们是基于二值字符的整体排布规律来进行,具有极强的抗干扰能力和可调整的检测精度。
关键词模式识别人脸检测人脸识别车牌识*4特征检洲肤色模型区域分割多值填充动态修整连通区域噪声消除倾斜纠正跨栏模型窄孔透射
Abstract
AutoinformationComprehension&Recognitionisontofthekeytechnologiesofjntellectualizedpatternrecognizingforimages.1tinvolvesseveraIIntersectantacademicsubjectsuchasimageprocessing.neurology,psychology&artificialintelligence.AnditisoneoftheemphasesofartificiaIintelligence&ofwidedevelopmentfuture.Thispaperdevelopsthekeytechnologiesoftypicalintellectualizedimagepalternrecognizingsystem.suchashumanfacesrecognition.1icenseplatesrecognition.InseveraIkeytacheofIhemweputforwardsomeadventurousinnovationandoffersomeoriginal&creativeidealsandapproachs.
Firslofa¨,tosolvetheproblemofcolorhumanfacesdetecting,weanalysedthecolorcharacterofhumanskincolorsamples&itsexpressiveforceindifferencecolormodeIspaces.WiththeseanalysisweconstructeddifferencecolormodelforhumanskinincolorspacesofRGB&YIQ.TosolvetheproblemthattheremaybeaIotsofnon.skinnoiseinbackground.weputforwardaapproachtoreducenoiseareabasedonthefeaturesofhuman
faces’outline&texture.1nperiodofitweputforwardasimpleapproachtofilJ
areaandaoriginaIapproachforareaadjustment&division.Atthesametime
twodifferenceprocessingforcolorhumanfacesdividingalsowereput
forward.ActuaIapplyingtoreaIsystemhasprovedjtsvalidity.
Forthenon.colorimagesorthoseinwhichinformationofhumanskin
colorisoutofnormaIrange.weanalysethefeaturesofhumanbodys’outline
anddesignaapproachforhumanfaces‘dividingbasedentirelyonhumanbodys’outline&faciaIfeatures.Wealsodevelopssomeapproachswhenwe
testil.suchastheapproachforfillingareawhichissensitivetoIong&narrowarea..theoriginalapproachforhumanfaces’areaadjustment&divisionbasedonbody’soutline&faciaIfeatures.andtheentireprocessingmodewhichjstotallyindependentofcolorinformation.
Secondly.AnimprovedeyesIocatingapproachforfaciaIfeaturesdetectingbasedonpupilfeaturesisputforward.Inlhisresearchweulteriorlyimprovetheapproachforareafilling.
Thirdly,fortheIocatingtechnologiesofLPRsystem。
weanalysethestrongpoints&shortcomingsofusualwaysandputforwardaoriginalapproachforIicenseIocatingbasedonthefeaturesofIicense’sshapeand
texture.Itsadvantagesincludes:
a.Highlocatingprecision.NeednottochangeparametersetIingwhen
entironmentchanges.NeedonlyacycletoIocateanylicenseplate.
b.1ndeDendenceofcolor&Iightconditions.Bethesamewithdifference
Iicenseplateswhichmayhavedifferencecolors.greylevels。
sizesandtypes.It
alsohavestronganti-noiseabilityandisunsenaitivetocomplexbackground.
c.Havesimpleandsmallprocessingcore.Operatingcostjscontrolledjn
alowlevel.EasytoprogramangappliedtoaPCorwork-station.
Fourthly,AnimprovedcolorEnhancementapproachisputforwardbased
onthefeaturesofcolorimages.IntroducetheideaofIightcompensationand
realizeit.Introuducetheapproachforimagequalityevaluationandperform
somereaItest.
Fifthly。
weputforwardauniversalapproachforeliminatingthenoisewhichmayexistindifferenceprocessingstepofLPRsystern.Inthisresearchwepulforwardanoriginalapproachtoeliminatethenoiseinsidecharacterbasedon
theideaofconnectedcomponents.Wealsoputforwardanapproachusingthefeaturesofcharacters’texture,sizeandspacebetweenaslocatingbenchmarktodividethem.
Finally.basedonthetextUreandstatisticalfeaturesofIicensecharactersintwogreylevelsweputforwardanoriginaIhorizontaISlantrectifing
approachbyusingtheconceptofHurdleModel.andanoriginaIverticalslantrectiifingapproachbyusingtheconceptofTubiformIntempaceProjection.TheadvantageofthemiSinthatitbreaktheIimitthaltraditionaIapproach,suchasHoughtransform,mustdetecteffectiveedges.BecauselhisapproachiSmainlybasedonstatisticaIfeatures.Ithasstrongabilityofanti—noisebesidesanadjustableprecision.
KeyWOrds:
PatternRecOgnizing:
HumanFacesDetecting;HumanFacesRecognition;LicensePlatesRecognition;FeaturesDetecting;SkinColorModel;AreaDivision;Multi-valueFilling;DynamicAdjustment:
ConnectedCompOnents:
NOiseEliminating;SlantRectifing;HurdleModel;TubiformInterspaceProjection
主里翌兰苎查查堂堡主!
些堕苎:
塑壁望堡堡皇望型堑查丝堡旦笙窒——!
第一章绪论1.1模式的概念
我们在日常生活中经常进行模式识别的活动。
比如说。
我们能够分辨出桌子、椅子、汽车、电视,很小的时候就能够分出自己的父母,能够听出是谁的声音,能够进行正常的阅读,这些都是我们习以为常的能力。
在计算机出现以前,没有人对此表现出惊奇,也没有人注意到人类的模式识别能力是一个值得研究的课题。
当计算机出现之后,人工智能开始发展,模式识别也随之成为一个热门课题。
当科学家发现用机器实现或者模仿人类的模式识别能力是如此麻烦的时候,人们才意识到这个问题的难度。
“模式”(PatIem)这个词的原意是指供模仿用的、完美无缺的标本。
这是一个相当含蓄的定义,并且触及了一些相当深奥的论题。
在心理学中,模式识别是作为一个过程来定义的,通过这一过程,到达感觉器官的外界信号被转换成有意义的感性经验。
然而,要精确地定义什么是“有意义的感性经验”,本身就是一件很麻烦的事。
一个主要的问题是模式这一概念是如何形成的。
它可以由演绎或者归纳过程而得到。
首先,我们假定这一概念是观察者本身所固有的,或者假定观察者是通过对许多不完全例子的观察而抽象出这一概念的,当这些被观察的例子被标以一种或几种已给定的模式时,这~过程可以称之为“有导师”的学习。
如果没有这样的标记也同样行之有效的过程,称为“无导师”的学习。
完成这~工作的精神过程显然很复杂,且还不太为我们所知晓。
模式识别是一个不仅被人类也被动物所实行的过程。
并且,在进化的意义上,这个过程有着确定的生存价值。
“抽象化”或者“理想化”也确实允许一个生物以一种相似于由以前的经验所证实行之有效的方法去应付新的同类型情况。
较低等的生物所具备的抽象概念也许只限于危险、食物和交配,而较高级生物所具有的显然更为丰富。
模式识别在生物学意义上的重要性表明,人类和动物的神经系统可能已经发展了行之有效的回路。
我们也许能概括这一观察,而说神经系统对处理具备生存价值的任务要比没有生存价值的任务远远的有效,这样,我们就不会对人类很容易完成一项复杂的模式识别任务,而对做多位数乘法却感到相当困难这一点感到惊奇。
数十年前数字计算机的出现以及其强有力的数值计算能力,使褥人们期望着它也象人脑一样,具备非数值计算的能力。
然而,人们早期的乐观期望并没有成为现实,比起先进的计算机来,人脑的机制更为复杂,计算机在数值计算能力方面超过人类并不代表它的通用计算能力也很强,这种非数值计算能力如何在计算机上实现。
恰恰成为人工智能和机器模式识
别的重要任务。
中国科学技术大学硕士毕业论文智能图像信息识别技术及应用研究2
简单一点说,模式被理解成取自世界有限部分的单一样本的被测量值的综合:
模式识别就是试图确定一个样本的类别属性,即把某一样本归属于多个类型中的某一个类型。
我们这里要研究的是通过机器的自动识别。
这就需要把人们的知识和经验教给机器,为机器制定一些规则和方法,并且让机器具有综合分析和自动分类的判断能力,以便使机器能够完成自动识别的任务。
当机器具备自动识别的能力后,可以完成人们自己难以完成的许多工作。
因此,模式识别技术被广泛地应用于人工智能、计算机工程、机器人学、神经生物学、医学、侦探学以及高能物理、考古学、地质勘探、宇航科学和武器技术等许多重要领域,随着高科技的迅速发展,模式识别技术必将获得更广泛的应用,其基本理论和方法也会越加丰富。
1.2模式空间、特征空间和类型空间从模式识别的技术途径来说,由模式空间经过特征空间到类型空间是模式识别所经历
的过程。
为了说明这些概念,首先解释。
物理上可以觉察到的世界”。
在模式识别范解内,在客观世界里有这样的一些物体和事件,它们各自都能被适当选择的和足够多的函数来描述,或者说它们在物理上都是可以测量的,它们的可测量的有效数据的集合就称为物理上可以觉察到的世界。
显然,这些可测数据,或者说这个世界维数是无限多的。
在物理上可以觉察到的世界里,适当地选择某些物体和事件,我们把它们称为样本,对它们分别进行观测。
如上所述,每个样本的观测数据的综合都构成模式,所有的样本观测数据则构成模式空间。
显然,模式空间的维数与所选择的样本和测量方法有关,也与特定的应用有关,一般说来是很大的,但是有限值。
在模式空间里,每个模式样本都是~个点,点的位置由该模式在该维上的测量数据来确定。
由物理上可以觉察到的世界到模式空间所经历的过程称为模式采集。
模式空间的维数虽然是有限的。
还是非常多的,其中有些并不能有效地揭示样本的实质。
正像人们对事物进行判断之前要进行综台分析一样,机器在做出判断之前也要对模式空间里的各坐标元素进行综合分析,获取最能揭示样本属性的观测量作为主要特征,这些主要特征就构成特征空间。
显然,特征空间的维数大大压缩了。
特征空间的每个坐标都是样本的主要特征,以后简称特征。
每个样本在特征空间里也是一个点,点的位置由该样本的各特征值来确定。
由模式空间到特征空间所需要的综合分析,往往包台适当的变换和选择,称为特征提取和特征选择。
由某些知识和经验可以确定分类准则,称之为判决规则。
根据适当的判决规则,把特征空闻里的样本区分成不同的类型,从而把特征空间塑成了类型空间。
类型空间里不同类型之间的
中国科学技术大学硕士毕业论文智能图像信息识别技术及应用研曼3
分界面,常称为决策面。
类型空间的维数与类型的数目相等.一般地说,小于特征空间的维数。
由特征空间到类型空间所需要的操作是分类判决。
1.3模式识别的应用领域模式识别的应用领域是非常广泛的,通常我们知道的有:
(1)声音(或语言)的识别和理解,
(2)字符及文字的识别和理解:
(3)景物的分析和识别,包括景物中指定特征的目的物的识别,(4)医学信号的识别,包括心电、脑电、超声波形的分析,自动诊断,癌细胞的分析识别等;(5)遥感图片分析,包括根据对遥感图片的分析作出对农作物收成情况的估计等;(6)人脸和指纹的识别;
(7)工业上的自动检查.(8)各种数据的特征识别,根据识别结果自动分类、归档,以备查询、检索等,(9)各种军事用途包括由遥感卫星照片辩识目标(铁路、公路、河流、军事设施等)及其变化,跟踪测量设备所用的模式识别技术,雷达目标的自动识别等。
1.4模式识别系统的构成有两种基本的模式识别方法,即统计模式识别方法和结构(句法)模式识别方法,与
此相应的模式识别系统都是有两个过程(设计和实现)所组成,“设计”是指用一定数量的样本(训I练集/学习集)进行分类器的设计。
“实现”是指用所设计的分类器对待识别的样本进行分类决策。
本文主要采用统计模式识别方法进行研究。
基于统计模式识别方法的系统主要由以下几个部分组成:
信息获取、预处理、特征提取和选择、分类决策。
1.4.I信息获取
为了使计算机能够对各种现象进行分类识别,要用计算机可以运算的符号来表示所研究的对象,通常输入对象的信息有下列3种类型,即
1、二维图像如文字、指纹、地图、照片这类对象。
2、一维波形如脑电图、Ll电图、机械震动波形等。
3、物理参量和逻辑值
前者如在疾病诊断中病人的体温及各种化验数据等;后者如对某参量正常与否的判断或
主璺型兰垫查查兰堡主望些望茎塑墼里堡笪墨望型苎查墨生旦堕塞.一.一4
对症状有无的描述,如疼与不疼,可用逻辑值0和l表示。
在引入模糊逻辑的系统中,这些
值还可以包括模糊逻辑值,如很大、大、比较大等。
通过测量、采样和量化,可以用矩阵或向量表示二维图像或一维波形。
这就是信息获取
的过程。
1.4.2预处理预处理的目的是去除嗓声,加强有用的信息,并对输入测量仪器或其它因素所造成的退
化现象进行复原。
1.4.3特征提取和选择
由图像或波形所获得的数据量是相当大的。
例如,一个文字图像可以有几千个数据,一个心电图波形也可能有几千个数据,一个卫星遥感图像的数据量就更大。
为了有效地实现分类识别,就要对原始数据进行变换,碍到最能反映分类本质的特征。
这就是特征提取和选择的过程。
1.4.4分类决策分类决策就是在特征空间中用统计方法把被识别对象归为某一类别。
基本作法是在样本
训练集基础上确定某个判决规则,使按这种判决规则对被识别对象分类所造成的错误识别率
最小。
1.5本文的刨新点和内容安排本论文在以下几个方面对实际的图像模式识别技术作了大胆的研究和探索:
第一是人脸识别系统中的人脸定位技术,主要鉴于往往人脸定位比人脸识别更为困
难,在该方面投入较大的精力。
对真彩色人脸图像检测,分析了肤色样本的色彩特征及其在各个色彩空间的分布情
况和分割特性.分别构造了基于RGB空间和YIQ空间的肤色模型。
并且针对可能存在大量非肤色干扰的情况提出了一种利用人脸轮廓和纹理特征来缩小分割区域的分割方法。
在此过程提出了一种简易的基于轮廓和纹理特点的区域填充方法,一种独创的依据人脸长宽信息的区域修整方法,以及两种完整的彩色人脸图像分割的流程。
实验表明这些方法是高效且可靠的。
对于非真彩色或肤色信息不可利用的人脸检测,分析了人体的轮廓分布特点,并据此提出了一种完全依赖轮廓和纹理特征的人脸区域分割方法。
在此过程中提出了一种独创的对狭窄带状区域敏感的区域填充方法,一种全新的基于人体轮廓分布的区域分割方法,以及完整的不依赖肤色信息的人脸区域分割流程。
!
璺型兰垫查查兰塑:
!
:
兰些堡兰塑壁堕堡堕星塑型垫查墨生旦堕圣——一!
第二,对于人脸特征检测,提山了一种改进的基于瞳孔特征的眼部区域定位技术,
在此过程中进一步改进和完善了基于轮廓和纹理特点的区域填充技术。
第三,对于车牌照识别系统中的牌照定位技术,简要分析了基于色彩信息的车牌照
定位技术,以及其它目前常用的牌照定位方法的优缺点,提出了一种独创的全新的基于牌照
形状和纹理特性的牌照分割定位方法。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 图像 信息处理 技术 应用 分析