人眼识别系统Word文件下载.docx
- 文档编号:18258499
- 上传时间:2022-12-14
- 格式:DOCX
- 页数:42
- 大小:1.44MB
人眼识别系统Word文件下载.docx
《人眼识别系统Word文件下载.docx》由会员分享,可在线阅读,更多相关《人眼识别系统Word文件下载.docx(42页珍藏版)》请在冰豆网上搜索。
ThispaperadoptMATLABlanguagetosimulate,experimentalresultachieved.
intendedtarget,theeffectivenessofarithmeticinvestigatingwastobeproved.
KeyWords:
Humaneye,Recognition,PatternRecognition.
一绪论
眼睛是生物体上十分神奇的器官,他可以感知光线,是人们获得外界信息最主要的途径;
同时,眼睛包括含心理意识在内的丰富信息。
人眼识别技术最初是随着上世纪六七十年代的模式识别技术发展起来的。
如今,人眼识别已经成为计算机视觉领域和模式识别领域的研究热点。
1.1选题目的和意义
眼睛所蕴含的丰富信息得到了国内外研究者的高度重视和密切关注,人眼识别具有广阔的应用前景。
人眼识别的重要应用领域之一是身份识别。
所谓生物识别技术就是将计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征进行个人身份的鉴定,常见的有指纹识别、掌纹识别、虹膜识别、声音识别等。
但是伴随科技的发展,传统的生物测定系统经常会被蒙骗,人们通过高精度的复制(例如指纹或者视网膜)就能成功蒙混过关。
经研究,每个人的眼球运动方式都具有独特的个人性质,可以利用它研究出一种难以造假、简单的身份鉴别系统。
当人们观察计算机屏幕上移动的图像时,这种新系统可以跟踪观察者眼球的运动。
虽然图像每次移动的方式不同,但是观察者的眼球运动包含了“运动特征”。
它可以显示出运动轨迹的轻微差异,这种差异是这个人独有的特点,从而能够鉴别这个人的身份。
人眼识别还可以应用于检测驾驶员是否安全驾车。
据我国公安部提供的一份资料显示,在2002年一月到2002年十一月这十个月中,全国共发生二十七起重大道路交通事故。
其中十九起交通事故的诱发原因是驾驶员的疲劳驾驶。
驾驶员大约90%的信息是通过“看”得到的,驾驶员如果疲劳,他的精神状态不好、注意力就会不集中、应变能力不强,容易引发交通事故。
由于交通事故往往是司机驾驶疲劳一段时间后发生,中外研究人员一直在寻找一种恰当的检测驾驶员在驾车过程中疲劳情况的方法。
这种方法通过软硬件的配合,实时采集驾驶员驾驶过程中的数据。
它采用某一特征量作为衡量驾驶员精神状态的指标,如果驾驶员疲劳系数高于设定的阈值,系统就采取包括强行停车在内的措施以提高驾车安全系数。
在研究由疲劳引发的交通事故时,人们发现驾驶员由于疲劳,其生理行为在事故发生前就有了变化,研究者们依此已提出了一些具有实际意义的方法,其中由美国公路交通安全管理局(NHTSA)和联邦公路管理局(FHWA)推荐的、依据眼睛闭合时间占某特定时间的百分率判断司机驾驶疲劳程度的方法得到大家的普遍认可。
在人机交互领域,通过眼睛运动进行人机交互成为研究的新热点。
我们可以用眨眼作为鼠标的单击与双击的响应动作,用视线方向的变化模仿鼠标的运动,也就是通过检测眼球的运动,人可以实现对计算机的控制;
而且我们也可以进一步分析瞳孔的描述数据,得出人的注视点,这样做还可以使计算机了解到使用者所关注的信息,对使用者关注的目标进行特写,更智能地表现使用者喜好的目标。
索尼计算机科学实验室与东京大学合作开发的“眼球跟踪”眼镜便是这类产品的有益尝试。
由此推广,人眼也作为心理测试的重要参考依据被广泛使用,测谎仪并不是通过分析被试者所说语言的逻辑关系来判断被试者说的是真话还是假话,而是要检测一个人说话时的心理反应所引起的生理指标的变化。
因此“测谎”可以说是一种“心理测试”。
测谎一般是从脉搏、呼吸和皮肤电阻三个方面测定一个人的生理变化,其中,皮肤电阻最敏感,是测谎的主要根据,通常情况下就是它揭示了被试者心里的秘密。
我国已有不少城市把测谎仪引入到公安、司法界。
2011年美国犹他州大学的科学家研发出一款新型的眼球测谎仪,通过追踪眼球运动来判断被测试人有没有说谎。
研究人员表示,撒谎比讲真话要劳神费力。
如果受试者想说谎,他眼球的瞳孔可能会放大,而且人的主观意识无法控制它的大小变化。
因此,可以通过检测人说话时眼球瞳孔大小的变化,判断此人是否说谎。
从身份识别到辅助驾驶,从人机交互到心理测试,人眼识别的成果正逐渐从实验室不如人民的正常生活,具有十分突出的应用价值,因此,研究人眼具有非常大的意义。
1.2眼睛识别的应用背景与发展现状
计算机视觉是21世纪里面一个富有挑战的领域,它在军事,制造业,检验,文档分析,医疗诊断,交通安全等很多领域都是不可或缺的一部分,同时随着计算机性能的不断提高和电子产品的的普及,越来越多的研究人员致力于计算机视觉领域的探索和研究;
近年来人机交互以及计算机视觉的研究领域中,眼睛是一种重要的信息,眼睛区域包含了丰富的信息,包括表情、身份、性别等多种信息,眼睛检测受到了广泛的关注,眼睛的定位可以作为定位人脸图像的位置、大小和角度的依据,也是视线跟踪、眼睛状态分析以及虹膜识别的首要工作。
发展接近甚至超越人类视觉的感知系统是计算机视觉主要的挑战。
目前的主要研究方法是把图像信号进行分析,建模,几何处理并做出决策。
众多科学家对眼睛检测进行了深入的研究,随着科学技术的发展,眼睛检测在人脸分析、疲劳驾驶、人机交互等方面的作用越来越突出,研究眼睛的检测有着十分突出的应用价值。
眼睛作为人脸的重要特征,在人脸检测和识别中发挥着重要作用。
眼睛的定位也是视线跟踪、眼睛状态分析以及虹膜识别的首要工作。
同时,眨眼的判定可以设计成某些用户接口,或者应用在疲劳检测,动画合成等领域。
许多学者对人眼的跟踪和状态识别进行了探索,这个方向也是近来机器视觉的研究热点之一。
一方面来自商业或政府的应用需要,另一方面也是长期相关技术的积累加上硬件技术的成熟,使得很多原来不能实现的技术得以大量推广,很多这方面的课题己经达到了一定的高度。
随着计算机技术的进步,以及越来越多的人投入到这个领域的研究,这方面的研究必将得到一步的发展。
眼睛检测算法的研究从很早就开始了,已经有了比较成形的想法,但是在算法的普遍性上还存在着不足需要进一步研究。
视线跟踪虽然刚刚起步,但是由于它的应用前景很有吸引力,也有很多人开始在眼睛检测的基础上进一步的研究视线跟踪,并且取得了一定的成果,在研究者的共同努力下,正朝着更好的方向发展。
到目前为止,人们已经提出了很多有效的人眼检测方法,包括对称变换法、霍夫变换法、特殊光源法、基于统计的方法、基于模板的方法和灰度投影法。
杜干等在2005年提出将主分量分析的对称轴检测引入到眼睛定位中。
可以检测二维图形的镜像对称轴方向,结合人脸重心确定人脸对称轴的位置;
最后应用山谷法确定人眼位置。
实验表明,在人脸倾斜时该方法也能取得良好的效果。
高永萍等在2007年提出基于几何特征的人眼精确定位新方法。
利用人脸对称特性,结合肤色匹配和线性变换定位人脸对称轴,实现人眼精确定位。
张志刚等在2008年提出利用改进的对称变换进行人眼定位。
该方法对传统的计算公式进行了改进,采用基于面积系数的圆环邻域模板,引入了更多边缘像素的梯度信息,有效地提高了眼睛定位的精度,具有一定的实用性。
吴冰等在2008年提出基于Hough变换椭圆检测的人眼睛定位方法。
该方法先通过Canny算法对人脸图像进行边缘提取,然后利用提取的眼睛边缘特征进行椭圆检测.该方法定位准确,能有效的抑制噪声,但是存在对人脸图像的要求较高,计算量较大的问题。
在国内外的研究中,基于统计的人眼识别研究最为深入,基于统计理论的检测方法是利用统计分析完成目标定位监测,由于其具有较高精度,越来越多的学者选用此方法对人眼及相关领域进行研究。
国内对于眼睛识别的研究起步较晚,但成果颇多。
史慧荣等在2004年提出一种结合眼睛位置关系的模板匹配方法。
该方法将左眼模板和右眼模板进行合成,用合成的眼睛模板对图像进行匹配,有效压缩了计算量;
但是用来在图像中匹配后得到多个相似眼睛点,仍需要后续处理。
KuoP.等在2005年提出一种基于变形模板的改进的眼睛特征提取算法。
该方法引入眼角特征提高模板拟合速度和准确率,按照预先设定的顺序存放眼睛的特征值以减少更新过程的复杂度、提高灵活性。
栾柱晓等在2009年提出一种改进的人眼模板匹配算法。
该方法采用了分步长模板匹配的策略,在后续的处理中根据两眼的位置特征划分出准左眼区域和准右眼区域,因此大幅度压缩了人眼定位时的计算量。
孙晓玲等在2008年提出一种改进的眼睛精确定位的方法。
该方法主要利用积分投影和波峰波谷法对图像进行分析,进而找出一系列的候选眼睛点,眼睛点的验证采用人脸的几何分布特征来进行。
胡步发等在2006年提出基于小波变换、对称变换和自评估规则的人眼定位新方法。
该方法首先采用正交小波变换,因为人脸图像中存在大面积的灰度均匀区域,而人眼图像区域灰度变化很大,所以通过该变换去除不含有人眼的大面积区域,以提高程序运行速度;
然后根据人眼区域灰度变化特点,建立更加合理的对称变换眼睛模型,增强了对称变换应用于一般人脸状态眼睛定位的稳健性;
最后根据人类双眼相似性以及整个眼部梯度方向信息提出了快速自评估算法,由此实现二次定位,提高了人眼定位的准确性。
朱夏君等在2007年提出人脸识别中的眼睛定位的新方法:
该方法人脸区域划分为小块,计算每一小块的图像复杂度并排序;
然后对复杂度最大的前16个小块的位置进行眼睛准确定位;
算法只能针对于简单背景下的人脸图像才有效。
许多经典的用于识别人眼的统计方法都是国外研究者们发明的。
MarkEveringham等在2006年提出降低由于面部识别给人眼检测带来的负面影响的方法:
一是回归的方法,以直接减少预测眼睛位置的错误;
二是应用一个简单的Bayesian模型;
三是通过AdaBoost算法训练人眼分类器。
每个方法使用相同的数据测试,Bayesian模型方法执行效果最好。
Celebi.M.等在2010年提出基于复杂小波变换和人工复值神经网络的人眼状态检测算法。
首先选取红色信息作为彩色图像的强度,分别获得左眼和右眼的红色图像之后,通过复杂小波变换提取眼睛的特征值;
之后从提取的特征值中可以得到四个特征值统计量(最大值,最小值,平均值和标准偏差)。
这些统计值作为人工神经网络的输入。
测试实验使用的是十个人不同眼睛状态的图片,CVANN眼睛状态检测有6.7%的试验误差,分类结果显示10%的图像没能被正确区分人眼状态。
DavidMonzo等在2010年提出用方向梯度直方图精确定位眼睛的方法:
首先用通过AdaBoost算法得到的分类器预选可能的人眼位置;
然后使用通过方向梯度直方图数据得到的支持向量机分类选出所有可能组合中最佳的眼睛位置。
用FERET和FRGCv1数据库中数据做测试,该方法准确率很高。
ShuoChen等在2011年提出使用图像色彩空间变换的人眼检测算法:
这个方法包括三个步骤。
首先将彩色图像从RGB空间转换到YUV空间,提取图像U彩色图像分量,将获得的图像二值化并通过投影确定人眼边缘;
然后通过两次色彩空间变换找到位于眼睛轮廓内的眼球中心;
最后,为进一步改善人眼检测的准确性,应用先验知识对眼球中心进行调整。
该方法检测速度快,准确率比较高。
除了这些算法外还有很多各具特色的人眼识别算法,但是每个算法都有自己的优点同时又都有一定的局限性,例如运算量太大、程序执行效率低、检测准确率不高或在现有软硬件情况下算法不容易实现等。
由于拍摄图像时光照、拍摄时摄像机与人的位置关系等因素的影响,采集到的图像具有多样性,一个算法很难面面俱到,现在国内外研究者得工作就是尽可能的提高算法的性能,在实际应用中,具体情况具体分析。
1.3本论文的主要工作与文章结构
本文基于前人的研究,实现一种基于模版匹配方法的人眼定位识别算法。
本文的文章结构概括如下:
第一章介绍本文的研究意义和背景。
第二章主要阐述目前世界上流行的人眼识别算法。
第三章人眼定位算法设计与实验。
第四章实验结果分析。
第五章分析了人眼识别的难点以及以后的研究重点。
最后是本文的参考文献。
二常光源下的人眼定位识别
常光源下的人眼定位识别主要是指在通常的光源下,如自然光、普通人早光源等,对人脸中的人眼进行定位检测。
由于成本低,取材方便,常光源的人眼定位成为人眼研究的主要探索领域,同时也为特种光源下的人脸、人眼检测提供了基本的检测方法和数据参考。
2.1基于统计的方法
基于统计的方法一般是通过对大量目标样本和非目标样本进行训练学习得到一组模型参数,然后基于模型构建分类器或者滤波器来检测目标。
在过去的一段时间中,基于统计的方法被广泛应用于人脸检测与识别技术中,通过训练大量的人脸和非人脸样本建立分类器,在输入图像中分类出人脸图像。
实践表明这种方法具有较高的准确度,近年来随着人眼检测研究的不断发展,基于统计的方法也越来越多地得到了应用。
神经网络在基于统计的研究方法中占有较大的比重,它也逐渐被应用于眼睛检测中。
早期Reinders等人采用神经网络和眼睛的微特性来定位人脸部特征。
该算法将搜索窗口的像素作为神经网络的输入,如果该窗口包含眼睛图像,则神经网络的输出较大。
武妍等提出了一种基于灰度信息和瞳孔滤波器的方法。
首先在图像中检测人脸区域从而得到人眼检测框;
然后通过对投影直方图的分析进行人眼粗检测,找到人眼候选点后利用BP神经网构造的瞳孔滤波器进行精确的定位。
文中指出人的眼睛大小各异,但是瞳孔的大小相差不是很大。
文献通过Adaboost算法进行人脸检测。
实验统计,Adaboost检测器输出的图像统一到80*80大小后,瞳孔基本上是5*5的大小,因此设定神经网络的结构为:
输入层为25个节点,输入值与5*5输入图像的每个像素值一一对应;
隐层取经验值9个节点;
输出层为1个节点;
输出值越接近1则表明与瞳孔越相近,反之越靠近0表明与瞳孔的差别越大。
输入层与隐层全连接,隐层与输出层全连接。
训练好的神经网络作为瞳孔滤波器来精确定位眼睛。
石华伟提出了一种基于MeanShift算法和粒子滤波器的人眼跟踪算法。
该算法中采用MeanShift搜索后,粒子被集中在测量模型中,只考虑权值较大的粒子,用少量样本就可以维持样本的多样性,节省了大量的计算时间。
粒子滤波器来源于PerfectMonteCarlo(PMC)仿真,一般用于复杂环境下的目标跟踪等。
通过MeanShift迭代运算,在当前帧中搜索与目标模板亮度分布最相近的潜在目标;
在得到样本观测值后,将MeanShift分析用于每一个粒子。
在通过MeanShift迭代之后,所有的粒子被集中到观测向量的局部区域内,粒子在集中的过程中会获得大的权值,这样就很好地克服了退化现象。
该算法中不需要大量的样本来维持样本多样性,因为采用MeanShift分析之后,样本会自动集中于其邻近的局部最大值区域。
支持向量机(SupportVectorMachines,SVM)在过去的眼睛检测研究中也占有重要的地位。
SVM是由Vanpik领导的AT&
TBell实验室研究小组在1963年提出的一种分类技术它是一种基于统计学习理论的模式识别方法,主要应用于模式识别领域。
其核心思想是:
对于输入空间中非线性可分的情形,选择一个适当的非线性映射,将输入空间中的样本点映射到一个高维的特征空间,使对应的样本点在该特征空间中是线性可分的。
从一定程度来讲,它要优于神经网络。
早期的研究中,Huang等人利用SVM的方法得到了人脸姿态和人眼位置。
LiDiHua提出了一个二级的SVM系统,先用线性核心的SVM筛选出候选点,再用多项式核心的SVM作最终判定,实践证明他们的系统对眼睛、嘴巴等脸部特征的定位成功率达到96%以上。
PANGang使用方形扫描窗口,将眉毛与眼睛作为一个整体定位对象,减少了眉毛对定位的干扰。
WangQiong首先利用眼睛的结构在图像中寻找候选眼睛对,然后再利用支持向量机来定位眼睛对,最后利用方差滤波器在候选区域中检测眼睛。
唐旭晟等人采用基于改进的Adaboost算法的级联式人脸和人眼分类器检测人脸和眼睛的候选位置,再用SVM分类器验证并确定人眼的最佳位置。
由于人脸检测器采用包含灰度信息的类Harris小波作为分类特征,对像素变化较为敏感,常把眉毛、深色眼睛框等区域误判为眼睛。
因此根据人脸几何特征模型,文中提出了13个用于区分人眼对的几何分类特征,训练SVM分类器作进一步的验证;
两种不同类型分类器级联输出才作为最后的眼睛输出。
实践证明,该算法检测精度较高,对于正面图像或者旋转较少的人脸图像有着较高的检测率。
目前困扰SVM方法的主要问题是当计算复杂度高、训练样本个数较大时,会得到大量的支持向量,使分类器的计算量过大。
基于统计的方法实施目标检测,在检测的精确度上无疑有着很大的提高,但是它需要采集大量的样本来训练分类器,过程比较复杂。
这是制约此类方法的最大问题。
2.2基于知识的方法
基于知识的方法也被称之为基于规则的方法。
其指导思想是确定图像的应用环境,总结特定条件下可用于人眼检测的知识(如轮廓信息、色彩信息、位置信息)等,把它们归纳成指导人眼检测的规则。
ZhangLiMing先用直方图阈值法将图像二值化,根据其中黑色区域的面积、形状和相对位置等几何特征确定瞳孔位置;
最后通过边缘跟踪依次找到上眼眶、眼角和下眼眶。
范红深提出了一种类似的方法,它们将图像二值化后,计算出黑色区域的有效面积、质心、外接矩形、圆性质等几何特征,依据经验标准筛去一部分黑色区域,并将余下的区域作配对筛选,从而得到双眼位置。
此算法简单易行,但容易受到光照和噪声的影响。
Kumar等人在实施人眼检测的过程中首先利用了大量有关于肤色和眼睛区域亮度的先验知识,设定了多个阈值来分离皮肤及眼睛区域;
然后再利用均值投影函数和方差投影函数来实施最后的定位。
由于采用了大量的先验知识,使得该方法的通用性受到了限制,尤其对于脸部肤色较深的个体,准确率不高。
此类方法与前述基于几何模板的方法有很大区别,虽然都利用到一些人眼的几何性质,但前者利用表现出来的几何性质建立了通用性更好的模板来实施匹配,而基于知识的方法则是直接利用这些几何性质实施检测,通用性要差一些。
目前,由于先验知识有很大的局限性,单独用来进行人眼检测的研究已经不多,更多的是用来作为约束条件辅助检测。
基于对称变换的人眼定位识别方法属于基于知识的人眼检测范畴。
基于对称变换的人脸图像眼睛定位方法是一种利用图像灰度分布的特性,从计算对称值的角度出发,利用梯度对称变换,得到梯度图,最终实现自动定位人脸图像中眼睛的算法。
对称变换是基于梯度图的局部算子,记
,
为图像上的任意两点,它的连线与水平线的逆时针夹角为
,其取值范围为
。
以
点为连线中心的对称点集合为:
(1)
和
处在以
为中心,
为半径的一个圆形区域内,定义电的对称强度为:
(2)
其中距离因子
,方向因子
分别为:
(3)
(4)
其中,
为瞳孔半径。
此方法是测试两瞳孔的对称强度,以对称强度大小来定位一对眼睛的位置,但眼球常因为转动可能被眼帘遮挡,所以此方法满足不了对多姿态的要求,而且在戴眼镜的情况下,因为两镜片不同程度的反光,效果也不尽如人意。
2.3基于模版匹配的方法
2.3.1模版匹配法原理
在机器识别过程中模板是为了检测某些区域特征而设计的数据阵列,模板匹配技术是利用某种算法将已知的模板和待识别图像进行匹配计算,获得图像中是否含有该模板的信息。
模板匹配基本原理是在图像的搜索区内逐点平移参考模板图像,遍历搜索区内的每一个位置点,同时根据某个相似性原则,计算搜索区内该位置点的图像区域和参考模板的相关值,然后根据相关值的大小来判定匹配情况。
基本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 识别 系统