毕业设计论文文档格式.docx
- 文档编号:22932769
- 上传时间:2023-02-06
- 格式:DOCX
- 页数:42
- 大小:500.61KB
毕业设计论文文档格式.docx
《毕业设计论文文档格式.docx》由会员分享,可在线阅读,更多相关《毕业设计论文文档格式.docx(42页珍藏版)》请在冰豆网上搜索。
2005年1月18日,由清华大学电子系人脸识别课题组负责人苏光大教授主持承担的国家"
十五"
攻关项目《人脸识别系统》通过了由公安部主持的专家鉴定。
鉴定委员会认为,该项技术处于国内领先水平和国际先进水平[6]。
1.3面部识别的研究意义
随着经济社会的日趋发展,快速有效的自动身份识别的要求日益迫切,这使得面部识别技术的发展变得越来越重要。
然而,面部识别技术由于其具有复杂、难度大且起步晚的特点,当前发展还不是很成熟,这极大地限制了它的应用。
面部识别是机器视觉和模式识别领域最富有挑战性的课题之一,同时也具有较为广泛的应用意义。
面部识别技术是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容。
如今,虽然在这方面的研究已取得了一些可喜的成果,但是面部的检测与定位在实际应用中仍面临着很严峻的问题,因为人脸五官的分布是非常相似的,而且人脸本身又是一个柔性物体,表情、姿态或发型、化妆的千变万化都给正确识别带来了相当大的麻烦。
如何能正确识别大量的人脸并满足实时性要求是迫切需要解决的问题。
1.4已有面部检测方法综述
面部检测有很多方法,下面从方法论的角度概要性地总结一下现有的几种主要面部检测思想。
(1)基于知识的自顶向下的方法
这种方法是基于我们在认识人脸的过程中所总结出来的一些先验知识,把它们归结成为一些复杂程度由简而繁的规则。
例如:
“正面人脸都包括两只位置相互对称的眼睛”、“灰度图像中眼睛要比脸上其他地方暗”等。
找到一系列规则后,把它们应用到输入图像中,搜索出符合规律的人脸区域。
(2)基于人脸特征的自底向上的方法
这种思想首先用各种数字图像的处理办法对输入图像进行处理,根据处理结果提取出来的某些特征与人脸的某些共性特征进行比较,借此来判断某一区域是否为人脸。
举例来说,我们可以用数字图像处理中常用的提取边界的方法在输入图像中寻找边界,然后试探哪些边界能像正面人脸的左边线、右边线和发髻线那样构成人脸的轮廓;
还可以利用从图像中提取出来的色彩和纹理信息与人脸的色彩和纹理模型进行比较,得出可能的人脸区域。
当然各种人脸特征的综合运用对于提高检测算法的性能会有很大帮助。
(3)模板匹配的方法
首先,建立并存储一些人脸模板作为标准,可以包括正面人脸或是单独的眼睛、鼻子、嘴等。
利用一些算法来计算各待测区域与标准模板的相似程度或称相关性,利用这一相似程度来判决某一区域是否为人脸。
(4)基于人脸外观的方法
这种思想是指通过搜集大量的人脸和非人脸样本作为训练集,用人工神经元网络、支持向量机(SVM)等方法训练出一个分类器来检测人脸。
这种思想和其他思想的不同之处在于,他并不首先人工的对人脸进行分析或是抽取模板,也不对输入图像进行复杂的处理,而是利用大量的人脸整体外观用结构化的方法来训练出人脸检测的分类器。
在这一类方法中,特征向量、统计学、信息学等思想也得到了运用。
上述各种方法都存在着自身的优缺点和适用领域,很多学者在各自所面临的问题的范围内不断探索,也发明了许多卓有成效的检测算法。
但各种检测算法都存在着效率与性能上的矛盾,即在正确率、鲁棒性能等方面更好的算法往往会花费更多的时间及系统消耗[3]。
1.5本论文目的
本论文主要对该人脸识别系统进行模块划分,并介绍各模块的功能,重点介绍图像预处理模块,对其内的子模块的功能和算法进行详细讲述,主要介绍光线补偿、二值化、直方图,通过以上处理能够成功标记出人脸区域,图像预处理模块在整个系统中起着极其关键的作用,图像处理的好坏直接影响着后面的定位和识别工作,最后介绍人脸特征标记与定位的方法。
2系统分析
2.1需求分析
2.1.1需求分析概述
其在安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互、系统公安(犯罪识别等)等方面有着巨大的应用前景,因此,面部识别技术越来越成为当前模式识别和人工智能领域的一个研究热点。
2.1.2可行性分析
面部识别系统现在在大多数领域中起到举足轻重的作用,尤其是用在机关单位的安全和考勤、网络安全、银行、海关边检、物业管理、军队安全、智能身份证、智能门禁、司机驾照验证、计算机登录系统。
人脸识别系统现在应用于许多领域中,但是人脸识别技术也是一项近年来兴起的,且不大为人所知的新技术。
在我国以及其他国家都有大量的学者正在研究之中,不断的更新人脸识别技术,以便系统的识别准确率达到新的高度。
日后的应用前景十分广阔。
2.1.3技术分析
图像的处理方法很多,我们可以根据需要,有选择地使用各种方法。
在确定脸部区域上,通常使用的方法有肤色提取。
肤色提取,则对脸部区域的获取则比较准确,成功率达到95%以上,并且速度快,减少很多工作。
图像的亮度变化:
由于图像的亮度在不同环境的当中,必然受到不同光线的影响,图像就变得太暗或太亮,我们就要对它的亮度进行调整,主要采取的措施是对图像进行光线补偿。
去噪声处理:
在图像的采集过程中,由于各种因素的影响,图像中往往会出现一些不规则的随机噪声,如数据在传输、存储时发生的数据丢失和损坏等,这些都会影响图像的质量,因此需要将图片进行消除噪声处理。
人脸分割:
经过光线补偿和消除噪声处理后对图像进行提取边界处理,确定出人脸的位置。
特征标注:
特征标注在人脸识别、验证和建模中都具有重要意义,因为眼睛、鼻子和嘴巴等特征集中了人脸的大部分信息。
对于人脸建模来说,不仅要检测出这些特征,而且要准确地加以定位。
2.2开发运行环境
2.2.1开发环境
(1)硬件环境
硬件配置原则:
具有可靠性,可用性和安全性,具有完善的技术支持。
能够满足个人学习和设计需要。
运行软件所需硬件资源:
CPU:
800M以上;
内存:
128M以上。
(2)软件环境
系统软件配置原则:
能够满足该软件的可靠性,可用性和安全性的要求。
系统软件配置方案:
配置有持续工作能力、高稳定性、高度可集成的开放是标准的操作系统。
配备符合ANSI/ISO标准的高级程序设计语言处理软件。
如:
VisualC++6.0。
熟悉C++高级程序设计语言。
2.2.2安装运行环境
CPU要求:
500M及以上
64M以上
操作系统:
Windows系列操作系统
支持软件:
MicrosoftVisualStudio
2.3开发工具选择
本次设计所用的开发工具是MicrosoftVisualC++6.0。
VisualC++6.0是Microsoft公司推出的一种可视化编程工具。
它支持多平台和交叉平台的开发,将各种编程工具如编辑器、连接器、调试器等巧妙的结合在一起,构成一个完美的可视化开发环境。
用户无需通过繁杂的编程操作,即可完成Windows下应用程序的编辑、编译、测试和细化等工作。
3系统总体设计
3.1系统规划
本系统主要研究的对象是图像,系统应该对图像进行光线补偿、二值化、直方图、标记特征区域等,每个小模块的实现都有许多相应的算法。
下面将本系统采用的算法进行介绍:
光线补偿:
由于光线原因,所照的图像可能会存在光线不平衡的情况而造成色彩偏差,为了抵消这种整个图像中存在的色彩偏差,本系统采用的解决方法是:
将整个图像中的所有像素的亮度从高到低进行排列,取最亮的像素,然后线性放大,使这些像素的平均亮度达到255。
实际上就是调整图片像素的RGB值,然后将其他像素点按照这个比例依次调整。
消除噪声处理:
本系统采用一种滤波方法莱消除噪声。
二值化:
经过光线补偿和消除噪声处理的图像,通过公式计算,是人脸区域的标记为1,不是人脸区域的标记为0,使图像的脸部区域标记出来。
直方图:
使用该模块的目的是直观的显示肤色像素点在灰度级中所占比例的关系。
标记特征区域:
确定人脸的位置之后,首先根据脸部上灰度级较大的区域,及先验知识确定眼睛的位置,再根据眼睛的位置利用几何方法确定出鼻子和嘴的位置。
3.2系统流程分析
用户使用这款软件时,要按照一定的流程来进行操作。
首先要打开一张BMP格式的图片,其中应该包括人的脸部,打开图片之后可以选择两种标记人脸的方法,第一种方法要对图片进行相似度计算目的是为了光线补偿,之后是二值化,这时可以看图像的水平直方图和垂直直方图,成功标记出人脸区域。
另一种方法是对图像进行皮肤区域和头发区域进行分析,可以查看脸的直方图和头发的直方图,成功标记出人脸区域。
在标记出人脸区域之后,可以开始特征标注,首先是边缘提取,然后确定眼睛的位置,在根据眼睛的位置标记出鼻子和嘴巴的位置,标记结束程序也就运行结束。
这样的流程决定了程序所应具有的功能,程序功能流程,如图3-1所示:
面部检测与定位系统
打开图像
退出程序
人脸区域检测
基于相似度的方法
相似度计算
水平直方图
基于皮肤区域、头发区域的方法
二值化
垂直直方图
标出人脸和头发区域
脸的直方图
标记人脸区域
头发直方图
特征标注
边缘提取
标记眼睛
标记嘴巴
标记鼻子
图3-1系统流程图
3.3系统总体设计原则
(1)开放性、可扩充性、可靠性原则
开放系统是生产各种计算机产品普遍遵循的原则,遵循这种标准的产品都符合一些公共的、可以相互操作的标准,能够融洽的在一起工作。
开放系统使得各种类型的系统互连简单、标准统一,容易扩展升级。
从而适应广大用户需求的多变性和产品的更新换代。
(2)良好的用户操作界面
用户操作界面美观、方便、实用,使用户能在较短的时间内掌握其使用方法。
(3)实用性原则
任何系统的设计都要考虑其实用性,系统开发的目的是为了实现业务处理自动化、规范化,提高工作效率,减轻工作人员的劳动强度,减少开支。
(4)工作平台设计原则
能适应不同的操作平台。
(5)先进、成熟技术性原则
采用较为先进的技术力量,保证应用程序在技术上具备一定的优势。
采用成熟的技术,保证应用程序的安全性和可靠性。
(6)节省资源原则
应用程序充分利用现有的资源,尽量减少不必要的再投资。
(7)代码可读性原则
编写的代码必须严谨易读,代码的解释必须清楚明白,为应用程序的再开发提供应尽的责任。
3.4各模块功能概述
下面介绍系统中的各模块的功能及算法:
3.4.1人脸区域获取
该系统中图像里人脸区域的获取,主要是根据肤色来进行获取,通过肤色非线性分段色彩变换来实现。
这一非线性分段色彩变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间。
图像预处理就是对获取得来的图像进行适当的处理,使它具有的特征能够在图像中明显的表现出来。
该模块中的子模块有如下4个,下面对它们进行概述:
(1)光线补偿
因为系统得到的图片可能会存在光线不平衡的情况,这会影响我们对特征的提取,同时系统中要用到YCrCB色彩空间,所以有必要对图像进行光线补偿。
尽可能将它的特征在图像中表现出来。
YCrCB是一种色彩空间,它用于视频系统中,在该色彩空间中,Y分量表示像素的亮度,Cr表示红色分量,Cb表示蓝色分量,通常把Cr和Cb称为色度。
YCrCB色彩空间是以演播室质量标准为目标的CC601编码方案中采用的彩色表示模型。
(2)消除噪声处理
以每一个肤色像素点为中心的5*5邻域内统计肤色像素点的个数,超过半数时中心点保留为肤色,否则认为是非肤色。
(3)二值化
一幅图像包括目标物体、背景还有噪声,要想从多值数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:
大于T的像素群和小于T的像素群。
这是研究灰度变换的最特殊的方法,称为图像的二值化(BINARIZATION)。
图像的二值化,就是将图像上的像素点的灰度值设置为0或255,大于T的像素群设为255,小于T的像素群设为0,可以用一个比特表示一个像素,“1”表示黑色,“0”表示白色,当然也可以倒过来表示,这种图像称之为二值图像。
这便有利于我们对特征的提取。
该设计中采用组内方差和组外方差来实现二值化。
也就是将整个图像呈现出明显的只有黑和白的视觉效果。
以便于分析理解和识别并减少计算量。
这有利于我们对特征的提取。
(4)直方图
直方图均衡化是图像处理领域中利用图像直方图对对比度进行调整的方法。
这种方法通常用来增加许多图像的局部对比度,尤其是当图像的有用数据的对比度相当接近的时候。
通过这种方法,亮度可以更好地在直方图上分布。
这样就可以用于增强局部的对比度而不影响整体的对比度,直方图均衡化通过有效地扩展常用的亮度来实现这种功能。
直方图均衡化的目的是使一输入图像转换为在每一灰度级上都有相同的象素点数,它的处理的中心思想是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布,它的研究思路是:
通过直方图变换式来进行直方图的均衡处理,直方图变换式是
(3-1)
但是直方图均衡化存在着两个缺点:
1)变换后图像的灰度级减少,某些细节消失;
2)某些图像,如直方图有高峰,经处理后对比度不自然的过分增强[3]。
3.4.2特征定位与提取模块
人脸定位是将典型的脸部特征(如眼睛,鼻尖,嘴唇等等)标记出来,在本系统中,定位的特征是眼睛,鼻尖和嘴巴三个。
由于眼睛具有对称性,因此可以很快就能标记出来,而鼻子是在眼睛下面,且嘴巴在鼻子下面,所以只要眼睛标记好,鼻子和嘴巴也能相应的标记出来。
特征提取按以下4个步骤进行:
(1)提取两只眼睛的距离
(2)眼睛的倾角度
(3)眼睛、嘴巴的重心
(4)用三个十字星标出每一个特征
4系统详细设计
该软件最主要的功能就是要能识别出人脸,首先该系统需要对一个BMP人脸图片进行一系列处理才可进行下一步的工作,该处理过程也称图像预处理。
预处理这个模块在整个面部识别系统的开发过程中占有很重要的地位,只有预处理模块做得好,才可能很好地完成后面的人脸定位和特征提取这两大关键模块。
因此本设计中所要完成的主要功能如下所述:
(1)图像获取功能
该模块主要是从图片库中获取图片,获取后的图片可以在软件的界面中显示出来,以便进行识别。
(2)图像预处理功能
该模块主要包括图像相似度计算、二值化、标记皮肤区域和头发区域、直方图变换等。
(3)人脸定位功能
该模块主要是将处理后的人脸图片进行定位,将眼睛、鼻子、嘴巴标记出来。
4.1基于肤色的人脸检测算法
4.1.1色彩空间与色彩空间的聚类
根据计算及色彩理论,对一种颜色而言,在计算机中有不同的表达方式,这样就形成了各种不同的色彩空间。
当然各种色彩空间只不过是色彩在计算机内不同的表达形式而已,每一种色彩空间也都有其各自的产生背景、应用领域等。
主要的色彩空间有以下几种:
(1)RGB格式(红、绿、蓝三基色模型)
由于彩色图像是多光谱图像的一种特殊情况,对应于人类是觉的三基色即红、绿、蓝3个波段,是对人眼的光谱量化性质的近似。
因此利用R、G、B三基色这3个分量来表征颜色是很自然的一种格式。
而且多数的图像采集设备都是以CCD技术为核心,直接感知色彩的R、G、B这3个分量,这也使得三基色模型成为图像成像、显示、打印等设备的基础,具有十分重要的作用。
(2)HIS格式(色度、饱和度、亮度模型)
这种格式反应了人类观察色彩的方式,同时也有利于图像处理。
在对色彩信息的利用中,这种格式的优点在于它将亮度(I)与反应色彩本质的特性的两个参数——色度(H)和饱和度(S)——分开。
在提取一类物体(比如现在研究的人脸)在色彩方面的特性时,经常需要了解其在某一色彩空间的聚类特性,而这一聚类特性往往体现在色彩的本质特性上,且经常受到光照明暗等条件的干扰影响。
光照明暗给物体颜色带来的直接影响就是亮度分量,若能将亮度分量从色彩中提取出来,而只用反应色彩本质特性的色度、饱和度来进行聚类分析,会获得比较好的效果。
这也正是HIS格式在色彩图像处理和计算机视觉的研究中经常被使用的原因。
(3)YCbCr(YUV)格式
这种色彩空间是以演播室质量标准为目标的CCIR601编码方案中采用的彩色标识模型,被广泛的应用在电视的色彩显示等领域中。
它同样具有HIS格式中将亮度分量分离的优点,但由于他可以从RGB格式线性变化得到,所以直接应用于物体色彩聚类分析的情况不多,相比之下,在其基础上的变换模型的应用更为普遍。
在人脸检测中也常常用到YCrCb空间,因为一般的图像都是基于RGB空间的,在RGB空间里人脸的肤色受亮度影响相当大,所以肤色点很难从非肤色点中分离出来,也就是说在此空间经过处理后,肤色点是离散的点,中间嵌有很多非肤色,这为肤色区域标定(人脸标定、眼睛等)带来了难题。
如果把RGB转为YCrCb空间的话,可以忽略Y(亮度)的影响,因为该空间受亮度影响很小,肤色会产生很好的类聚。
这样就把三维的空间变为二维的CrCb,肤色点会形成一定得形状,如:
人脸的话会看到一个人脸的区域,手臂的话会看到一条手臂的形态,对处理模式识别很有好处,根据经验某点的CrCb值满足:
133≤Cr≤173,77≤Cb≤127那么该点被认为是肤色点,其他的就为非肤色点。
4.1.2肤色模型
(1)光线补偿(LightingCompensation)处理
光线补偿想法的提出主要是考虑到肤色等色彩信息经常受到光源颜色、图像采集设备的色彩偏差等因素的影响,在整体上偏离本质色彩而向某一方向移动,即我们通常所说的色彩偏冷、偏暖,照片偏黄、偏蓝等。
这种现象在艺术照片中更为常见。
针对实际图像中光照过亮、过暗等情况,提出了一种光线补偿方法。
通过将图像亮度灰度范围内的两端区域进行压缩,降低过亮和过暗区域的对比度;
再用对数函数做非线性变换函数,使变换后图像的对比度增加。
该方法能够对过亮、过暗以及中间区域的像素灰度值进行修正,为后续的肤色分割、人脸检测奠定基础。
为了抵消整个图像中存在着的色彩偏差,将整个图像中所有像素的亮度(是经过了非线性γ——校正后的亮度)从高到低进行排列,取最亮的像素,就将他们的亮度作为“参考白”(ReferenceWhite),即将它的色彩的R、G、B分量值都调整为最大的255。
整幅图像的其他像素点的色彩值也都按这一调整尺度进行变换。
(2)非线性分段色彩变换(NonlinearColorTransformation)
YCbCr色彩空间具有如下一些优点。
①YCbCr色彩格式具有与人类视觉感知过程相类似的构成原理。
②YCbCr色彩格式被广泛地应用在电视显示等领域中,也是许多视频压缩编码如MPEG、JPEG等标准中普遍采用的色彩表示格式。
③YCbCr色彩格式具有与HIS等其他一些色彩格式相类似的将色彩中的亮度分量分离出来的优点。
④相比HIS等其他一些色彩格式,YCbCr色彩格式的计算过程和空间坐标表示形式比较简单。
⑤试验结果表明在YCbCr色彩空间中肤色的聚类特性比较好。
同时,正如前面所分析的那样,YCbCr色彩格式直接由RGB色彩格式通过线性变换得到,所以其亮度分量Y并不是完全独立于色度信息而存在的,肤色的聚类区域也是随亮度分量的不同而呈现非线性变化的趋势。
在YCbCr色彩空间中,肤色聚类是呈两头尖的纺锤形状,也就是在Y值较大和较小的部分,肤色聚类区域也随之缩减。
简单地排除Y分类,按照传统的做法在二维的Cb—Cr子平面中寻求肤色的聚类区域是不可行的,必须考虑Y之不同造成的影响,从而对YCbCr色彩格式进行非线性分段色彩变换。
用4个边界来限制肤色聚类区域可以很好地适应亮度过明或过暗的区域,从而使肤色模型的鲁棒性大大提高。
经过了非线性分段色彩变换得到的色彩空间我们用YCb′Cr′来表示。
YC
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文