人脸识别总述及相关算法.docx
- 文档编号:4304952
- 上传时间:2022-11-29
- 格式:DOCX
- 页数:10
- 大小:277.29KB
人脸识别总述及相关算法.docx
《人脸识别总述及相关算法.docx》由会员分享,可在线阅读,更多相关《人脸识别总述及相关算法.docx(10页珍藏版)》请在冰豆网上搜索。
人脸识别总述及相关算法
报告题目:
人脸检测
报告人:
卢志国
学号:
04720742
●综述
●人脸检测的基本概念
●Mosaic图和横纹目标提取
●复杂背景下的自动人脸检测
●实验结果
1.综述
人脸检测的目的是自动确定图像中是否存在人脸,并给出人脸个数、大小及其位置等参数。
人脸是人类特有的,是视觉世界中最常见的对象,广泛存在于可视电话、视频消息、手持无线终端、电视新闻与电视会议等视频业务中。
与人脸相关的自动识别一直是计算机视觉和人工智能领域中一项极富挑战性的工作,并在视频检索、门卫安全、视频通信、虚拟现实和人机交互等相关场合得到了广泛的内用。
这些应用往往首先要求实现人脸的自动检测。
然而实际应用情况十分复杂,不同的人脸姿势、不同的成像条件、不确定的饰物以及复杂的背景等,均向人脸检测算法提出了苛刻的要求。
目前还没有一种人脸检测算法能够不加限制地适用于所有场合,主要困难在于如下几个方面:
(1)人脸器官的形状、尺寸、纹理、表情等化复杂,难以用统一的模式加以描述。
(2)人脸表面存在一些附属异物,如眼镜、耳环等。
(3)光照等成像环境变化,使图像质量相差较大。
(4)图像背景千变万化。
1.1人脸规则
人脸具有自身的内在属性,反映在图像上,具有一定的空间相关性,即人脸规则。
可以通过检测图像是否满足这中规则或满足的程度来确定图像中是否存在人脸。
利用规则描述人脸,与先验知识的完备性有关。
因人脸特征变化大,人脸的界定涉及多种因素。
抽象出既能表达人脸的共性,又不与其他概念相交叉的人脸规则是比较困难的。
不过随着人们对人脸模式的认知逐步深入,基于规则的人脸检测方法越来越受到人们的重视。
2.人脸检测的基本概念
世界上没有两张完全相同的人脸,但不同的人脸却具有共性,即都是由眉、眼、鼻、嘴等器官组成,且具有固定的结构和良好的对称性。
人脸模式的共性为人脸检测提供了依据。
Harmon是最早提出根据人脸特征来检测人脸的专家之一。
他通过研究发现,人脸信息的绝大部分属于低频成分,凭借这些信息可将人脸模式从其他模式中辨别出来。
降低分辨率会削弱人脸的个性,增强人脸的共性,因此降低分辨率无疑是人脸检测最有效的途径之一。
但一幅图像的分辨率降得太低,则很容易将其他一些模式与人脸模式混同,如大猩猩的脸在低分辨率下与人脸十分相似。
为了能进—步区分这类模式,只有提高图像的分辨率以进—步筛选出真正的人脸模式。
计算机检测人脸的过程一般可分为两个阶段。
第—个阶段为机器认知过程,即自学习过程。
通过大量已知人脸模式的学习,获得关于人脸模式的特征。
第二个阶段是模式匹配过程。
下面以最典型的模式匹配方法来说明人脸检测的基本概念。
已知人脸模式可用矢量形式表示为:
判断图像在当前位置的一个区域内是否含有人脸模式的方法是:
对被检测的图像区域进行特征提取,按照人脸模式Y的特征提取方式,生成表示未知待测模式的矢量然后进行模式匹配。
匹配的方法通常是设定一种度量,用于测定已知人脸模式Y和未知待测模式X之间的距离,如欧式距离或马式距离,距离表示为取定某阈值t如果则表示X与Y的匹配效果好,可判断X与Y属于同—类模式,即当前被检测的图像区域内含有人脸;否则判X不是人脸模式。
匹配的结果通常不完全准确的,往往会出现漏检“真脸”和误检“假脸”。
“真脸”漏检是因为在生成标准人脸模式时,人脸模式的共性特征被提取出来,个性特征被丢弃了;而实际待检的人脸模式具有多样性,从而造成个别特殊人脸的漏检。
“假脸”误检是由于图像其他景物的局部特征具有和标准人脸模式相似的特征所造成的。
解决的办法是在建立用于判别的标准人脸模式时,扩大对人脸个性特征的提取,同时增强对非人脸图像的辨别能力。
3.Mosaic图和横纹目标提取
3.1Mosaic图
Mosaic图是原始图像的低分辨率图像,通过将原始图像分块平均而获得。
具体方法为:
以给定长度(长度单位为像素)将原始图像逐行逐列划分为互不重叠的正方形排列块,求取每个排列块的平均值,并用该平均值替代该块中原先所有像素的灰度值,此时所得到的图像被称为原始图像的Mosaic图,其正方形排列块被称为Mosaic单元。
图1(b)、(c)、(d)分别给出了原始图像即图1(a)在4x4,5x5,6x6分辨率下的Mosaic图。
从图中可看出,Mosaic图实际上描述了原始图像的低领特征。
图1不同分辨率的Mosaic图
因此,利用Mosaic图,可按容易地提取出人脸的粗特征。
3.2横纹目标提取
从图1中可以看出人脸器官如双眉、双眼、鼻和嘴都有一个共性,即当所观察的人脸在图像平面内不是太斜(与垂直方向的夹角在-30°~30°之间)时,它们基本成水平分布且具有较明显的对称性。
虽然各器官的长度不等,但它们在垂直方向上的宽度大致近似,且该特征在Mosaic图上体现得更加明显,这为提取人脸器官的位置提供了便利。
一个最直接的想法就是在某分辨率下的Mosaic图上利用提取横纹的方法来提取人脸上的器官。
但图像中的人脸个数、尺寸以及成像条件均未知,如果在某特定分辨率下的Mosaic图上用单一则值,将难以提取出各类人脸目标,另外,仅仅提取横纹还将丢失人脸器官的形状特征。
因此,采用多分辨率多层次的横纹目标提取技术来提取人脸上的器官,使图像中不同尺寸的人脸均被提取山来,且得到的人脸器官基本保留了原来的横向形状特征。
所谓多分辨率是指以不同尺度降低原始图像的分辨率,得到不同分辨率下的Mosaic图(参见图1(b),(c),(d)),从而克服了人脸表情、人脸尺寸等因素的影响;所谓多层次则是指在同一分辨率下的图像以不同阈值进行横纹目标提取,从而克服光照等因素的影响。
3.3Mosaic图上的横纹提取
从图1中可看出,人脸器官落入Mosaic单元的灰度值明显低于其周围单元的灰度值,即人脸上的器官呈现出沟状横纹特征。
用于提取沟状横纹的经典算子是Laplace水平边缘检测算子,图2为其示意图。
1
2
1
图2Laplace水平边缘检测算子示意图
如果直接利用Laplace水平边缘检测算子对图像中的横纹进行检测,务必会检测出许多杂碎的边缘,加大后续人脸检测的计算量。
人脸器官横纹线应该较长,所以对Laplace水平边缘检测算子进行改进,得到了改进的Laplace水平边缘检测算子。
设当前的Mosaic单元及其上下相邻单元的灰度值分别为:
mosaic_image[i,j],mosaic_image[i-1,j],mosaic_image[i+1,j]
并记:
L[I,j]=1xmosaic_image[i-1,j]-2xmosaic_image[i,j]
+mosaic_image[i+1,j]
则用改进算子检测横纹的结果为:
TH为某设定阈值,mosaic_edge_image就是在阈值为TH下的横纹图像。
3.4多分辨率多层次的横纹目标提取
多分辨率多层次的横纹目标提取方法可描述如下:
(1)给定一阈值t,用上述改进的Laplace算子分别对不同分辨率下的Mosaic
图进行横纹提取,得到对应的二值化横纹图像。
(2)将每幅二值化横纹图像放大至原始图像的尺寸,此时二值图像中的每条
横纹线的宽度均等于对应分辨率下Mosaic单元宽。
(2)将上述所有放大了的二值图像进行“或”运算,便得到了—幅在阈值t下
的横纹目标图。
(4)改变阈值t,再重复上述三步,便可得到另外—幅横纹目标图。
图3给出了多分辨率多层次的横纹目标提取方法的框图。
图4给出了一幅阈值为20的横纹目标图,其原始图像为图1(a)。
从图中可较清楚地看出大小两张人脸的特征,但也可看到一些面积很大、很长的横纹目标。
—般说来,它们不太可能是人脸上的器官。
因此,在开始人脸检测之前,应接将这些目标剔除,以提高人脸检测的速度。
图3横文目标提取方法框图
图4横文目标图(t=20)
4.复杂背景下的自动人脸检测
4.1预处理
利用上述多分辨率多层次的横纹目标提取技术对原始图像在不同阈值下进行横纹目标提取,得到一系列横纹目标图像。
考虑到人脸各器官的特征以及相互间固定的结构关系,在横纹目标图上可事先剔除一些太大、太长的横纹目标区(超标目标区)。
为了剔除横纹目标图上的这些超标区,首先应该要知表征横纹目标的一些参数,如面积和形状特征等。
为此采用目标聚类分析方法在横纹目标图上对每个目标区进行标号以求出它们的参数。
图5示出了该目标聚类分析方法的分析过程。
在图5(a)中的每个小方格都表示目标的一个像素(设灰度位为0),在图5(b)、(c)中,位于两个小方格中的数字为对应像素的标号。
聚类过程分构步进行:
(1)对每个目标像素点标号。
首先在横纹目标图上从左到右、从上到下进行扫描。
当遇到属于目标区的像素点(灰度值为0)时,检测该像素的8邻域。
如果他们都没有被标号,则将该像素点标以新的标号值(标号值从1开始),每遇到此类情况,标号值就加1;否则,用8邻域中最小的标号值对当前像素点进行标号。
在图5(b)中,当扫描到a点时,由于此时a点的8邻域没有被标号,而前一个被标号的目标像素点的标号值为2,所以a点的标号值为3,像素点c,d,e与a点的情况类似。
当扫描到b点时,由于b点的8邻域中有两个像素点已经标号,它们的值分别为3和5,所以b点的标号值为3,像素点f与b点的情况类似。
由于在图5(b)的第3个目标区中有多个标号值(3,4,5,6)的点,所以必须要对这此点进行聚类,使他们的标号值都为3。
图5目标区聚类分析过程
(2)对每个目标区进行聚类。
在横纹目标图上,从上到下逐行(先从左到右,再从右到左)扫描。
当遇到目标像素点时,检测该像素的8邻域。
如果他们中的最小标号值大于该像素点的标号值,则该像素点的标号值被替换为8邻域的最小标号值。
当扫描完整幅图时,再以同样的方式从下到上逐行上扫描,直到所有目标像素点的标号值不再变化为止。
在图5(c)个中,三个目标区被分别标以1,2,3,据此,求取这三个目标区的参数将变得非常简单。
例如统计某标号值的像素点总数就可计算对对应目标区的面积;计算某目标区的长度可通过求取该目标区最左和最右边的标号像素点来获得。
用下面的结构体来表征横纹目标区:
TypedefstructtagObject{
WORDtab;//目标区的标号
WORDacreage;//目标区的面积
WORDlength;//目标区的长度
WORDcenterX;//目标区中心点的横坐标
WORDcenterY;//目标区中心点的纵坐标
}Object;
通过对图4的各目标区进行聚类分析,求出个目标区的形状特征、面积等参数,剔除一些超标目标区,得到图6,为人脸粗检做好准备。
图6经预处理后横文目标图
4.2粗检
经预处理后的横纹目标图中,每个日标区都有可能是人脸上的器官。
粗检即根据人脸上各器官(如双眼、鼻、嘴等)固定的空间结构关系,确定候选人脸。
共分两步:
寻找眼睛对和以眼睛对为基准寻找鼻与嘴,从而确定候选人脸。
4.2.1寻找眼睛对
为了在横纹目标图上寻找可能的眼睛对组合,定义和种三角形模板,如图7(a)和(b)所示,分别用于给定眼眉寻找对应眼睛的范围和给定眼寻找右眼和右眉的范围。
定义1:
定义为以P为顶点的下等腰三角形区,其顶角角度为
,高度为h。
定义2:
定义为以P为顶点的右等腰三角形区,其顶角角度为
,高度为h。
考虑到考感到眼镜和头发等对粗检可能引起的影响,还定义了
如图7(c)所示,在白区可允许存在—个噪声点。
定义3:
定义为所剩余的等腰梯形区,h1>h2.
图7寻找眼睛队的模板示意图
4.2.2以眼睛对为基准确定候选人脸
(a)横文目标图上的候选人脸(b)粗检后的结果
图8候选人脸的检测
4.3细检
4.3.1灰度投影检测
4.3.2区域灰度和纹理检测
4.3.3二维熵分割检测
图9最终人脸检测结果
5.人脸检测算法的总体流程
图11自动人脸检测流程图
6.实验结果
图12部分实验结果
集合
总人联数
检出的人脸数
漏检人脸数
误检人脸数
正确检测率
漏检率
误检率
学习集
401
377
24
22
94.01%
5.99%
5.49%
测试集
625
564
61
48
90.24%
9.76%
7.68%
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 识别 相关 算法