基于DSP开发人脸识别系统文档格式.docx
- 文档编号:19166774
- 上传时间:2023-01-04
- 格式:DOCX
- 页数:9
- 大小:59.59KB
基于DSP开发人脸识别系统文档格式.docx
《基于DSP开发人脸识别系统文档格式.docx》由会员分享,可在线阅读,更多相关《基于DSP开发人脸识别系统文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
2、国内外的研究现状
计算机人脸识别的研究起始于20世纪60年代末。
最早期的算法主要是基于部件的,利用人脸的几何特征来进行识别。
并且大都在较强约束条件下进行的。
20世纪90年代后,形成了大量比较经典基于整体的算法如:
基于Fisherface(LDA)的人脸识别方法;
基于特征脸(PCA)的人脸识别算法;
基于模板匹配(Correlation)的人脸识别算法等;
90年代中期后,形成了整体识别与局部分析相结合的发展趋势。
此后,经过全世界研究的共同努力,人脸识别虽然有了很大的发展。
目前已有产品投入实际应用。
但对于复杂光照问题和多姿态人脸识别问题的解决还不是十分令人满意。
现阶段,发展趋势是应用红外的方法及三维空间的识别。
人脸识别领域内最著名的国外研究机构包括:
美国麻绳理工学院媒体实验室及人工智能实验室、南加州大学、卡内基—梅隆机器人研究及交互系统实验室、马里兰大学等;
从78年以来,国内开始了对人脸识别的研究。
此后在许多研究机构在自然基金、863计划等的支持下,有了很大的发展。
著名的有:
清华大学计算机系、自动化系,中科院自动化研究所,上海交大图象处理与模式识别研究所等;
他们在人脸识别领域进行了大量的探索,积累了丰富的经验。
3、研究目的、内容和方法
3.1研究目的
本课题是基于DSP构造一个人脸识别系统。
本人主要工作是在人脸检测部分已经完成的基础上,运用合理的人脸的特征提取方法及识别算法,并将算法在DSP硬件平台上实现,使得系统最终的识别率、计算时间等达到理想的标准。
3.2研究内容和方法
人脸识别主要可以解决两大类任务:
一是给定一幅待识别人脸图像,判断它是库中的哪个人,也就是通常所说的身份识别(Recognition),它是个“一对多”的匹配过程;
另一个是给定一幅待识别人脸图像,判断它是不是某人,也就是身份验证(Authentication),它是个“一对一”的匹配过程。
本文研究的人脸识别系统主要应用于入口管理,是一个门禁系统,所以属于“一对多”的身份识别系统。
(1)人脸识别框架
人脸图像识别的框架如图1所示:
图1人脸图像识别框架
①图像获取:
从摄像机等图像输入设备,捕获图像。
②人脸检测及定位:
从捕获的图像中检测是否有人脸,如果有则定位人脸区域.
③人脸图像预处理:
对人脸图像进行预处理,包括人脸图像的滤波去噪、直方图均衡等并对图像作旋转、几何校正,并对人脸进行灰度、尺寸等的归一化.
④人脸特征提取:
人脸的表示具有多样性和唯一性,对人脸特征的抽取既要保持这种多样性和唯一性,又要实现有效图像降维,以加快学习识别过程。
⑤人脸识别:
将待识别的人脸图像或者特征与人脸数据库中的进行比对和匹配。
人脸识别判决方法的选择决定于识别率的高低,是人像识别的最关键的技术。
(2)人脸检测方法
人脸检测实际上是区分“人脸”和“非人脸”。
其基本思想是基于知识或统计的方法对人脸建模,然后比较所有待检测区域与已建立模型的匹配度,从而得到可能存在的人脸区域。
人脸检测方法一般分为以下几类:
①基于知识的人脸检测
基于知识的人脸检测算法是利用人脸的先验知识导出的规则来进行人脸检测的。
人脸局部总是存在一定的规律,例如:
人的两个眼睛总是对称分布在人脸的上半部分,鼻子和嘴唇中心点的连线与两眼之间的连线大体垂直,灰度图像中眼睛要比脸上其他地方暗等。
这些规则可以表述为人脸局部特征之间的相对距离和位置关系,当满足这些规则的图像区域找到后,就认为一幅人脸图像已被检测出来。
这种方法所存在的问题主要是:
检测率不高,如果图像背景中存在类人脸区域,则必然会导致误检;
对于不同视角的人由于某些人脸特征不可见,所以不能使用这种方法检测;
用于描述人脸特征之间关系的规则不易设计,规则制定的过高或者过低会造成拒识或误识。
基于面部重要器官特征的人脸检测方法在人脸识别研究的初期应用比较多,现在人们往往把它作为其它检测方法的辅助手段。
②基于统计的人脸检测
这种方法遵循一种统一的模式,即首先通过学习,在大量训练样本集的基础上建立一个能对人脸和非人脸进行正确识别的分类器,然后对被检测图像进行全局扫描,用分类器检测扫描到的图像窗口是否包含人脸,若有,则给出人脸所在的位置。
实际上,人脸检测问题被转化为了统计模式识别中的二分类问题。
采用这种检测模式的理论依据是:
人脸具有统一的结构模式,如果把所有的图像集看作一个高维线形空间,那么人脸图像集只对应于其中的某个子空间。
于是可以通过检验待测图像窗口是否落在这个子空间中来判断其是否为人脸。
因此,可以通过大量的人脸和非人脸样本来建立一个分类器,使它能够正确分辨这两种不同的分类模式,再利用训练好的分类器在未知的图像中检测人脸。
采用这种检测策略的关键在于如何选取大量的具有代表性的图像样本,特别是非人脸图像样本,来训练分类器。
采用这种方法进行人脸检测的例子有Sung和Poggio提出的基于样本学习的人脸检测方法,Rouly[5,6,7]等实现的基于神经网络的方法;
Turk,Pentland,Moghaddam[8,9]提出的基于主成分分析(PrincipalComponentAnalysis,PCA)的人脸检测方法;
Osuna[10]等的基于支持向量基(SVM)的方法;
PaulViola和MichaelJones提出的基于Adaboost的人脸检测算法。
③基于特征的人脸检测
基于特征的人脸检测方法将人脸视为显著器官的组合,通过不同的方法,检测出不同的人脸面部特征的位置,然后根据它们之间的空间几何关系来定位人脸;
或者根据人脸固有的、不变的特性,如轮廓规则、肤色、纹理规则等,通过检测是否满足这些规则等来检测和定位人脸。
这一类方法有基于肤色的人脸检测、具有局部特征的人脸检测、基于多个特征综合的检测方法等。
④基于模型的人脸检测
所谓基于模型的方法,是指从构造人脸或某个面部器官的模型出发。
通过各种模型搜索和匹配算法,结合对模型参数的调整,达到检测和定位的目的。
模型匹配方法通常是基于特征的方法的进一步确认。
基于模型的方法包括早期的基于预定模型匹配的检测方法[11,12]以及后来的基于变形模型[13,14]的匹配方法。
早期基于预定模型匹配的检测方法是这样做的:
首先建立一个标准的人脸模型,由包含局部人脸特征的子模型构成,然后对一幅输入图像进行全局搜索,对应不同尺度大小的图像窗口,计算与标准人脸模型中不同部分的相关系数,通过预先设置的阈值来判断该图像窗口中是否包含人脸。
这种方法易于实现,但是也存在着缺点:
图像噪声对检测结果影响很大,因此需要对输入图像做适当的预处理,而且模型的大小是人为设定的,因此不能动态检测眼睛等器官的位置。
这种方法的优点在于,能够检测不同大小、具有不同偏转角度的物体。
但是其缺点是检测前必须根据待测人脸的形状来设计轮廓,否则会影响收敛的结果;
当对图像进行全局搜索时,计算时间过长。
一般来说,人脸检测分为以上四大类,而事实上对有些人脸检测的方法分类是比较困难的,因为有些方法从不同的角度分析时,完全可以将它分到其他不同的类别中。
同时很多研究者可能综合了多种方法的思想,形成一种新的人脸检测方暗,来提高检测的效果。
(3)人脸识别方法
人脸的特征提取和特征识别(匹配)是人脸识别中最为关键的两个问题。
事实上,人脸识别研究的发展主要就体现在这两个问题上,即提取人脸的什么特征和用什么手段进行分类。
在这里,将这两个问题都归于人脸识别算法里。
针对这两个问题,人们提出了许多种人脸识别算法:
面部几何特征的识别方法;
基于特征脸(特征子空间)[15]的人脸识别算法;
基于模板匹配(静态匹配和弹性匹配)的人脸识别算法;
基于人工神经网络的识别算法[16];
等灰度线法[17];
基于特征融合的人脸识别算法[18]等许多种:
①基于面部几何特征人脸识别算法
这类识别方法将人脸用一个几何特征矢量来表示(特征提取),用模式识别中层次聚类的思想设计分类器达到识别目的(人脸识别)。
常采用的几何特征有人脸的眼睛、眉毛、鼻子、嘴等重要器官的局部形状特征,脸型特征及五官在脸上分布的几何特征。
在这种基于几何特征的识别中,识别总是归为特征矢量的匹配,基于欧式距离的判决是常用的识别方法。
②基于特征脸(特征子空间)的人脸识别算法
对人脸识别技术影响最大的是特征脸技术。
它根据一组人脸训练图像构造主元子
空间。
由于主元具有人的脸的形状,也称为特征脸。
特征脸相当于与人脸协方
差矩阵的主特征值有关的特征向量。
主元子空间大大降低了原始空间的维数,识
别时将待识别图像投影到这个主元子空间上,得到一组投影系数,和各个已知人
的人脸图像进行比较和识别。
利用特征脸的方法进行人脸识别有其它人脸识别算法不能替代的优势,所以在人脸识别领域,特征子空间的方法是人们研究的一个热门方向。
③基于模板匹配(静态匹配和弹性匹配)的人脸识别算法
模板匹配方法的思想是:
库中存储着已知人脸的若干模板,这些模板既可以是整张人脸的灰度图像(viewbased),也可以是各生理特征区域的灰度图像(subviewbased),还可以选择经过某种变换的人脸图像作为模板存储。
识别的时候,经过同样变换的输入图像的所有像素点位置与库中所有模板采用归一化相关度量进行匹配识别,来达到分类的目的,完成人脸的识别。
上述为静态模板匹配,但是它存在着对不同表情的人脸鲁棒性差的缺点,针对这一情况,人们提出了弹性模板匹配。
弹性模板匹配是根据待检测人脸特征的先验的形状信息(通常利用小波特征),定义一个参数描述的形状模型,该模型的参数反映了对应特征形状的可变部分,它们最终通过模型与图像的边缘、峰、谷和灰度分布特性的动态地交互适应来得以修正,可以较好地检测出相应的特征形状。
由于可变形模板要采用优化算法在参数空间内进行能量函数极小化,因此算法的主要缺点在于两点:
一、对参数初值的依赖程度高,很容易陷入局部最小;
二、计算时间长。
④基于神经网络的人脸识别算法
神经网络由于其并行式的信息处理方式以及分布式的编码存储方式,故可用于模式识别,且不受目标形变的影响。
神经网络在人脸识别中的应用很广,它有其特殊的适合于人脸识别的优势。
该方法把模型的统计特征隐含于神经网络的结构和参数中。
对于人脸这种复杂的、难以显示描述的模型,基于神经网络的方法具有显著的优势。
通常利用神经网络进行识别需要考虑两方面的因素:
(1)选择人脸图像的哪些参数作为神经网络的输入;
(2)选择何种神经网络。
通常将全局的特征提取与人工神经网络结合起来,这样在人脸识别方面得到比较好的效果。
其他人脸识别算法
以上介绍的是几种典型的人脸识别方法,从分析中可以看出,每种方法各有其优缺点,因此一些学者倾向于将多种方法综合起来,或同时利用不同种类的特征。
称为多数据融合的方法。
此外还有红外人脸识别方法和三维人脸识别方法。
(4)研究方案
作为人脸识别系统的前提,快速有效的人脸检测至关重要。
现在由于彩色图像获取的广泛使用,利用色彩信息进行人脸检测,具有直观、简单、快速的特点,非常适用于作为自动人脸识别系统的人脸粗定位环节。
对于同一种族的人来说,其肤色具有较强的共性,并且一般都明显有别于大多数背景的颜色。
利用这一点,可以快速地大致框出人脸可能存在的区域。
主要是根据皮肤颜色在颜色空间中的分布,用统计的方法进行分割算法的设计以判断某个像素点是否属于人脸区域。
同时,为了增强算法对光照条件改变的鲁棒性,通常将像素点的颜色从RGB空间变换到其他空间中,只利用其中的色度和饱和度的信息进行判断。
在本研究课题的人脸检测部分,采用以上方法即用肤色信息对图像进行分割得到人脸的候选区域。
在人脸的特征提取和特征识别部分,将采取先用小波变换和核主元分析方法相结合的方法对人脸图像进行特征提取,然后依据支持向量机方法对所提取的主元特征进行分类识别。
1.小波变换
本次设计将采用二维小波变换对人脸图像做频域分解。
通过一次小波变换可以得到四个区域:
低频区域LL,高频区域LH、HL、HH,分别是水平分量、垂直分量、对角分量。
对每次变换得到的LL还可以再次进行小波变换。
采用小波变换出于两个方面的考虑,其一,研究指出,低频子图像包含了原始图像的主要描述信息,而其他3个高频子图像包含的信息较少。
并且人脸的表情变化和少许遮掩只影响图像中高频部分的变化,这样人脸图像的低频部分就在有表情变化的情况下仍然比较稳定,因此可以考虑仅对人脸图像的低频部分进行识别,而利用小波变换可以达到这个目的;
其二,因为求取特征时要求本征值特征,计算量较大,而如果只利用小波变换的低频图像的话,数据量就减少到了原来的四分之一(仅作一次变换),可以较大的提高运算速度。
常用的小波函数有Harr小波,Marr小波,Morlet小波,Daubechies小波。
在各种小波中,Daubechies小波具有最小支集和广义线性相位,而且Daubechies小波具有良好的局部化性质,可以不断地以任意精度逼近所要讨论的系统,因此在构造小波滤波器时选用了Daubechies小波。
2.核主元分析方法(KPCA)
主元分析方法(PrincipalComponentsAnalysis,PCA)是一种有效的特征提取法。
该方法依据输入原始数据构成的协方差矩阵,计算前M个较大特征值所对应的特征向量,以此作为最佳投影方向。
当进行特征提取时,将原始数据向最佳投影方向线性地投影到主元空间,从而得到原始数据的特征,这种方法将数据从原来的R维空间降维投影到M维空间(R﹥﹥M),在降维后保存了数据中的主要信息,从而使数据更易于处理,这种提取特征法被广泛地应用于人脸识别中。
传统的主元分析法(PCA)是基于原始特征的一种线性变换,当原始数据存在非线性属性时,使用PCA分析后留下的显著成分就可能不再反映这种非线性属性。
在人脸图像中,有相当部分对分类有用的非线性成分,理论上KPCA方法将优于PCA。
由于PCA仅从象素的2阶依赖上考虑,对多像素之间的依赖性或像素的高阶关系不敏感。
考虑了人脸的高阶统计量的核主元分析法(KPCA)将有利于人脸识别.KPCA的基本思想是通过一个非线性变换把输人数据,映射到一个高维的特征空间。
即可以把在输人空间无法线性分类的数据变换到特征空问再利用PCA进行特征提取。
3.支持向量机
支持向量机是建立在统计学习理论的VC
维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力(Generalization
Ability)。
具有以下几个优点:
(1)它专门针对小样本情况,其目标是得到现有信息的最优解而不是当样本数目趋于无穷时的最优解;
(2)算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了在神经网络方法中无法避免的局部极值问题;
(3)算法将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性判别函数来实现原空间中的非线性判别函数,特殊性质能保证机器有较好的推广能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关;
概括说,支持向量机就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个空间中求广义最优分类面。
SVM分类函数形式上类似于一个神经网络,输出是中间节点的线性组合,每个中间节点对应一个支持向量。
在SVM
方法中,只要定义不同的内积函数,就可以实现多项式逼近、贝叶斯分类器、径向基函数(Radial
Basic
Function
或RBF)方法、多层感知器网络等许多现有学习算法。
4.系统结构
系统主要分为两个过程:
1.训练阶段(红线)。
对人脸图像训练集中人脸图像进行小波分解,用上面提到的方法提取人脸特征向量,建立人脸特征向量训练集}由人脸特征向量训练集建立支持向量机分类模型。
2.识别阶段(黑线)。
对要识别的人脸图像进行小波分解,提取人脸特征向量;
将该向量送人支持向量机进行分类与识别。
如图2所示。
4硬件平台简介
本次设计采用的硬件平台是北京瑞泰创新科技有限责任公司生产的ICETEK—C6711—IDK图象处理系统。
主要特性:
1.主板
(1)、TMS320C6711通用数字信号处理芯片,主频150MHz,处理能力900 MIPS
(2)、CPU外时钟为150MHz,外部存储接口(EMIF)SDRAM频率为100MHz
(3)、并行端口控制器(PPC)为标准的并行端口模式(EEP或SPP)
(4)、256MBit100MHz的SDRAM
(5)、8MBit可编程可擦写只读存储器
(6)、通过并行端口的嵌入式内置仿真或外部仿真器仿真
(7)、扩展了存储器和外围连接器以便与子板的连接。
(8)、RS232接口
2.扩展板
(1)、双FPGA(10万门)控制图象的存取
(2)、双SDRAM(2M×
32bite),存储图象
(3)、RS232接口
(4)、视频输入输出接口
3.摄像机一台
4.彩色液晶屏一个
5预期的难点
(1)同一人脸不同姿态的人脸图像之间的相关性随着姿态变化的增加而迅速减少。
不同姿态同一人脸图像的识别,是本课题要研究的一个难点。
(2)对人脸表情发生变化,光线变化以及人脸有眼镜、头发等遮挡物时的人脸识别问题,如何提高算法的鲁棒性也是本文的一个难点。
(3)如何充分利用DSP的性质,运用C语言和DSP的汇编语言编制出优质,高效的程序,即满足实时性的要求,又要保证识别率是本课题的另一个难点。
7工作计划与进度安排
8参考文献:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DSP 开发 识别 系统