哈夫变换检测固定半径圆在人眼定位中应用.docx
- 文档编号:27097867
- 上传时间:2023-06-27
- 格式:DOCX
- 页数:14
- 大小:892.99KB
哈夫变换检测固定半径圆在人眼定位中应用.docx
《哈夫变换检测固定半径圆在人眼定位中应用.docx》由会员分享,可在线阅读,更多相关《哈夫变换检测固定半径圆在人眼定位中应用.docx(14页珍藏版)》请在冰豆网上搜索。
哈夫变换检测固定半径圆在人眼定位中应用
哈夫变换检测固定半径圆在人眼定位中的应用
摘要:
人眼检测在许多基于眨眼计算和眼睛直径指标控制应用如虹识别、疲劳检测中是必需的阶段。
这篇文章提供了一种利用图像处置技术伴随最小的硬件支持来检测图像中眼睛的存在及其位置的方式。
预处置含有彩色范围处置和彩色分割。
哈夫变换被应用在利用固定半径圆的方式的研究中。
进展算法的表现是通过几个方面来评定的,例如人脸的精准识别和人眼定位。
关键词:
哈夫变换人眼定位固定半径
Ⅰ简介
通过键盘,鼠标或其他基于手工的设备,人工和运算机之间的彼此作用已经被限制。
最近几年,新技术开始在运算机领域中出现,这也使如通过声音和视线跟踪的人工智能交互的其他方式取得提升。
基于视线跟踪的几种研究在人工智能或其它应用类型上已经完成了。
这些研究的应用进展表此刻很多方面,例如利用视线跟踪来移动鼠标点或通过键盘打字呈此刻电脑屏幕上。
在视线跟踪中人眼定位是一件首要的事。
在那个工程中,一种算法为了图像中人眼的定位被研究。
那个系统能够检测人眼的移动及其移动方向。
那个信息那时被用作人类视力适应的学习数据或令人工智能交互系统的每一个部份成为整体为没有能力的人服务。
早在1936年,Mowrer就开始视力研究了,他成功制造出自动的头部眼睛方位的记录及视线跟踪方向。
在视力中的研究比其他人工智能交互作用的类型带来更多的利益,因为人眼的移动能够提供许多的信息。
眼睛的移动能够作为一种情感的表达方式和残疾人的交流方式。
图像中人眼定位技术分为两种类型:
介入式和非介入式。
介入式要求主题带有必然的设备,像特殊的联系晶片或电子显微镜,它们能够跟踪视线。
另一方面,非介入式使主题能够自由带有任何类型的设备。
非介入式包括红眼效果、特征检测和神经网络。
在这一研究中,基于图像特征检测的非介入式使被关闭的。
特征检测技术能够达到人眼定位的效果,因为它不要求主题带有任何设备,特征检测技术主要依托定位人眼的唯一特征,例如眼睛的环形状。
那个技术能够与其他运动检测技术相结合去跟踪人眼的移动及移动方位,那个研究的范围仅限于基于特征检测的人眼定位。
Ⅱ方式学
全面的系统被分为3个阶段:
视频和图像的获取、图像的预处置及人眼定位。
系统的每部份都负责人眼的渐进定位。
那个系统是基于来自于一段视频图像框架的输入,从而数码相机捕捉视频的能力被需要。
那个系统算法及利用者界面是利用MATLAB版本服务包装2被成立的。
那个系统的第一阶段是视频和图像的获取,在这一阶段中,一个单独的来自捕捉的视频框架被转换成图像框架,而且被贮存在记忆中。
在第二阶段,图像框架输入到图像预处置部份,这里人脸和人眼所在区域被定位。
在预处置阶段利用如YcbCr彩色模型来检测皮肤颜色,制定人脸和人眼四分之一比率的界限及利用MATLAB函数移动不想要的脸部特征,通过利用眼睛区域图像剪裁来自预处置阶段的图像。
在最后阶段人眼的位置被肯定。
这一阶段是通过Sobel或Prewitt边缘检测来完成的,而在人眼定位阶段用的事哈夫变换检测固定半径圆,在这一阶段人眼的中心位置或其他协调位置被取得。
在人眼定位阶段提取人眼边缘由于边缘检测算法利用能力不充分可能在许多框架中发生错误。
由于视频或图像的持续被利用,算法将从一个框架到下一个框架继续被利用。
在第3阶段的最后来自最近的框架将被保留在运算机记忆中,而且系统将继续处置下一个来自第一阶段的视频框架的初始化。
若是最近的框架就是视频的最后一个框架,这是系统将停止,表示视频处置结束。
A、边缘检测
在图像目标的边沿,边缘检测利用其灰度中断,那个中断在图像中通过利用像素一阶和二阶导数来计算。
在一个目标的边缘存在一灰度转变猛烈的地方,如图1所示。
边缘的灰度轮廓呈现一个从黑道白的梯度转变,通过计算其一阶导数,一个最高点被定位在过渡的独立点上。
二阶导数呈现了来自边缘黑暗边过渡的踊跃最高点,边缘的消极最高点为白边。
一阶导数通常被用于检测边缘的存在,而二阶导数为了检测是不是边缘像素在黑或白边。
图像的边缘能够被概念为从一个区域到另一个区域灰度转变猛烈的地方。
按照转变率图像的梯度函数在那一点有庞大的作用,它能够通过一阶导数按照倾斜度被检测。
一个图像的梯度函数f(x,y)被概念为矢量:
(1)
那个矢量的大小是:
(2)
它的方向是:
(3)
若是函数的方向导数沿着任意两个直角都明白,则该图像的梯度能够被计算出来。
梯度算法有很多类型,它们之间的主要不同是在这些方向中它们的近似的一阶导数和它们结合这些导数计算的梯度的品级。
边缘检测中几个著名的梯度算法是Roberts,Sobel,Prewitt和Canny。
输出图像来自另一个边缘检测仅仅包括二元的信息,1表示检测到边缘,0表示无边缘,而且由于噪声,干扰在边缘中,边缘通常取得不完整的形状致使不一致的解释和其他因素而产生假的边缘。
二元图像需要更深的出来来取得有效的信息。
B、哈夫变换检测线
哈夫变换是一个被用于检测简单形状的技术,例如直线。
在一幅n*n图像中为了寻觅直线,最简单的方式是在图像中计算所有可能在同一直线上的点来概念线,然后找出所有点的特征子集,它们的集合接近一条特殊的线。
那个计算量将是庞大的,因为在图像中最大计算量可能是n(n-1)/2~n²和n[n(n-1)]/2~n³比较需要每两个点之间执行。
利用哈夫变换解决了那个问题,它利用形状的参数描述减少了计算量。
两个点(x1,y1)和(x2,y2)在xy轴上被考虑,直线方程式为:
yi=axi+b(4)
重写为:
b=-axi+yi(5)
这是在xy和ab轴上的两点被描述为如图2所示。
第一个点(x1,y1)和第二个点(x2,y2)在ab轴中每一条直线上,而且两条直线相交于点(a´,b´).这是正确的因为所有的点都包括在这条直线里。
利用那个唯一的特征参量空间被称作累加单元或哈夫空间被创建拥有一个小的和大的范围的ab坐标。
那时的每一个单元都已经被初始化为0。
由于在二元图像中的每一个单元(边缘检测后的图像)包括1,在ab坐标平面上直线被计算及那直线的部份每一个单元增加到1。
当在二元图像中包括1的每一个像素被算出后,与其它单元比较拥有很多交叉点的单元含有更高的价值。
在ab平面中的这些单元的坐标将被用于在xy平面内成立直线。
C、固定半径圆检测
检测侧直线的方式能够被扩展到圆的检测。
在圆的检测中,方程式(5)被圆的方程式所替换为:
(6)
与直线中只有两个参考数相较元检测方程中含有三个未知参考量,从而,为了三个未知量累加器单元需要从长、宽到长、宽、厚做改变。
已知半径r的圆的简单方式被利用在这研究中被作为一种快速的人眼检测方式。
利用那个方式,仅仅只有长、宽两个累加单元被需要,因此维持了哈夫变换的简单。
在哈夫变换检测直线和检测圆之间其使它们之间保留了相似点。
当线检测时,在累加单元里为了生产圆的截取,每次截取累加器单元加1,累加器单元的可能情形如图3所示:
在图像中,点(a,b)的价值相当于累加器中的最高点就是检测圆的参考量。
Ⅲ分析&结果
A、预处置
为了定位眼睛,在图像中明白人脸的位置是超级重要的。
人脸框架识别的关键原因是显而易见的,因为需要被定位和跟踪的人眼在人脸的某一固定位置,运算机不明白这些,因此必需让电脑明白人脸的位置和眼睛的区域。
识他人脸的一种方式是运用彩色分割技术,这种技术的背后思想是实际上脸大部份被皮肤覆盖,而且在图像框架中仅皮肤颜色目标是人脸。
在这种技术中,图像被从RGB模型转换为YcbCr模型,这种图形框架的转化如图4所示:
在Cb和Cr的色差层皮肤颜色能够被检测。
Cb组成部份皮肤颜色价值是图5上的第一个最高点而第二个最高点属于其他的非皮肤对象。
另一方面,Cr组成部份组成部份皮肤颜色价值是图6上的第二个最高点而第一个最高点属于其他的非皮肤对象。
利用来自直方图的信息,图像开始技术能够创建一个基于Cb和Cr组成的面罩。
图7显示了那些面罩产生的Cb和Cr的价值及其结果。
Cb和Cr二者的面罩被结合会给出一个更好的结果,因为Cb和Cr皮肤颜色的价值之间有一个强壮的关系,那个关系在图8中被说明。
接下来的步骤在图像的预处置阶段是的取得脸部区域的坐标。
在有效的变窄区域,脸部区域的坐标是关键的,它能够通过基于最终的面罩找出xy轴上的最大和最小坐标被取得。
脸部的最大和最小的坐标通过寻觅白色像素被取得,并记下最大和最小数检测x-y的作用。
结果如图9所示:
基于人脸区域的坐标,人眼区域能够被判断通过利用一些简单的计算,在这一判断中,必需确保头部不能移动或加题目与任何一边。
从图10可得,人眼区域可能位于人脸区域的第二个四分之一处。
通过利用以下公式来估量人眼的区域:
(7)
(8)
(9)
图11呈现了从源图像框架取得人眼区域的结果:
人眼的ROI的区域尺寸能够被减少移动不想要的脸部特征如眉毛和头发。
人脸面罩的算法一样能过被用于人眼区域的面罩。
MATLAB函数imclearbord和bwareaopen被用于移动连接图像的边沿和人眼区域中不想要的对象。
B、人眼定位
哈夫变换仅能被用于边缘检测在人眼上执行后,因此,许多预处置步骤需要被执行在哈夫变换用于检测瞳孔之前。
需要做的第一件事是将人眼区域图像从RGB到灰度转换,当人眼图像被转换成灰度图后,边缘检测技术在图像上能够被执行。
边缘检测算法的几种类型能够被用于图像,其结果如图12所示。
从利用不同的边缘操作取得的结果可看出Sobel和Prewitt边缘操作更适合瞳孔边缘检测的工作且噪声干扰最小。
Robets操作不适合,是因为人眼的边缘检测不充分,另一方面,Canny算法产生很多细节,这可能在利用哈夫变换检测圆的下一步造成问题,可是Canny边缘算法的阀值能够被判断取得与Sobel和Prewitt边缘操作过一样的结果。
虽然边缘操作成功的提取了瞳孔的边缘,眼脸边缘也被专门好的提取,但这可能会造成一个问题,因为它可能是错误的通过做为圆进行哈夫变换,因此为了减少不想要的边缘,在边缘检测图像之前灰度图像上的阀值被执行,如此能提高眼睛边界的检测因为有少的不想要的对象。
来自边缘图像的瞳孔检测能够运用哈夫变换检测固定半径圆来完成哈夫变换算法研究仅适合预先半径肯定了的圆,瞳孔的尺寸大小决定了圆的半径且预先进行了手工操作。
这种算法的结果如图14所示:
人眼区域中的人眼的精准定位受眼睛图像边缘精准定位的大影专门大,若是有很多不完整的边缘,它们不属于瞳孔,那么哈夫变换算法可能被混淆并产生一个检测错误。
检测错误被概念为任何定位人眼的中心不位于人眼的瞳孔区域。
在另外一种见地中,若是哈夫变换已经误证一个不是眼睛的对象作为人眼,那么已经发生错误将被告知。
图15清楚的突出了成功的人眼定位于错误定位之间的图片。
图15呈现的人眼定位错误的发生的主要原因是由于通过哈夫变换算法眼脸的边缘被误证为人眼的边缘。
当通过眼脸眼睛被局部的封锁和给了不完整的眼睛边缘时,那个错误通常发生。
图15也呈现过了凭借眼睛中心位置的十字准线成功的人眼定位。
表1显示了视频V1和视频V2人眼定位的错误率。
通过表1查询了解到V1的平均错误率是%,V2的平均错误率是%。
利用表1里的数据能够计算出V和V2的平均成功率,V1的平均成功率是%,V2是%。
Ⅳ结论
按照非介入式的一种研究图像处置算法已经被实验于人眼定位。
那个算法涉及三个阶段:
图像获取、预处置和人眼定位。
在图像获取阶段捕捉视屏并将其转换成图像框架,在于预处置阶段,在图像中YcbCr彩色模型被用于检测皮肤颜色皮肤颜色检测描画人脸,且其四分之一被用于取得人眼区域,在人眼定位阶段,边缘检测操作被用于创建边缘轮廓图像,从那个图像,哈夫变换检测固定半径圆被用于检测瞳孔。
按照以前的部份结果,得出那个系统已经实现了瞳孔检测错误可能在10%左右的一个适当的好的人眼的精准定位。
致谢
感激MalaysiSarawak大学对该研究的大力支持,通过寻觅参考NUIMAS/21/09-01.2.4(09)向作者表示感激!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变换 检测 固定 半径 定位 应用