基于帧间差分算法的运动目标检测研究毕业设计论文.docx
- 文档编号:26462606
- 上传时间:2023-06-19
- 格式:DOCX
- 页数:50
- 大小:496.83KB
基于帧间差分算法的运动目标检测研究毕业设计论文.docx
《基于帧间差分算法的运动目标检测研究毕业设计论文.docx》由会员分享,可在线阅读,更多相关《基于帧间差分算法的运动目标检测研究毕业设计论文.docx(50页珍藏版)》请在冰豆网上搜索。
基于帧间差分算法的运动目标检测研究毕业设计论文
毕业设计(论文)
题目名称:
基于帧间差分算法的运动目标
检测研究
毕业设计(论文)原创性声明和使用授权说明
原创性声明
本人郑重承诺:
所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:
日 期:
指导教师签名:
日 期:
使用授权说明
本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:
按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:
日 期:
学位论文原创性声明
本人郑重声明:
所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。
除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律后果由本人承担。
作者签名:
日期:
年月日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名:
日期:
年月日
导师签名:
日期:
年月日
注意事项
1.设计(论文)的内容包括:
1)封面(按教务处制定的标准封面格式制作)
2)原创性声明
3)中文摘要(300字左右)、关键词
4)外文摘要、关键词
5)目次页(附件不统一编入)
6)论文主体部分:
引言(或绪论)、正文、结论
7)参考文献
8)致谢
9)附录(对论文支持必要时)
2.论文字数要求:
理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
3.附件包括:
任务书、开题报告、外文译文、译文原文(复印件)。
4.文字、图表要求:
1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写
2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。
图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画
3)毕业论文须用A4单面打印,论文50页以上的双面打印
4)图表应绘制于无格子的页面上
5)软件工程类课题应有程序清单,并提供电子文档
5.装订顺序
1)设计(论文)
2)附件:
按照任务书、开题报告、外文译文、译文原文(复印件)次序装订
3)其它
摘要
运动目标检测在图像处理方面的一个很重要的应用。
在计算机视觉领域,运动目标检测研究一直是一个很好的研究方向,并且运动目标检测是分析动态图像的基础。
它在很多领域都有很广泛的应用。
比如重要场所的安全监控、航空制导、汽车驾驶等方面都。
目前国内外提出了很多种运动目标检测的方法,不过至今为止,还没有一种方法能够适应在各种测试环境中,每种方法都有自己的局限性。
在所有的运动目标检测方法中,帧间差分算法是最常用的一种运动目标检测方法。
帧间差分算法的优点是实现相对简单,程序设计复杂度低,易于实时监控等。
缺点是检测出的位置不一定精确,并且不能提取出完整的目标。
在运动目标检测方面,本文通过实现一种三帧差分算法来进行运动目标的检测。
该算法通过对视频序列进行预处理,运用帧间差分的方法提取出运动目标的大致图像,然后运用数学形态学的逻辑运算进行去噪处理,研究并分析实验结果,以期达到理想的检测效果。
实验结果表明,该算法准确性高,实时性好,能较好的解决问题,具有一定的使用价值。
关键词:
帧间差分;运动目标检测;数学形态学
Abstract
Movingobjectdetectionisoneofthemostactiveresearchfieldsofimageprocessingandcomputervision,andit’sthefoundationofdynamicimageanalysis.Itisusedwidelyinmanyfields,suchasanimportantplaceofsafetymonitoring,trafficcontrol,aviationandnavigation,cardrivingandsoon.Sofarthereexistsmanymethodsofmovingobjectdetectionintheworld,However,everyoneofthemhavetheirownlimitations.Inallofthem,interframedifferenceisoneofthemostfrequently.usedmethods.Itsdemeritsisthatitissimpletorealize,anditsprogramsissimple,itiseasytomomentlymonitor.However,interframedifferencecan’tdetectaccuateposition,Alsoitcan’tgetcompleteobject.
Aboutmovingobjectdetction,thispaperwepresentsathree.framedifferencealgorithmofmovingtargetdetection,thealgorithmfirstpreprocessthevideotoextractthetargettoresearch,byusinginterframedifferenceandthelogicmethodofmathematicalmorphology.Theexperimentalresultsshowsthat,thealgorithmishighaccuracyandgoodreal.timeperformance,itcansolvetheproblemeffectivelyandhascertainapplicationvalues.
KeyWords:
Interframedifference;Movingobjectdetection;MathematicalMorphology
第1章引言
1.1课题研究的目的及意义
我们知道,在我们的所感知到的环境信息中,视觉信息是最多的,它在人们的生活中占了相当大的一部分比例,而且在这里面,动态的视觉信息在其中有着很重要的地位。
人类对环境中的动态视觉信息的研究是计算机视觉研究的一个重要方向。
在我们的生活中,多数有意义的视觉信息基本上都是动态的,是运动的而不是静止不动的,然而动态的视觉信息与静态信息相比,更不容易捕获。
虽然我们的眼睛既能看见静止事物也能看见移动事物,但是在许多重要场合,例如交通流量检测,航空制导以及重要场合安保等环境,人类以自己的视觉捕捉到的信息,往往不能实现所预期的要求。
因此,借助外部设备来捕获动态视觉信息并进行分析,是图像处理在现实生活中的应用实例。
运动目标检测在图像处理和计算机视觉领域是一个非常活跃的研究方向,运动目标检测是动态图像分析的基础[17]。
目标运动图像序列为我们提供了非常多有的用的信息,对运动目标的检测研究,可以使我们提取到这些有用信息,从而应用于我们的现实生活中。
运动目标检测算法的大致步骤有以下几个方面:
首先选取视频序列中的图像,对图像中给定的像素区域进行分析,然后根据帧间的数据差异,可以产生相对应的运动信号,从而获取到场景中的运动目标。
运动目标检测在特定的场景中提取运动目标,并将其从背景中分离提取出来,并以此结果来分析检测到的目标能否提供有效的价值,从而帮助人们在生活中更有效的解决遇到的问题。
因此,对运动目标检测有关算法的研究具有重大的理论价值和现实意义。
1.2课题发展状况及应用前景
多年以来,计算机视觉方面的专家针对视频图像中的运动目标检测问的题,做了大量而深入的研究,并且提出了不少的运动目标检测的方法。
其中常用的背景差分法,帧间差分法,光流法,背景差分法与帧间差分法的结合方法等,帧间差分算法是最常用的方法。
虽然发展到现在,人们在运动目标检测方面取得了一定的进展,然而到目前为止,人们并没有还实现一种能适用于各种场合、各种情况的通用算法。
目前计算机方面的专家们所提出的算法各有缺陷,几乎没有一个算法能同时满足准确性、稳健性、可靠性等各种特性,因此,在运动目标检测的算法中,还有着各种各样的不足。
之所以会出现这种情况,主要原因在于图像中存在着各种干扰因素,这些因素在运动目标检测中本被视为干扰项,它们的出现给运动目标检测造成了一定的困难。
这些因素包括:
1)光线亮度的变化
由于现场光线亮度的变化会引起相应的检测的环境的变化,从而导致背景图像也随之发生变化,这些将会使我们很难将这些变化与图像中由于前景运动目标导致的变化加以区分,从而影响运动目标的检测。
2)背景景物的变动
当检测环境的背景中某些景物发生变化时时,或者背景中的景物的相对位置发生移动时,如果这些变化持续一段时间,我们就需要及时更新背景模型,这无疑增加了检测的难度。
3)背景和目标重叠遮盖
物体的前景目标在运动时,其阴影部分有可能会导致背景中的一些画面的亮度发生变化,或者是运动的目标与运动的目标之间,以及运动的目标和背景部分的重叠遮盖,都会有可能会改变检测出来的运动目标的特征。
4)前景与背景物体相近
当运动的前景目标的物体与背景中的景物在颜色或者形状等外观特征相似时,将会增大从背景中分辨出运动目标的难度。
5)非完全表态背景
如果背景并不是完全表态的,就像风中的树叶或者映射在墙上的背影等,就很有可能被当成前景目标进行处理,这样无疑增加运动目标跟检测的难度。
6)运动目标运动路径的变化
前景目标的运动轨迹调整可能会导致许多不同的目标图像频繁的出入背景中,这样将会使我们难以分辨哪些是真的背景,哪些是前景目标,从而给运动目标跟踪增加难度。
7)难以选取所检测的运动目标特征
运动图像是由一定序列的视频组成的,而是视频中包含了许多信息,在这些信息中提取图像的某个特征,有时会很困难。
因为有些信息我们是很难发现的。
就像运动目标的图像中梯度信息、深度信息等,再如彩色图像中的彩色的纹理特征、颜色信息,直方图信息等,以及运动图像中的边缘信息,中间信息等等,以上所述的信息都可以作为图像特征用来检测,如果以这些特征来对运动目标进行检测,将会带来很多问题,并切导致检测结果不准确[17]。
因此选取何种特征作为目标检测的依据,这不仅仅和采用的方法本身有关,同时还涉及到运动图像自身的特点,因此,从运动目标热证来考虑的话,人们将很难判断出哪个特征具有明显优势,适合对运动目标检测。
8)运动目标检测的实时性要求以及准确性难以掌握
视频序列数据和字符数值类数据是不同的特殊数据,因为它有巨大的数据量。
一般来说,视频数据的数据量比结构记录数据大多个数据级。
若一幅中等分辨率的图像(640*480),彩色为24bit/象素,那么数字视频图像的数据量大约为1MB,如果播放速度为每秒30帧,那么一秒钟的数据量就大约为30MB,一个600MB的硬盘则最多只可以存放20秒钟的动态图像[12]。
由于运动目标检测研究及应用处理的对象是这样庞大的大数据量的视频图像,所以其运动量是相当大的,即使在现在,CPU处理速度不断升级,但如果没有合适的算法,那也很难达到检测的实时处理的要求,另外,运动目标检测的另外一个很重要的性能指标就是准确性,而准确性的保证往往是在进行大量复。
再这样庞大的数据下进行重复,那无疑是一项浩大的工程[18]。
在运动目标检测方面存在的困难还有另一个重要原因,那就是在程序上由于实际环境中目标运动的复杂性以及视频数据所具有的特殊性、复杂性,以及目标所占整幅图像的大小、运动速度、运动轨迹,还有系统对不同环境的适应性,都给运动目标检测带来很大的挑战。
由于这些问题的存在,在对视频图像进行检测时,将会出现不同的各种各样的问题,而对运动目标检测研究,就是在最大程度上解决这些出现的问题。
上述这些问题还有待我们进一步研究。
1.3运动目标检测常用方法
运动目标检测方法发展到今天,已经有非常多的方法,然而许多方法都是在以下的三种常用的方法中改进而来。
下面是运动目标检测技术常用的三种方法:
1)光流法[18]:
光流是一种简单实用的图像运动的表达方式,光流是一个图像序列中的图像的亮度模式的表观运动,光流不但包括被观察物体的运动信息,而且还包括相关的结构信息。
由于光流场具有不连续性,因此可以用来将要研究的图像分割成对应不同的运动物体的区域。
基于光流方法的运动目标检测具有运动目标随时间变化的光流特性,由上可知,光流中同时包含着被观察物体的运动信息和结构信息,然而在实际中由于遮挡,噪声,透明等原因,使得光流场的基本方程的假设的灰度守恒条件不能满足,从而不能得到正解,此外,大多数光流方法的计算复杂,只能得到稀疏的光流场,不适于实时处理。
因此,对于实时性和精确性有要求的系统一般不会采用该方法。
2)背景差分法:
背景差分法在运动目标检测技术中是一种非常常用的方法,该方法是利用当前图像与背景图像进行差分,来检测出运动区域的。
这种方法一般都能够提供较完整的特征数据。
由于该方法不受运动目标速度的限制,因此能够较完整地提取出来运动目标,但是其检测性能与背景图像提取的好坏有很大的关联,并且对光照条件和外部条件造成的场景变化过于敏感,如果在非受控环境下,该算法还需要加入对背景图像的更新机制,并且该方法不适用于背景灰度有很大变化的情况。
3)帧间差分法:
帧间差分法是一种通过对视频图像序列中相邻两帧作差分运算来获得运动目标轮廓的方法。
该方法可适用于存在多个运动目标和摄像机移动的情况。
当所监控的场景中有异常的物体运动时,帧与帧之间就会出现较为明显的差别。
通过两帧相减,得到两帧图像亮度差的绝对值,判断它是否大于阈值,根据这个判断条件,我们可以得出图像的二值化图像,并以此来分析视频或图像序列的运动特性,确定图像序列中是否有物体运动[14]。
图像序列逐帧的差分,就相当于对图像序列进行了时域下的高通滤波。
虽然帧间差分算法对环境有很好的适应性,并且差分图像受光线变化影响小,检测的结果有效而稳定,但是它只能检测相对运动的目标,检测出的目标位置不一定精确,并且不能提取出较完整的运动目标。
该方法在较大程度上依赖差分帧的选择时机和目标的运动速度,因此也有一定的局限性。
1.4课题主要研究内容
本文主要通过实现一种三帧差分算法,来对运动目标进行检测和研究。
在本文所研究的范围内,首先根据差分算法的原理,对运动目标作二帧差分运算,并且记录实验结果,和三帧差分算法形成对比,以体现后者的优越性,然后通过实现三帧差分算法来来实现对提取的运动目标的检测和研究,其中用到通过数学形态学进行去噪处理处理,以及把彩色图像转化为灰度图像来简化运算过程,并且,用差分算法来研究运动目标在不同环境下的检测效果并根据实验结果得出结论,以此来判断帧间差分算法在运动目标检测中的效果。
我们知道,运动目标在不同的检测环境中,会受到不同的外在因素的影响,而这些不同因素将会在不同的程度上影响运动目标检测的准确性和稳定性。
因而这些因素会对本系统带来巨大的挑战。
本文根据以上所述的因素中的几种因素,运用所实现的三帧差分算法,对在这些因素影响下所提取的运动目标进行检测,并且得出检测结果,进行分析。
所选择的因素包括以下几个方面:
(1)背景和目标间的重叠遮盖。
由于运动的前景目标的阴影部分会造成背景中局部画面亮度变化,并且运动的目标之间,以及运动的目标与背景之间的重叠遮盖,都有可能改变检测出来的运动目标的形状以及其他特征。
(2)非静态背景。
当背景是非静态环境时,例如天空中移动的云块,公路边的建筑、树等,这些运动的背景很有可能被当成前景目标进行处理,这样将会增加运动目标的检测难度,从而影响检测结果。
(3)运动目标的高速运动。
前景目标在高速运动的情况下,可能会导致许多不同的目标在背景中频繁出入,从而难以分辨哪些是真正的背景,哪些是前景目标,因此也会给运动目标检测增加难度,在一定程度上影响最终检测结果。
1.5本文结构安排
本论文的各章节安排如下:
第1章主要介绍课题的研究目的和意义、课题目前国内外的发展状况以及应用前景,最后介绍了本课题的主要研究内容和文章的结构安排。
第2章主要介绍了和运动目标检测有关的理论基础。
首先介绍了运动目标检测的相关理论,然后阐述了数学形态学方法的内容,以及数学形态学方法在运动目标检测中的应用。
再接着叙述了数学形态学的运算。
最后介绍了关于图像二值化的相关理论基础。
第3章主要实现了传统的帧间差分算法,本章主要阐述了帧间差分算法的设计思想,算法实现过程,以及算法在运动目标检测中的具体应用,最后是实验结果的展现和说明。
第4章主要实现了三帧差分算法,本章是文章的主要内容。
本章首先介绍了三帧差分算法的原理和算法流程,然后实现算法,并得出部分实验结果进行分析,根据分析结果,说明本算法的优缺点。
第5章是总结与展望是对本文所做的研究成果的总结,以及对本课题的发展前景的展望,探讨了下一步的研究方向。
本文最后是作者对导师和亲朋好友的致谢词。
还有作者撰写本文时所参考的文献。
作者在文中所引用的其他文献中的理论和方法,在本文中都有标注出处。
第2章运动目标检测理论基础
2.1关于运动目标检测
运动目标检测算法的任务是从场景序列图像中剔除静止的背景区域,找出运动的前景区域,并尽可能地抑制背景噪声和前景噪声,以准确得到感兴趣的运动物体[16]。
运动目标一般涉及一下对象:
1)运动目标:
需要研究的运动物体;
2)背景噪声:
没有被检测出来的运动目标区域。
3)前景噪声:
前景噪声是指被认定已发生了图像变化,然而并不包含任何运动目标的区域。
4)反射:
在物体的边缘,或反射能力强的物体(如地板,钢管等)表面,由于光线极其不稳定而被当成变化物体检测出来。
5)阴影:
运动目标在地面等物体上产生阴影,也被当成运动目标检测出来。
6)鬼影:
过去某时刻的运动目标进入背景模型,在当前时刻被当成运动目标检测出来。
7)干扰:
对检测结果可能产生影响的因素,如摄像机自身抖动、以及背景中出现的运动的物体,如晃动的树木,闪烁的显示屏,喷泉等。
它们之间的关系如图2.1所示:
图2.1运动目标检测对象关系图
由关系图我们可以看出,对运动目标进行检测时,将会有许多干扰的因素,这些因素将会对运动目标的检测结果产生影响,基于此原因,目前国内外关于运动目标检测的研究提出了一定的解决办法。
包括图像预处理和去噪处理。
其中,预处理是在采集到视频图像信息后,对所采集到的图像进行处理,预处理的方法有很多,例如,把彩色图像转换为灰度图像,这样,在用运动目标检测方法时,直接在灰度图像的基础上进行操作。
这样不仅节省存储空间,还简化了计算。
去噪处理的方法也有很多,目前最常用的方法就是数学形态学处理,数学形态学包括膨胀,腐蚀,开启,闭合四种基本运算,这些运算在图像的去噪处理上有很广泛的用途。
2.2灰度图像
灰度图像是一种具有从黑到白256灰度级的单色图像。
像素值点介于黑白间256种灰度中的一种,即总共有256个级别,0时全黑最暗,255时全白最亮。
我们知道,一般情况下,摄像头采集到的视频图像格式都是彩色的RGB格式,RGB即是代表红、绿、蓝三种颜色,将图像上的像素点描述为RGB颜色空间上的一个三维矢量,每个分量分别代表红、绿、蓝三种颜色的亮度。
此时,我们每存储一个像素点就要存储它的三个颜色分量,这样无疑大大消耗了存储空间,而且在进行计算时,还大大增加了计算量,因为我们每次处理一个像素点,还要处理这三个颜色分量。
而在研究运动目标检测效果时,图像的颜色特征并不会影响检测结果,因此,我们在进行运动目标检测研究之前,为了统一进行处理以及节省存储空间和处理图像的时间,我们通常对采集到的RGB图像进行灰度化处理。
这样可以把采集到的视频图像序列转化为灰度图像,灰度图像中的每个像素用8位数据表示,图像数据中的一个字节代表一个像素,每个字节所标示的内容就是每个像素的亮度值,即相当于使图像中的三个分量的值相等。
彩色图像转化为灰度图像有几种不同的方法,我们可以通过以下几种方法将其转换为灰度图像:
1)浮点算法:
(2.1)
2)整数算法:
(2.2)
3)移位方法:
(2.3)
4)平均值法:
(2.4)
5)仅取绿色:
(2.5)
我们可以通过上述中任何一种方法得到灰度值
,将原来的RGB(R,G,B)中的像素值,统一用灰度值
代替,这样就形成了一个新的颜色RGB(
,
,
),这样,我们就得到了灰度图像了。
2.3数学形态学
2.3.1数学形态学简介
数学形态学理论是由法国巴黎的地质学家G.Matheron和J.Serra创立的,这是一门新兴的分析图像的科学。
数学形态学一门严格建立在数学理论基础上的学科,它以集合论为其数学基础[15]。
其基本思想方法就是用具有一定形态的结构元素去度量和图像中对应的形状,以达到对图像分析和识别的目的。
这门学科起初是针对二值图像而进行运算的,但由于它不仅能够简化图像数据,保持图像基本的形状特性,还能够除去图像中不相干的结构的特点,所以它目前被广泛的应用于图像处理领域。
形态学运算可以把图像中形状和尺寸与结构元素相似的几何特征保留下来,并且把其余的不需要的特征滤除。
这种结构表示可以是分析对象的宏观性质,比如在分析一个工具的形状时,研究的就是其宏观的结构;同时也可以是微观性质,比如,在分析颗粒的分布或由小的基元产生的纹理时,研究的便是其微观结构。
2.2.2数学形态学应用
数学形态学是一门建立在严格数学理论基础上的学科,其基本思想和方法对图像处理的理论和技术产生了重大影响。
事实上,数学形态学已经构成一种新的图像处理方法和理论,成为计算机数字图像处理及分形理论的一个重要研究领域,并且已经应用在多门学科的数字图像分析和处理的过程中。
这门学科在计算机文字识别,计算机显微图像分析(如颗粒分析),医学图像处理(例如细胞检测、心脏的运动过程研究、脊椎骨癌图像自动数量描述),图像编码压缩,工业检测(如食品检验和印刷电路自动检测),材料科学,机器人视觉,汽车运动情况监测等方面都取得了非常成功的应用[15]。
另外,数学形态学在指纹检测、经济地理、合成音乐和断层X光照像等领域也有良好的应用前景。
形态学方法已成为图像应用领域工程技术人员的必备工具。
目前,有关数学形态学的技术和应用正在不断地研究和发展。
另外,形态学在边缘提取、图像分割、噪声滤除等方面应用也非常的广泛。
2.2.3形态学运算
数学形态学有四个基本运算:
膨胀和腐
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 帧间差分 算法 运动 目标 检测 研究 毕业设计 论文