基于混合高斯建模方法的运动目标检测方法研究与实现毕业论文.docx
- 文档编号:26087431
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:55
- 大小:1.08MB
基于混合高斯建模方法的运动目标检测方法研究与实现毕业论文.docx
《基于混合高斯建模方法的运动目标检测方法研究与实现毕业论文.docx》由会员分享,可在线阅读,更多相关《基于混合高斯建模方法的运动目标检测方法研究与实现毕业论文.docx(55页珍藏版)》请在冰豆网上搜索。
基于混合高斯建模方法的运动目标检测方法研究与实现毕业论文
摘要
运动目标检测是计算机视觉研究领域的基础,它是从图像序列中去除静止的背景区域,将运动区域的前景检测并提取出来,如何有效地把感兴趣的目标如人、物等前景目标从复杂场景中分割出来,并对目标行为做出相应的检测,是计算机视觉研究的热点和难点。
本文对视频图像读取、图像灰度化等处理过程做了简单的阐述,并分别对均值滤波、中值滤波和高斯滤波这三种不同的滤波方法进行比较,分析各种方法的优缺点,同时提出使用高斯滤波方法。
最后利用搭建在VisualC++6.0上的OpenCV软件进行设计,使用混合高斯背景的建模方法实现对运动目标的检测。
在背景的各种建模方法中,混合高斯背景模型以其简便、灵活、高效的特点成为该领域的经典方法,能够很好消除背景的微小扰动对运动目标检测所产生的影响,比较准确地检测出复杂环境下的运动目标,具有较好的鲁棒性和实时性。
关键词:
运动目标检测;OpenCV;混合高斯背景模型
ABSTRACT
Movingtargetdetectionisthefoundationofcomputervisionresearchfield,whichisstilltoremovethebackgroundfromanimagesequenceregion,theprospectofamotionareadetectedandextracted,howeffectivelythetargetofinterest,suchashuman,materialandotherforegroundobjectsfromacomplexscenecarvedout,andmaketheappropriatetesttargetbehavior,ishotanddifficultcomputervisionresearch.
Inthispaper,thevideoimagereading,imageprocessingsuchasGraydidabriefexplanation,andrespectively,meanfilter,medianfilterandGaussianfilterthreedifferentmethodstocomparetheadvantagesanddisadvantagesofeachmethod,AtthesametimeproposedtouseaGaussianfilter.Finally,buildinVisualC++6.OpenCVsoftware0ofdesign,usingamixedGaussianbackgroundmodelingmethodstoachievethedetectionofmovingtargets.
Inthebackgroundofthevariousmodelingmethods,Gaussianmixturebackgroundmodelwithitssimple,flexibleandefficientcharacteristicsofaclassicalmethodinthefield,canbeagoodinfluencetoeliminatebackgroundsmallperturbationsgeneratedbythemovingtargetdetection,moreaccuratemovingobjectsdetectedincomplexenvironments,robustandreal-time.
KeyWords:
MovingObjectDetection;OpenCV;Thebackgroundmodel
毕业设计(论文)原创性声明和使用授权说明
原创性声明
本人郑重承诺:
所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:
日 期:
指导教师签名:
日 期:
使用授权说明
本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:
按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:
日 期:
学位论文原创性声明
本人郑重声明:
所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。
除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律后果由本人承担。
作者签名:
日期:
年月日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名:
日期:
年月日
导师签名:
日期:
年月日
注意事项
1.设计(论文)的内容包括:
1)封面(按教务处制定的标准封面格式制作)
2)原创性声明
3)中文摘要(300字左右)、关键词
4)外文摘要、关键词
5)目次页(附件不统一编入)
6)论文主体部分:
引言(或绪论)、正文、结论
7)参考文献
8)致谢
9)附录(对论文支持必要时)
2.论文字数要求:
理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
3.附件包括:
任务书、开题报告、外文译文、译文原文(复印件)。
4.文字、图表要求:
1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写
2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。
图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画
3)毕业论文须用A4单面打印,论文50页以上的双面打印
4)图表应绘制于无格子的页面上
5)软件工程类课题应有程序清单,并提供电子文档
5.装订顺序
1)设计(论文)
2)附件:
按照任务书、开题报告、外文译文、译文原文(复印件)次序装订
目录
1绪论1
1.1研究背景和意义1
1.2国内外研究现状与发展趋势1
1.2.1国内外研究现状1
1.2.2研究的热点3
1.3研究内容4
1.4本章小结4
2视频图像检测预处理5
2.1视频读取5
2.2图像灰度化6
2.4图像去噪7
2.4.1中值去噪8
2.4.2均值去噪9
2.4.3高斯去噪10
2.5本章小结11
3运动目标检测算法研究12
3.1几种常见的运动目标检测方法的介绍12
3.1.1光流法12
3.1.2背景减除法13
3.1.3帧间差分法13
3.2基于自适应高斯背景模型的目标检测14
3.2.1单高斯背景模型15
3.2.2混合高斯背景模型15
3.3本章小结15
4基于混合高斯背景建模方法的运动目标检测17
4.1OpenCV介绍17
4.2图像二值化18
4.3形态学运算18
4.3.1图像腐蚀19
4.3.2图像膨胀19
4.3.3开运算和闭运算19
4.3.4形态学运算的部分代码20
4.3.5形态学处理的效果图20
4.4混合高斯背景建模的流程图...............................21
4.5利用混合高斯模型进行背景建模22
4.5.1混合高斯背景模型的建立及初始化22
4.5.2背景模型的更新24
4.6运行结果效果图...............................26
4.7本章小结27
5总结与展望29
5.1总结29
5.2展望29
致谢31
参考文献32
1绪论
1.1研究背景和意义
计算机视觉的研究是从二十世纪五十年代开始,起初的主要研究目的是通过检测图像中的物体并获取这些物体间的关系来进行对图像的理解。
然而从二十世纪七十年代起,目标分割、边缘检测等问题的研究启发了学者们对解决视觉问题的有效方法的探索,后来随着人类知识的不断积累,以及计算机视觉理论和算法研究的日益发展,加上现阶段计算机软硬件的日趋成熟和普及,人们利用计算机技术来帮助人类感知和认识世界的需求也在与日俱增。
这使得人类获取外界的各种信息很大一部分是通过视觉信息途径得到的。
视觉信息包括静态图像信息和图像序列信息(视频信息),静态图像信息由于它在时间上是静止的,使得所能包含的信息量仅限在一帧图片以内,从而无法表现出信息在时间上的相关性,与此相反,视频信息具有在空间和时间上的联系和相关性,能够将很多人类感兴趣的信息包含在里面,尤其是视频信号中的运动部分,更是将视频信号中的主要信息包含在里面,从而视频信息成为了视频信号处理的关键对象。
随着研究的不断深入和拓展,视频图像信号在信息处理和计算机视觉中扮演着越来越重要的角色。
随着运动目标检测研究的不断深入,以及计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对目标进行实时跟踪研究越来越热门,对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值。
混合高斯背景模型以其简便、灵活、高效的特点成为该领域的经典方法,能够很好消除背景的微小扰动对运动目标检测所产生的影响,通过使用混合高斯背景的建模方法能够比较准确地检测出复杂环境下的运动目标,具有较好的鲁棒性和实时性,对未来计算机视觉技术的发展具有重要的意义。
1.2国内外研究现状与发展趋势
1.2.1国内外研究现状
视频检测技术在目前世界上的应用非常广泛,其中应用最为广泛的地区是日本,如日本的VICS系统相当完毕和成熟,其次美国、欧洲等地区也普遍应用。
在中国,北京、上海、广东等地也已广泛使用。
经过几十年的发展历程,国外的视频检测技术研究己经趋于成熟,主要集中于一些较发达的国家。
运动目标检测技术是智能视频监控系统中最为关键的步骤,它是将运动区域的前景从复杂场景中分割出来,并对目标行为做出相应的检测,运动区域的正确分割,对以后的运动目标的跟踪和行为理解等后期处理起到了至关重要的作用。
通常,根据目标与摄像机的相对关系可分为两种情况:
静态背景下的运动目标检测和动态背景下的运动目标检测。
静态背景下的运动目标检测是指摄像机在整个监控的过程中处于静止状态,只存在着被监控物体在视场内的运动;而动态背景下运动目标的检测是指摄像机在整个监控过程中发生了移动(如平动、旋转或多自由度运动),同时被监控的物体在整个视场内也存在着运动的情况。
目前,传统的静态背景下运动目标检测算法可分为以下几类。
(1)背景减除法
背景减除法[1]是目前运动目标检测中最为常用的方法,它是利用当前图像与背景图像进行差分来检测运动目标。
这种方法的优点是能够将运动区域描述的完整并且精确,但是它的不足之处在于对光照和场景中的扰动会比较敏感。
背景减除法的难点在于如何寻找其理想的背景模型,以及如何进行对背景模型的更新。
其中最为简单的背景模型是时间平均图像。
为了抑制动态场景的变化对运动目标检测所产生的影响,许多研究人员都致力于研究更好的背景模型,已达到更好的显示效果。
Haritaoglu等[2]它是利用最小、最大的强度值和最大时间差分值来为场景中的每个像素进行统计建模,并且对背景模型进行周期性地更新。
此外,特征背景法也是较为常见的背景建模方法,还有图像变换同现法等。
像素级的混合高斯模型能随动态场景的变化而自适应地变化,可以用来描述多峰的背景,同时也广泛应用于运动目标领域的检测。
Stauffer和Grimson[3]提出了自适应的混合高斯模型,通过对视频图像中每一帧的每个像素进行高斯建模,在利用在线估计进行模型参数更新的方法,从而有效地克服了背景的扰动,光照变化等对前景目标检测所带来的影响。
除此之外,研究人员对混合高斯模型进行不断深入的学习,他们不断地改进混合高斯模型的算法,将其应用在智能视频监控各个方面,希望系统能够有较高的实时性,然而在对其处理图像序列时,无论是运动目标的检测和跟踪,还是分类都是逐帧对图像序列进行处理的,计算量非常庞大,并且不能满足系统的实时性要求,因此要提高系统的实时性,就需要研究如何减少背景建模算法的计算量。
(2)帧间差分法
帧间差分法是目前最简单的运动目标检测方法,它主要是利用了连续图像序列中相邻的两帧或三帧图像之间的相关性,然后对连续图像序列中相邻的帧进行相减来进行目标检测的方法,通过较小时间间隔来检测的图像变化部分,最后对图像进行阈值化处理来找出运动区域。
帧间差分法具有算法简单,运算量小等优点,但是根据目标的运算速度,选择合适的差分时间间隔是检测图像序列的关键,如果选择得差分时间间隔不合适,会造成较大误差。
Lipton等[4]通过利用两帧差分的方法从实际的视频图像中检测出运动目标,进而对目标进行分类与跟踪。
Collins等[5]开发的是一种将三帧差分与自适应背景减除相结合的混合算法,它能够快速地从整幅图像中分割出前景图像。
帧间差分法对动态环境有着较强的适应性,它的缺点是不能从中提取所有相关的特征像素点,在运动目标内部易产生空洞,从而得出不完整的目标信息。
(3)光流法
光流是空间运动物体在观测成像面上的像素运动的瞬时速度[6]。
光流法的研究是根据图像序列中的像素强度数据的时域变化和相关性,从而确定各自像素位置的“运动”情况,它主要研究内容的的是,图像序列的灰度在时间上的变化与景象中物体结构及其运动之间的关系。
一般情况下,光流的产生是由相机运动、场景中目标运动或两者的共同运动导致的。
光流法检测运动目标的基本原理是:
给图像序列中的每一个像素点赋予一个速度矢量,使其形成了一个图像的运动场,在运动的一个特定时刻,通过投影关系得到图像上的点与三维物体上的点的一一对应,在根据各个像素点的速度矢量特征对图像序列进行动态分析。
如果图像中没有运动物体,则光流矢量在整个图像区域是连续变化的。
当图像中有运动物体时,目标和图像背景就会存在相对的运动,这时运动物体所形成的速度矢量和邻域背景速度矢量会产生不同,从而能够检测出运动目标及其所在的位置。
利用光流法进行运动物体检测的缺点在于大多数光流法计算耗时,实时性和实用性都较差。
但是光流法能够携带运动物体的运动信息和有关景物三维结构的优点,它能够在不知道任何场景信息的情况下,检测出运动对象。
但是由于被检测物体与摄像机之间存在着复杂的相对运动,而动态的运动目标的检测算法比静态的运动目标的检测算法情况要复杂很多,目前动态背景的运动目标检测算法中,常用的算法有匹配块法、光流估计法、图像匹配法以及全局运动估计法等。
但这些方法存在一个共性的问题就是计算量非常大,而且运动目标容易受到噪声和局部光照条件的影响,而如何利用视频监控场景中的图像序列自身的特点对我们算法的研究起着至关重要的作用。
(4)块匹配法
块匹配算法是将图像序列中的相邻两帧图像分割为子块,在通过对子块的匹配来进行运动估值[7]。
在块匹配的算法中,图像序列被分割为若干个子块,并将子块中的所有像素的运动矢量被认为是相同的,假设图像场景中没有大的遮挡物,而且复杂的运动可以被近似地分解为一组平移运动之和,所以块匹配算法可以假定为图像中的运动物体是由做平移运动的刚体组成而得到的。
这样就会使块匹配算法变得简单快速,同时也保证了较高的精度。
1.2.2研究的热点
1.环境的微小扰动和光照变化对运动目标带来形状变化,使得实时识别和检测非常困难,如何选择和提取具有不变性的特征有提高待。
2.如何选取合适的高斯背景模型与之像素点进行匹配,以及阴影图像对运动目标检测所带来的干扰需进一步提高。
3.系统算法在进行运动目标检测时,使用的是混合高斯建模方法,其运算量比较大,如果对于大量的数据进行计算时,由于计算的过程比较耗时从而会影响效果的实时性;
1.3研究内容
第1章简要介绍了计算机视觉,了解运动目标检测的国内外发展现状,并对目前运动目标检测的常用方法的简单介绍,最后分析现阶段对运动目标检测研究的热点问题。
第二章是对视频图像进行预处理。
其中包括读取视频,图像去噪,图像灰度化等,对比不同处理方法的优缺点,最后选定运用高斯去噪的方法处理图像。
第三章对运动目标检测做出简单阐述,并分析当前常用的几种运动目标检测的方法,其中包括背景减除法、光流法、帧间差分法以及块匹配法,并结合各种方法的优缺点及研究目的,最后选择利用混合高斯分布背景建模进行前景检测。
第四章首先介绍了OpenCV在VisualC++6.0下的环境搭建,然后介绍对视频图像中帧图像的处理,接着阐述了混合高斯背景建模方法的运动目标检测的流程图,接下来详细介绍混合高斯建模的初始化和背景模型的更新,以及实现建模方法的部分代码,最后通过程序的运行,对运动目标检测的显示进行分析。
第五章总结与展望。
本文所做的工作做出总结,并对该领域的未来作出了展望。
1.4本章小结
本章主要介绍了计算机视觉研究的背景,以及研究计算机视觉对运动目标检测过程的意义,接着阐述了目前国内外研究的现状与发展趋势,并简单的介绍了目前运动目标检测的常用方法,如背景减除法、帧间差分法、光流法和块匹配法,然后对目前运动目标检测所出现的一些热点问题做了简单叙述,最后对本论文各章节需要研究的内容进行简要的概述。
2视频图像检测预处理
视频是指随着时间发生变化的一组数字图像序列,有时还包含有相应的音频信息。
数字视频是先用摄像机之类的视频捕捉设备,将外界影像的颜色和亮度信息转变为电信号,再记录到储存介质当中,它也是数字图像在时域上的序列,视频序列中的每个图像称为帧。
而现在的视频文件较多是通过彩色摄像机进行采集的,而在视频文件的采集、传输和记录的过程中,经常会受到各种噪声的干扰,其中包括外界光照、阴影的影响,也包括摄像头成像误差、系统电路失真等引起的噪声。
而在现实中的图像序列一般都是噪声图像,因此在对图像进行处理的过程中,在对图像的边缘检测、图像分割、特征提取、模式识别等处理之前,应该选用适当的算法去除图像中的噪声干扰,这对图像序列的检测至关重要,因此视频图像的去噪是一个非常重要的预处理步骤。
对于一个良好的图像处理系统,不论是计算机进行的数字处理还是用模拟处理,都是把减少最前一级的去除噪声作为主攻目标。
在我们对视频图像的检测之前,为了能更好达到预期的结果,避免噪声等因素对视频图像检测效果的影响,首先应该对视频图像的进行预处理,本章主要介绍了对视频的读取,图像灰度化,以及几种常用的去噪方法,并综合分析每种方法的优缺点,最后确定使用高斯滤波进行图像去噪。
2.1视频读取
本课题是基于OpenCV的运动视频检测,使用的是OpenCV函数库,搭建在VisualC++6.0环境下进行编译,其识别的视频格式为avi。
OpenCV从外部捕获图像有两种方式,一种是从摄像头中获取,另一种是通过对视频的解码得到图像。
这两种获取图像的方式都必须从第一帧开始一帧一帧的按顺序获取,因此每获取一帧图像后都要保存其相应的状态和参数[8]。
如果从视频文件中获取,需要保存视频文件的文件名和相应的文件名类型,以及下一次获取所需要解码哪一帧等。
这些信息都保存在CvCapture中,而每获取一帧后,这些信息都将被更新,获取下一帧需要将新的信息传给获取信息所传递的接口。
CvCapture是一个结构体,它是用来保存图像捕获所需要的信息。
通过设置视频文件的路径,然后在设置窗口大小,并且可以控制窗口的位置和大小。
cvQueryFrame从摄像头或者文件中抓取并返回这一帧。
返回的图像不可以被用户释放或者修改。
cvQueryFrame的参数为CvCapture结构体的指针。
它的作用是用来将下一帧视频文件载入内存,返回一个对应当前帧的指针。
与cvNamedWindow不同是,cvQueryFrame使用已经在cvCapture结构中分配好的内存,而cvNamedWindow为图像分配内存空间。
而在释放内存的时候,就没有必要通过cvReleaseImage对这个返回的图像指针进行释放,当CvCapture结构被释放后,每一帧图像所对应的内存空间即会被释放。
部分代码如下
//打开视频文件
//if(argc==2)
if(!
(pCapture=cvCaptureFromFile("SampleVideo.avi")))
{
fprintf(stderr,"Cannotopenvideofile%s/n",argv[1]);
return-2;
}
IplImage*pFrame=NULL;
IplImage*pFrImg=NULL;
IplImage*pBkImg=NULL;
CvCapture*pCapture=NULL;//声明视频捕捉器,用于捕获视频
intnFrmNum=0;
cvNamedWindow("video",1);//窗口设置
cvNamedWindow("background",1);
cvNamedWindow("foreground",1);
……
CvGaussBGModel*bg_model=NULL;
IplImage*img_erode;
IplImage*img_dilate;
while(pFrame=cvQueryFrame(pCapture))//从摄像头或文件中读取并返回一帧
{...}
2.2图像灰度化
图像灰度化就是对彩色图像中的彩色信息进行处理,将其变为灰度图像,只包含亮度信息。
在计算机中对图像灰度图表示是对其图像的亮度值进行量化,将其等分成0-255共256个级别,0最暗(全黑),255最亮(全白),而在RGB模型中,如果R=G=B,则颜色(R,G,B)就表示灰度色。
要对图像进行灰度化,就需要使图像的RGB的三个分量取相等的值,则图像就会由原来的三维特征降到灰度化后的一维特征,在此过程中图像必然会丢失部分的信息。
常见的灰度化处理方法有平均值法、最大值法口、加权平均值法等。
而不论采取哪种灰度化处理方法,都会将其原有的颜色特征改变或丢失,这样就使得同一种二值化方法因为不同的灰度化处理过程得到不同的结果,其中R表示该像素的红色分量,G表示绿色分量,B表示蓝色分量。
在OpenCV函数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 混合 建模 方法 运动 目标 检测 研究 实现 毕业论文