完整word版matlab代做基于MATLAB的GMM和KDE核估计得目标跟踪仿真doc.docx
- 文档编号:23530637
- 上传时间:2023-05-18
- 格式:DOCX
- 页数:44
- 大小:409.98KB
完整word版matlab代做基于MATLAB的GMM和KDE核估计得目标跟踪仿真doc.docx
《完整word版matlab代做基于MATLAB的GMM和KDE核估计得目标跟踪仿真doc.docx》由会员分享,可在线阅读,更多相关《完整word版matlab代做基于MATLAB的GMM和KDE核估计得目标跟踪仿真doc.docx(44页珍藏版)》请在冰豆网上搜索。
完整word版matlab代做基于MATLAB的GMM和KDE核估计得目标跟踪仿真doc
第一章课题背景和研究意义
近年来,视频监控系统在各行业得到了广泛应用,生活中有小区、超市等的安全监控,银行系统有柜台监控,交通方面有违章监控等。
这些监控系统是由一个或多个摄像机以及与
之相连的一套电视监视器组成的,它们的用途主要是对场景的记录和保存,当异常情况,比
如盗窃行为发生后,保安人员才通过记录的结果察看发生的事情,但往往为时已晚。
视觉监视是指在一个繁忙环境中对人和车辆等进行实时的观察,并给出对它们行为和动作的描述。
这一技术包括了运动目标的检测、跟踪、目标分类和行为理解等方面,涉及到计算机视觉、模式识别和人工智能领域的许多核心课题,是一个具有挑战性的困难问题。
近年来随着集成电路和计算机技术的迅猛发展,视觉监视系统所要求的硬件设备成本大大降低,因此它获得了日益广泛的研究与应用。
许多关于视觉监视的大规模研究项目已经在美国、欧洲和日本展开,同时它也成为许多国际学术会议关注的重要主题。
运动目标检测与
跟踪处于整个视觉监视系统的最底层,是各种后续高级处理如目标分类、行为理解等的基础。
运动目标检测系指从视频流中实时提取目标,一般是确定目标所在区域和颜色特征等。
目标
检测的结果是一种“静态”目标——前景目标,由一些静态特征所描述。
运动目标跟踪则指对目标进行连续的跟踪以确定其运动轨迹。
我们通过为静止背景建模来检测前景点。
具体的背景模型以Stauffer等提出的自适应混合高斯模型为蓝本,并对其作了部分改进以更好地处理实际背景发生变化的情形。
算法中采用一种可靠的连通区域检测算法完成前景目标的分割。
目标跟踪时则通过匹配目标的位置、大小、形状和颜色等特征,建立运动目标与前景目标间的对应关系。
算法中考虑了跟踪中多个目标相互遮挡的问题,分析了几种可能结果并分别加以处理。
我们还为运动目标引入了可靠性度量以使目标跟踪过程更加稳定和可靠。
在实际应用中,不包括运动物体的纯背景图像通常无法得到。
而且,由于场景光照变化、摄像机抖动等因素,背景不可能完全静止。
因此,背景减法的难点主要不在于减运算,而在
于背景动态模型的维护与更新,即如何从获得的包含运动物体的视频序列中提取出背景。
现有的以高斯分布为代表的单模态背景模型通常不能很好地描述室外场景,而混合高斯分布的多模态参数模型由于需要事先假定背景分布模型及需要进行模型参数估计和优化,也不适用
于密度分布未知的计算机视觉等应用系统。
本文根据核密度估计理论,提出了—种基于多样性采样原理的背景核密度估计模型。
通过多样性原理提取的样本保留了训练图像序列中的重
要信息,在背景的动态维护中不再需要保存和使用训练序列的全部数据。
另外,由于非参数模型不需要假设背景的分布形式,可应用于更普遍的情形。
第1页共17页
第二章GMM和KDE介绍
2.1GMM简介
GMM是一种利用一定数量的小高斯函数混合逼近某变量的概率密度函数的方法,是在概
率估计中常用的参数化模型,今年被广泛应用于模式识别领域。
一有限的GMM的描述非常简单,即由高新分布函数的任何凸组合形成一混合模型。
对于
n维实空间的随机变量x,利用GMM可以近似的表示其概率密度函数:
k
p(x)hmN(x|um,m)
m1
k
其中,hm
0,且
hm=1;N(x|um,m)是均值为um,协方差维
m;k为高斯混合项个数。
m=1
2.1.1高斯模型原理
高斯分布,也称为正态分布。
是伟大的数学家高斯(Gauss)与1809年在研究误差理论时推导出来的。
对于随机变量x,其概率密度为:
(xu)2
p(x,u,)
1
e
2
2
2
其中μ为高斯分布的期望,σ为高斯分布的方差。
如果一组数据符合高斯分布,那么
这种数据中的大多数会集中在以
μ为中心的-2σ到2σ范围内的这段区间里。
在实际中,尤其是对于室外的场景,由于各种噪声的干扰,其背景变化是比较大的,会
出现树枝摇动,光线变化等不同情况。
因此用一个高斯分布就不能来完全描述实际的背景情况。
这种情况下就需要采用多个高斯模型来描述动态的背景,为不同的状态建立不同的高斯模型。
将k定义为建立的高斯模型的数目,那么当前观测点的像素值的概率密度为:
k
p(xt)
wi,tp(xi,t,ui,t1,k,i,t1,k)
i
1
在采集的视频图像中是包含彩色分量的,使用协方差的方法来进行计算,这种方法计算
量大但效果提升不高,不适合实时性的要求。
因此,本算法中直接简化了这一过程,将彩色
图像转为灰度图的方法来进行高斯混合建模。
根据场景的复杂程度,高斯模型的数量k可以
取值为3~7个,k值越大,其能表征的场景就越复杂,但相应的计算量也增大。
因此本算法
中取k值为3。
采用GMM进行背景建模主要包含3个步骤:
背景训练,模板匹配及背景更新的过程。
首先对一段帧数的视频进行训练,通过训练帧中所得到模型计算出均值,方差和权重等
第2页共17页
各参数来从作为背景模型的参数。
在训练过程中,不必对每个高斯模型都进行确定,如果对
于某一像素点来说,在训练时间内其灰度值变化不大,即其一个到两个高斯模型内就已经能
包含图像中90%以上的像素值,那么可直接将有较大的方差和较小的权值的参数赋予其他模
型。
本算法中将方差设为30,权值设为0.001。
通过对背景的训练,可以消除背景中的扰动
因素,以避免将运动物体视为背景模型,训练帧数越长,所得到的背景模型越精确,但一般
训练时间不超过50帧,否则会影响整个系统的启动时间。
得到了背景模型后,通过模板匹配来进行前景分割。
在进行模板匹配前,首先要对混
合高斯模型中的三个单高斯模型进行排序,判断那个高斯模型最有可能与背景图像进行匹
配。
由于静态区域的点会比动态区域点的方差小,且运动物体出现会导致模型更新后该单
高斯模型的权值降低,因此权值越大,方差越小,匹配度越高。
通过公式e=w/σ对混合模
型中的各单个高斯模型进行优先级高低的排序后在进行匹配。
匹配条件应满足:
|zu|m*
由于场景中环境的不断变化,通过训练建立好的背景模型不可能适应新的背景的需要,
因此,需要对背景进行实时更新,以保证前景提取的正确性。
在背景模型更新过程中,引入
了学习率alpha这一概率。
当学习率取值比较小,其适应环境变化的能力就低,需要给足够
的时间才能更新背景模型。
相反,当alpha取值较大时,其对场景的适应性较强,能很快的
变化背景模型,但是对于一段时间内停留的场景中的目标,却很容易学入背景中去。
针对这
种情况,算法对学习率进行调整,在图像中的不同处设定不同的学习速率,以保证场景变化
的需要。
学习率的变化范围应该在0~1之间。
对k个高斯模型进行更新,也就是对混合高
斯模型中的三个参数,即权值,均值和方差进行调整。
其权值的更新算法如下:
wk,t(1alpha)wk,t1alphaM
M为匹配度,对于匹配的模型取值为1,否则取值为0。
可见当像素点与高斯模型不匹配
时,其权值会降低。
对于匹配上的i个高斯模型,需对均值和方差进行更新。
更新算法如下:
alpha
p
ui,t
(1
)ui,t
1
zt
2
i,t
(1
)
2
(z
u
)2
i,t1
t
i,t
未匹配的模型,其均值和方差都保持不变。
如果对于当前点的像素值,其与所有的高斯
分布模型都不匹配,则新建立一个高斯分布将混合高斯模型中排序最后一个的高斯模型替换
第3页共17页
掉,同样该分布应选取较大的方差和较小的权值,而其均值则设为当前像素点的值。
通过混合高斯建模而分割出的二值图像,往往会包含很多噪声点。
对于这种问题的处
理,大多都是采用膨胀,腐蚀的方法进行消除。
本文中直接采用连通性分析的方法来对小区
域噪声点进行消除,并对运动前景进行提取。
所谓连通性分析,即在高斯模型所得到的二值
图像中找到各个运动前景块,并对各前景块赋予不同的标号,并返回各连通区域的区域信息。
其中每个前景块存在着4连通或者8连通的关系。
对于位于(x,y)坐标的像素点r,4-连通
和8-连通区域。
2.1.2背景建模
视觉监视的第一步工作是将前景目标所在的区域从背景中分割提取出来,即完成前景和背景的分离。
这一工作一般有三种实现方法:
背景消减、帧间运动分析和光流计算。
后两种方法都可以用于运动摄像机的情形,对动态环境的适应能力比较强,但帧间运动分析的结果精度不高,难以获得目标所在区域的精确描述;光流计算的复杂度则非常高,难以符合视觉
监视系统实时处理的要求,背景消减适用于摄像机静止的情形。
它为静止背景建立背景模型,通过将当前图像帧和背景模型进行比较,确定出亮度变化较大的区域,即认为是前景区域。
这种方法的计算速度很快,可以获得关于运动目标区域的完整精确的描述,但对场景中光照
条件、大面积运动和噪声比较敏感,在实际应用中需采用一定的算法进行背景模型的动态更
新,以适应环境的变化。
出于处理速度和算法性能及应用场合的考虑,本文和大部分视觉监
视系统一样,选择了建立背景模型作为检测前景区域的方法。
按照所处理背景的自身特性,
背景模型可分为单模态和多模态两种。
前者在每个背景点上的颜色分布比较集中,可以用单
个概率分布模型来描述(即只有一个模态),后者的分布则比较分散,需要多个分布模型来共同描述(具有多个模态)。
自然界中的许多景物和很多人造物体,如水面的波纹、摇摆的树枝、飘扬的旗帜、监视器荧屏等,都呈现出多模态的特性。
最常用的描述背景点颜色分布的概率分布是高斯分布(正态分布),下面就单模态和多模态两种情形下的背景模型分别加以说明和
讨论。
为叙述方便,我们用),(Σμηx来表示均值为μ、协方差矩阵为Σ的高斯分布的概率密度函数。
由于背景模型中对各个图像点的处理是完全独立的,所以若不作特殊说明,本文所有关于背景模型的描述都系针对同一图像点位置而言。
2.1.2.1单高斯分布背景模型
单高斯分布背景模型适用于单模态背景情形,它为每个图像点的颜色分布建立了用单个
高斯分布表示的模型(x,ut,t),其中下标t表示时间。
设图像点的当前颜色度量为Xt
第4页共17页
(Xt,ut,t)Tp(这里Tp为概率阈值),则该点被判定为前景点,否则为背景点(这时又称
Xt与(x,ut,t)相匹配)。
在实际应用中,可以用等价的阈值替代概率阈值。
如记dtxtut
则可以根据dtTt1dt的值设置相应的前景检测阈值。
2.1.3GMM的参数估计
为每个像素建立混合高斯模型后,当输入但前采样值xt的时候。
我们必须估计M个分布
中哪一个最有可能导致该像素值的产生。
更具贝叶斯理论,后验概率p(k|xt,)代表了该像素
值由状态K产生的可能性。
p(k|xt,)p(k)pk(k|xt,k)
p(xt|)
我们可以得到M个分布中最有可能产生当前采样值的分布K,只要我们知道该分布是代
表前景还是背景物体,就可以划分当前像素是前景还是背景像素。
当前的输入可能不是由M
个表面中的任何一个产生的。
典型的情形是,一个以前为出现过的前景物出现在该像素的位
置。
可以通过在M个高斯分布的基础上再增加一个扁平的第M+1个分布接收一个以前没出现
过的输入值。
赋予该分布一个较小的但非0的先验概率值和一个很大的方差。
在实际应用中,一般选择M等于3。
三个分布中两个用来描述背景表面,一个描述前景
表面。
实际上这是应用GMM模型最小的选择,如果少于两个背景表面的话,就没必要用这个
算法了,用一个平均背景图像做简单的减除会更简单些。
在M=3的情况下,算法只用一个高
斯分布表示前景就可以工作,是应为能够用它来粗略的表示任何前景。
对于M个分布,必须估计出其中哪些代表背景模型。
在实际应用中,处理完当前帧后,模型的参数要进行必要的更新,所以每一帧都要进行背景模型的重新估计。
一般的,我们会对有较多数据支持且方差较小的高斯分布感兴趣,因为它们代表背景模型的可能性较大。
考虑两种情况,一是当背景物体是持久静止的时候,这时该物体表面产生的高斯分布代表着背景分布,那么支持这个分布的数据会持续积累,而且它的方差也会越来越小。
第二种情况,当一个新的物体遮挡了原来的背景物体时,一般会导致两种结果:
要么产生一个新的分布,要么把一个已存在的分布的方差增大。
另外,当新的物体是一个运动物体的时候,它一般也会比背景像素保持更大的变化直到它停下来。
从以上两种情况可以看出,影响一个分布时候背景分布的重要因素有两个:
一,该分布产生的数据所占的比例大小;二该分布的方差大小。
GMM的参数估计是根据已知的样本序列,估计出模型的混合系数、各个高斯分布的均值
第5页共17页
矢量和协方差矩阵等参数,使得模型能够最佳的表示已知的样本序列。
EM算法是一种正对概率模型的迭代优化技术,在解决最大释然估计问题中引起了极大的关注。
采用EM算法来估计表示条件概率密度的GMM参数,EM算法能保证迭代的稳定收敛。
进行EM算法参数估计的过程为:
·首先初始化参数hm、um、m
·E-步
hmN(xn|um,m)
Hnmk
hmN(xn|um,m)
m1
·M-步
h*
N
H
nm
/N
m
n1
ui*
N
N
Hnmxn/
Hnm
n1
n1
N
N
i*
[
Hm(xn
ui)(xnui)t]/
Hnm
n1
n
1
·循环到条件满足。
GMM的参数估计是利用了EM算法,可以较好地估计出变量的概率密度函数。
第6页共17页
2.2KDE简介
2.2.1核密度估计简介
从本集估概率密度函数是很多基于的机器学方法的基。
核密度估KDE算
法是一种的非参数密度沽方法,其有代表性的用包括判分析然而由于KDE算法的
算复度很高,使其只能用于理小模和低的数据集,从而极大地限制了其在
中的用。
密度估算法大体分三:
参数方法、半参数方法和非参数方法。
核密度估
算法是当前最有效和用最广泛的一种非参数密度估算法。
KDE不引入数据分布的先
假,只从本本身出取数据分布特征,可以用来估任意形状的密度函数与参
数方法和半参数方法相比有着明的。
定1X1,X2,X3,X4⋯..Xn元量X的独立同分布的一个本,X所服从的密
度函数f(X)的核密度估:
f(X)
1n
K(XKi)
nhi1
h
其中h是控制估光滑性的参数,也称窗
K是以本点中心的称的峰核
函数。
2.2.2背景建模
在室外控系中,景不可能完全静止,而固定安装的像机也会存在一定的抖,
此背景不可能再用像序列中的一幅像来完全表示。
因此,要利用背景差法准确地
到运物体,需要地一个背景模型并之行更新。
非参数背景模型利用核函数密度估方法从一本中得到未知的背景密度分布函数。
从理上,核估近收于任何形式的密度函数,因此具有一般性和通用性,非常适用
于分析中密度分布不可知的情形。
x1,x2,⋯⋯,xn某一像素特征的n个采,那么t刻到特征xt的概率用核估算:
n
p(xt)Kh(xtxi)
i1
在用中,核估中窗h的非常关,甚至比核函数的更重要。
如果
h取得太小,会使密度分布曲具有毛刺不光滑,而h太大会生度光滑象。
在背景
模型估中,h需要表示特征量由于像局部噪声引起的化。
由于本中位数不易受到
异常的影响,故采用两的本差中位数来算。
假某一像素灰度的局部
第7页共17页
分布为N(,h),则(xixi1)服从N(0,2h2)。
值得一提的是,采用高斯核估计得到的背景模型
比混合高斯和表示的参数模型更具一般性,得到的背景特征密度分布更准确,而且避免了参
数估计中由于大量数据中存在的不精确和偏差带来的不可避免的误差。
核估计首先需要得到待估计量的一个训练样本集。
将视频序列中像每一帧的灰度或色彩
值作为样本,并采用均一权值。
这也就是说,将不同的采样值对模型的贡献视为同等,对相
同或差别不大的采样值需要重复计算。
而事实上,训练序列中大部分像素点的变化是有限的,
n个采样中存在一些相似甚至相同的值,可用L个具有代表性的值来表征。
另外,背景模型
中如果包含太宽的灰度分布值会覆盖前景的灰度取值,从而导致检测效果变差。
因此,本文提出一种基于多样性原理的采样方法,目标是保留灰度取值的主要信息,并将次要的信息用一些具有代表性的值来表示。
这样可以用较少的灰度值来表征图像的关键信息。
场景的不断变化需要背景模型及时地进行更新以快速反映这些变化。
给定一个新观测值,采用选择性更新机制,不将前景物体用于背景模型的更新:
首先判定一个像素是属于背景还
是前景,一般采用前一时刻的检测作为更新前的判定依据。
如果当前像素点在前一时刻分割二值掩码中的值为1,则表示在当前帧中此坐标点的像素属于前景物体,不参与模型参数更
新。
对于当前帧中属于背景的点,如果其与当前背景模型中样本点的欧氏距离小于2h,则不更新模型;否则,用当前值作为一个新的采样来更新背景模型。
建立了背景的动态模型后,用背景帧差值法来检测运动物体就可以通过阈值化来实现。
如果式中估计得到的概率小于某一阈值th,则该像素归为前景点;否则归为背景点。
阈值通常需要在实验中选定。
2.2.3快速核密度估计算法
KDE的计算复杂度问题,自算法本身提出时起,就已经引起了研究人员的关注。
早期针对单元变量KDE,提出了一些有效的加快计算速度的算法,但是它们不能切实可行地推广到多元变量KDE中。
近年来,随着计算饥技术的飞速发展和海量高维数据的大量出现,使得人
们越来越迫切地需要快速地从数据中挖掘有用的信息。
因为密度估计是很多机器学习任务中
重要的一环,所以寻求适用范围更广且更快速地进行KDE计算的算法已成为机器学习领域研
究的热点问题。
对于一个具有Nr价个样本的测试样本集
T,定义它的全局对数似然为:
Nr
lgf(tj)
Lr
j
i
双树递归算法的基本思想如下:
分别对训练样本和测试样本构造一棵
mrkd-tree,分别
第8页共17页
称为Stree和Ttree,然后从两树的树根结点对开始同时对这两棵树进行遍历。
确定优先选取
结点对的准则,依州逐个考察当前最优先的结点对。
在遍历的过程中,根据所需的计算精度,
只需要在其中某些结点对之间进行核函数的计算,而其他一些结点对之间不发生关系,这样
就大大降低了KDE的计算复杂度。
在Ttree的每一层,都估计全局变量Lr的一个上界和一个下界,当遍历在Ttree的某一层满足了:
|Lu
Ll|
|Ll
s
|
时,算法终止,其中e为一个预定的小的正数。
2.2.4核密度估计运动检测方法
视频帧中有M个像素点,每个像素点有N个背景样本,则在t时刻视频帧中第i个像素的像素值为x(t)i,该像素对应的第j个背景样本的像素值为x(t)i,则t时刻像素i的概率p(x(t)i)可以通过下式进行估计:
1
N
x(t)ij)
p(x(t)i)
K(x(t)i
Nj1
其中K为核估计子,假设K服从正态分布,对于RGB图像可以取R、G、B分量做为特征
值,如果它们相互独立,则
N个样本的概率之和为:
p(x(t)i)
1
Nd
1
(x(t)imx(t)im,j)2
e
2
N
j1
m1
2i,m
2i,m
其中d为像素的特征维数,x(t)im是第i个像素的第m个特征值,σi,m为第m个特征的核
宽。
采用单阈值进行分类,会带来如下问题:
如果要降低误报率必定会导致漏报率的增加;
反之如果要降低漏报率会导致误报率的增加;因此用单阈值很难协调这对矛盾。
根据误报率
调整阈值,需要场景的先验知识,当场景改变时,需要人工干预。
本文从像素概率直方图分
析出发给出了一种自适应前景、背景阈值的双阈值选择方法,用于像素的分类。
在更新背景模型时采用Long-term模型和Short-term模型,在Long-term模型中采用盲
目更新机制,即不管分类的结果,以速率W/N把采样直接更新到该模型中去,W为时间窗口
的大小,N为背景样本的采样数目。
在Short-term模型中采用选择更新机制,即只有分类为
背景的样本才包括在该模型中。
采用Short-term,如果检测结果不正确,会导致负样本被模
型预测为正样本(falsepositives)。
采用Long-term模型,由于不是最近的背景模型,会导
致负样本被模型预测为正样本,会导致正样本被模型预测为负样本(falsenegatives)。
第9页共17页
第三章MATLAB简介
Matlab,MatrixLaboratory的简称,是美国Mathworks公司于1984年推出的数值计算机
仿真软件,经过不断的发展和完善,如今已成为覆盖多个学科、具有超强数值计算能力和仿真分析能力的软件。
Matlab应用较为简单,用大家非常熟悉的数学表达式来表达问题和求解
方法。
它把计算、图示和编程集成到一个环境中,用起来非常方便。
同时,Matlab具有很强
的开放性和适应性,在保持内核不变的情况下,Matlab推出了适合不同学科的工具箱,如图
像处理工具箱,小波分析工具箱、信号处理工具箱、神经网络工具箱等,极大地方便了不同学科的研究工作。
Matlab强大的绘图功能,简单的命令形式,使其越来越受到国内外科
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word matlab 基于 GMM KDE 估计 目标 跟踪 仿真 doc