多智能体系统中一致性卡尔曼滤波的研究进展.docx
- 文档编号:25771456
- 上传时间:2023-06-13
- 格式:DOCX
- 页数:19
- 大小:217.87KB
多智能体系统中一致性卡尔曼滤波的研究进展.docx
《多智能体系统中一致性卡尔曼滤波的研究进展.docx》由会员分享,可在线阅读,更多相关《多智能体系统中一致性卡尔曼滤波的研究进展.docx(19页珍藏版)》请在冰豆网上搜索。
多智能体系统中一致性卡尔曼滤波的研究进展
第46卷第2期
2011年4月
西南交通大学学报JOURNALOFSOUTHWESTJIAOTONGUNIVERSITY
Vo.l46No.2
Apr.2011收稿日期:
20100201
作者简介:
马磊(1972-,男,教授,博士,研究方向是网络化控制和多机器人系统,Emai:
lmale@iswjtu.edu.cn,l.文章编号:
02582724(201102028707DOI:
10.3969/.jissn.02582724.2011.02.019
多智能体系统中一致性卡尔曼滤波的研究进展
马磊1
史习智
2
(1.西南交通大学电气工程学院,四川成都610031;2.上海交通大学机械系统与振动国家重点实验室,上海
200240
摘要:
从多智能体系统中一致性问题的基本概念、算法收敛性和性能分析出发,总结了基于一致性方法的分布式卡尔曼滤波的研究进展.从基于局部通讯的滤波器构造方法、信息加权和滤波器参数优化等方面对研究现状进行了评述.最后,讨论了信息损失、量化一致性和随机异步算法等前沿问题,以期促进相关研究.关键词:
一致性;多智能体系统;图拉普拉斯算子;信息融合;分布式卡尔曼滤波中图分类号:
TP242文献标志码:
A
RecentDevelopmentonConsensusBasedKalmanFiltering
inMultiagentSystems
MALei1
SHIXizhi
2
(1.SchoolofElectricalEngineering,SouthwestJiaotongUniversity,Chengdu610031,China;2.StateKeyLaboratoryofMechanicalSystemsandVibration,ShanghaiJiaotongUniversity,Shanghai200240,China
Abstract:
RecentdevelopmentofthedistributedKalmanfilteringusingtheconsensusmethodwas
addressed.Theconcep,tconvergenceandperformanceanalysisofconsensusproblemsinmultiagentsystemswereintroduced,andseveralaspectsoftheconsensusbasedKalmanfilteringwerediscussedindetails,
includingfilterconstructionbasedonlocalcommunication,
informationweightingand
parameteroptimization.Finally,somefrontiersoftheresearchontheconsensusmethod,suchasinformationloss,quantizedconsensusandstochasticasynchronousalgorithms,werebrieflydiscussedtopromotetherelatedresearch.
Keywords:
consensus;multiagentsystem;graphLaplacian;informationfusion;distributedKalmanfiltering
2003年,由加州理工学院教授R.M.Murray领衔的专家小组在关于控制科学与工程的指导性文献信息爆炸时代的控制关于控制、动力学和系统未来方向的专家小组报告中,将多机器人合作列为应重点发展的方向
[1]
.近年来网络化多
智能体系统的研究进展迅速,对多机器人合作和移动传感器网络的发展具有指导意义,在环境监测、灾害预报和救险、工业设备监控、目标跟踪、物流和军事等多方面有广泛应用前景.此类系统中,受能耗、体积等因素的限制,单个智能体(机器人、飞行
器或传感器往往只具备有限的计算、感知和通讯能力,相应的信息处理或控制算法应具有分布性,
对信息损失有鲁棒性,适应通讯拓扑结构的变化.一致性(consensus方法为实现通讯拓扑结构变化情况下的信息交互开辟了全新的研究方向,是多智能体系统研究的最前沿领域.本文介绍基于一致性方法的分布式卡尔曼滤波及其在信息融合中的应用,在综述研究进展的基础上,探讨了一些尚未解决的关键问题.
西南交通大学学报第46卷
1用于信息融合的卡尔曼滤波
卡尔曼滤波器
[2]
是一类针对线性系统中高斯
分布噪声的最优滤波器,在制导导航、目标跟踪和控制工程中具有重要地位.在传感器信息融合技术中,卡尔曼滤波器及其变种是第一级信息处理的主流技术[3]
.这里简介用于多传感器信息融合的分
散式卡尔曼滤波(decentralizedKalmanfiltering[4]
的主要思想.
图1给出了一类用于导航的分散式卡尔曼滤波的体系结构[5]
.多个卡尔曼滤波器被用于传感器1,2,,n和惯性传感器的数据融合,一个主滤波器处理所有卡尔曼滤波器的输出,对飞行器的状态作估计
.
图1分散式卡尔曼滤波Fig.1Decentralizedkalmanfiltering
各卡尔曼滤波器对式(1所示目标进行状态估计:
x(k+1=A(kx(k+B(ku(k+w(k,
(1
式中:
x为状态变量;u为系统输入;w为白噪声,
w~N(0,Q,Q为w的协方差矩阵;A是状态转移矩阵;B是输入矩阵.传感器i的感知(测量模型为:
yi(k=Hi(kxi(k+vi(k,
(2
式中:
Hi为传感器i的观测矩阵;vi为随机测量误差,vi~(0,Ri,Ri为vi的协方差矩阵.分散式卡尔曼滤波的目的是获取对目标状态x的估计,并使下列性能函数达到最优:
J=(x1-,x2-,,xn-T
P-1
(x1-,x2-,,xn-,
(3
式中:
x1,x2,,xn是子卡尔曼滤波器的输出;
P是x的协相关矩阵.若各传感器数据不相关,则上式可改写为子滤波器性能函数之和,
J=
n
(xi-Pii(xi-T
.
(4
此时主滤波器的性能等同于一个集中式卡尔曼滤波器,实现最优估计.分散式卡尔曼滤波的思想在信息融合和分散式控制技术中有较长历史,应用广泛
[69]
.
在此方式中需要全局通讯,以向主滤波器传输
子滤波器输出和协相关矩阵,通讯量较大.本文介绍的分布式卡尔曼滤波基于局部通讯,在每个智能体只能和其近邻进行交互,并且交互对象可发生变化的条件下,实现全局最优状态估计.
2多智能体系统中的一致性方法
一致性是计算机科学中分布计算的基础
[10]
.
DeGroot在20世纪60年代提出了统计一致性,在管理科学中研究一群专家的意见一致问题[11]
.近年来,在科学和工程的各个领域中,许多看起来不同的问题都包含动态系统相互连接的内容,Ren和OlfatiSaber等较早提出了与网络化多智能体系统有关的一致性问题
[1213]
Lin、Xiao、Fax、
Jadbabaie、Moreau等的工作也有代表性[1418]
.郑毓蕃等向国内较全面地介绍了多智能体系统中一致性方法的发展动态
[19]
.
一致性意味着就利益份额达成一致.传感器网络中的一致性指不同传感器节点对同一目标状态的估计达成共识,在多机器人协调控制中,则
意味着所有机器人达到相同运动状态.一致性算法(consensusalgorithm是智能体间的信息交互规则.智能体网络的交互拓扑由有向图G=(V,E来表示,该有向图具有节点V和边缘E的集合.智能体i的近邻为Ni={jV:
(i,jE}.对具有连续时间动态方程xi=ui的n个积分器智能体,一致性算法可表示为一个图的n阶线性系统
xi(t=
jNi
a
ij
(t[xi(t-xj(t],
其中:
aij(t>0是时变的权重.遵守以上协议的智能体群的集体动力学(collectivedynamics可写为
x=-Lx,式中L=[lij]是网络的图拉普拉斯算子
(graphLaplacian,它的元素定义为:
lij=
n
k=1,ki
aik,j=i;
-aij,ji.
当xi-xj0,t,ij成立,则称上列多智能体系统达到一致.假设图是无指向的,则单个节点状态收敛于所有节点初始状态的平均值,具288
第2期马磊等:
多智能体系统中一致性卡尔曼滤波的研究进展
法(averageconsensusalgorithm,在传感器网络信
息融合的分布计算中获得广泛应用.
一致性方法研究的核心是考察时变网络中算
法的收敛性.若图有一个生成树,则0是图拉普拉
斯算子L的一个简单特征值(trivialeigenvalue,而
1是相应的特征向量,于是有L1=0,x收敛于
span{1},也就是达到一致.对于无指向图,拉普拉
斯算子是具有实特征值的对称矩阵,其特征值集合
可按升序方式依次排列为0=12n,其
中,第2个最小特征值2被称为图的代数连通性
(algebraicconnectivity.网络拓扑的代数连通性是
一致性算法收敛速度的测度,对强连接的有向平衡
图,连续时间一致性算法以不低于2(Ls,Ls=
(L+LT/2的速度指数收敛[13].
为突出网络拓扑结构的影响及分析的简洁性,
多采用简单的线性时不变系统,如一阶积分器来描
述智能体的动力学特征,洪奕光等研究了二阶系统
的一致性收敛[20]及在领队跟踪问题中的应用[21].
一些学者对非线性系统的一致性问题也有涉猎,如
Ren针对机器人控制研究了欧拉拉格朗日(Euler
Lagrange系统[22]、Mnz等研究了一类无源非线性
系统[23]的一致性问题.
3基于一致性方法的卡尔曼滤波
3.1OlfatiSaber的一致性卡尔曼滤波器
OlfatiSaber较早研究了一致性卡尔曼滤
波[2425],提出了一类分解方法,用嵌入到传感器中
的微卡尔曼滤波器(microKalmanfilter来代替集
中式滤波器.对于B为噪声输入矩阵的目标过程,
微卡尔曼滤波器为:
Mi(k=[P-1i(k+S(k]-1,
(k=^(k+Mi(k[y(k-S(k^(k],
Pi(k+1=A(kMi(kAT(k+B(kQTi(k,
^(k+1=A(k(k,
(5
式中:
Pi为智能体i状态估计的协方差矩阵;
S(k=1
n
n
i=1
HTi(kR-1i(kHi(k
定义为平均逆协方差矩阵;
y(k=nn
i=1
HTi(kR-1i(kyi(k
为经融合的传感器数据;i是微滤波器输出的状态估计;为全局状态估计;^为一步预测估计.采用微滤波器输出的组合在图连通的条件下能够达到集中式滤波的性能,即(k=i(k.所有传感器状态估计的一致性取决于关于y和S,即传感器数据和全局状态估计协方差的一致性收敛.为此,提出了嵌入式滤波的概念.如图2所示,在每个传感器中,1
个低通一致性滤波器实现y的一致性估计,1个带通滤波器对S进行一致性估计(这里处理的是逆协方差矩阵,故引入高通滤波器是合乎逻辑的.
图2具有低通和带通滤波器的分步式卡尔曼滤波Fig.2DistributedKalmanfilteringwithlowpassandbandpassfilters
低通滤波器为:
qi=
jNi
(qj-qi+jN
i
(uj-qi,(6a式中:
qi和ui分别是传感器i的状态变量和输入;Ni是智能体i的邻居的集合.高通滤波器为:
pi=
jNi
(pj-pi+
ui,(6b式中:
pi为状态变量.各滤波器状态变量的维数分别是集中式滤波器维数的1/n,在处理大网络时,分布式算法的优势明显.注意S和y为全局变量,因此上列算法未完全解决分布式滤波的问题.上述嵌入式滤波的概念使得系统可以处理不同的传感器测量模型.
3.2基于加权的分布式卡尔曼滤波
分布式卡尔曼滤波指仅依靠局域通讯,各智能体获取其近邻的状态估计,并基于此计算对系统状态变量的估计值.此类方法对通讯依赖性较低,算法简单,并对通讯拓扑结构的变化具有一定鲁棒性,因而在多智能体系统中有很好的应用前景.基于一致性的分布式卡尔曼滤波器设计以加权为主要方法,依据各种准则(如通讯信噪比、智能体状态的可信度等对智能体状态进行加权平均,核心是卡尔曼增益和权重(一致性增益矩阵的设计.采用分布式卡尔曼滤波对自治对象x(k+1=Ax(k+w(k进行状态估计,智能体i的子卡尔曼滤波器[26]为:
289
西南交通大学学报
第46卷
测量更新(measurementupdatelocali(kk=regi(kk-1+Ki[yi(k-Hiregi(kk-1],(7
融合(merging和预测(prediction
regi(k+1k=Aregi(kk+
jNi
Wijlocali(kk,
(8
式中:
locali和regi分别为智能体i仅采用自身测量值的本地状态估计和综合了近邻估计值的局域状态估计.可见单个智能体的局域状态估计由其近邻输出的加权和给定.一致性增益(加权矩阵Wij和卡尔曼增益矩阵Ki的选定由一个离线的优化方法完成,目的是使静态误差协方差达到最小.
Ren等
[27]
研究了一类根据智能体状态估计的
确定性来确定权重的卡尔曼滤波.以连续时间系统为例,智能体i的滤波方程式为:
Pi=-P
i
j
g
ij
(t(Pj+ij
-1
Pi+Q,
Kij=Pi(Pj+ij-1
i=
Ni
j=1
g
ij
(tKij[(j+ij-i].
(9显然,这里卡尔曼增益Kij也起到一致性增益的作用,为智能体i和j的信息交互赋予权重.
Pi=E{(i-(i-T
}
是协方差矩阵.gij(t是一个时变的布尔数,当智能体i和j间有数据传输时其值为1,反之为0.因此,每个智能体的近邻可以随时间而改变.文献[27]的另一重要思想是引入噪声项ij来描述智能体i和j间通讯的不确定性,ij=E{ijTij
}.智能体i和j间的通讯噪声导致增益Kij的减小,不确定性较强的通讯讯道在最终的状态估计中所占份额较小.类似地,当智能体j的可信度较高时,Pj较小,则与其通讯的智能体i的可信度及Kij在全局状态估计中的贡献较大.状态估计的渐进收敛性要求网络图的并(union始终具有生成树,即任意智能体的状态可以通过一致性算法对其它智能体施加影响.注意该算法并不要求图是平衡的.平衡图中,如果两个智能体i和j能通讯,则它们的信息流出和输入相同.非平衡图中,在智能体i和j确定度相同的条件下,j的信息输出可能多于i,则智能体j的实际权重大于i,全局状态估计可能偏离由
集中式滤波产生的输出.Alighanbari等[28]
对文献,jj(t=
N
i
k=1,kj
gkj(t,
新的算法为:
Pi=-Pi
j
g
ij
(t[j(tPj+ij]
-1
Pi+Q,(10
由信息输出量不平衡导致的偏移不再出现.3.3滤波参数的优化
文献[26]中未给出收敛性的证明,也不保证全局最优.Carli等对基于优化方法选取一致性滤波器参数的思路作了较系统的研究[29]
但是文中仅涉及完全统一的传感器动态模型和单一变量的估计.令m为采样周期内智能体间通讯次数,定义性能函数
J(W,K;m,R,Q=tr{limk
P(k+1k},(11给出了对智能体权重/一致性矩阵W和卡尔曼增益K的优化,固定K而对W的优化
Wopt(K;m=argminJ(W,K;m
是一个凸问题,可使用通行的凸优化方法.由于W是随机矩阵,其第二大的特征值决定一致性算法的收敛速度,因此,对W的优化就是对该特征值的优化.类似地,固定W而对K的优化也是J的凸函数.但是,对W和K的联合优化
(Wopt(m,R,Q,Kopt(m,R,QargminJ(W,K;m,R,Q
却不是一个凸问题.文中提出了一系列假设来降低一般性分析的难度,包括任意快速通讯即m和小噪声(R/Q0或Q/R0.显然,m是非常高的要求,而后两个条件则是极端情况,对W和K的联合优化仍然是一个难度较高的课题.
4一致性卡尔曼滤波的若干前沿课题
4.1信息损失
网络中的信息损失是一致性方法研究的重要课题,包括网络通讯的时延和数据丢包问题.对具有通讯时延的多智能体系统研究较活跃,主要关心算法的收敛性,广泛应用李亚普诺夫方法,如Lin
等基于LyapunovKrasovskii方法[30]
和Mnz等基于LyapunovRazumikin方法
[31]
的时变网络一致性
等.刘成林和田玉平较系统地介绍了具有时延的一
致性问题[32]
并用频域法研究了具有不同时延的一阶和二阶系统的一致性算法.针对丢包问题,对(290
第2期马磊等:
多智能体系统中一致性卡尔曼滤波的研究进展
有较系统的研究,Schenato等指出此类估计器是时变且随机的[33],推出了保证状态估计不至于发散的丢包概率之上限.值得注意的是,目前针对信息损失问题的一致性卡尔曼滤波研究还较少.4.2量化一致性问题
量化控制(quantizedcontrol[34]近年来受到广泛重视,已有在实践中应用的成功例子.量化控制的突出优点在于降低信息传输量,在多机器人协调控制和传感器信息融合方面也有较好体现.容易理解,量化的颗粒效应与算法的收敛速度和精度有直接联系.You[35]和Msechu[36]等分别研究了一类基于量化更新的卡尔曼滤波器设计方案,并给出了量化分辨率的优化方法,指出,采用2bit量化的状态估计结果非常接近传统卡尔曼滤波器.在一致性方法中引入量化控制的思想,是一个值得深入研究的新方向.
4.3随机异步算法
传感器网络往往采用异步通讯的工作方式,即某个节点依据特定规则被唤醒,并向其近邻传送或索取数据.反映到信息融合中,则数据处理算法不依据固定采样周期,多借用Gossip算法的概念.Gossip原意为散布流言,在社会学和心理学中指带有错误和变异的信息传播.计算机科学中将一类消息扩散算法称为Gossip,关注网络效率和可靠性等问题.基于Gossip的量化一致性算法是一种非同步方法,规定在多智能体系统中,每次随机选取可以通讯的一对智能体进行信息交互,并依据平均原则进行状态更新.Boyd等提出了随机Gossip算法[37],类似于一致性算法中的拉普拉斯算子,Gossip的核心是标志算法性能的一个双随机矩阵,其第二大特征值表征算法的收敛性,对收敛速度的改进归结为该特征值的优化问题.DelFavero和Zampieri的工作[38]是目前文献中已知的唯一关于应用Gossip方法的卡尔曼滤波策略,通过对每个边缘被选中进行通讯的概率以及对卡尔曼增益的选择,实现滤波器在均方差意义上的优化.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 体系 一致性 卡尔 滤波 研究进展