数学新进展.docx
- 文档编号:10435905
- 上传时间:2023-02-11
- 格式:DOCX
- 页数:28
- 大小:92.11KB
数学新进展.docx
《数学新进展.docx》由会员分享,可在线阅读,更多相关《数学新进展.docx(28页珍藏版)》请在冰豆网上搜索。
数学新进展
目录
1引言(Introduction)4
2基本问题和特点(Basicproblem)4
3能控性分析(Controllabilityanalysis)5
3.1智能体自身动力学特性(Effectsofagents’dynamics)5
3.2拓扑结构的作用和影响(Rolesandeffectsofinterconnectiontopology)6
3.2.1拓扑图的划分(Graphpartitions)7
3.2.2特殊拓扑结构图(Specialgraphics)7
3.2.3有向加权拓扑图(Directedandweightedgraph)8
3.2.4切换和时滞拓扑图(Switchingtopologiesandtopologywithtime-delay)8
3.3其他影响因素(Othereffects)9
3.3.1领航者的角色(Leaders’role)9
3.3.2邻居交互协议(Localinteractionsprotocol)9
4结构能控性(Structuralcontrollability)10
4.1结构能控性模型(Environmentofequations)10
4.2强结构能控性(Strongstructuralcontrollability)11
5相关研究问题(Somerelativeproblems)11
5.1能观测性问题(Observability)11
5.2可镇定性(Stabilizability)12
5.3复杂网络能控性(Controllabilityofcompletenetworks)12
6结论与展望(Concludingremarks)13
参考文献(References):
13
致谢20
多智能体系统能控性研究进展
刘华青
北方工业大学理学院,北京100144
摘要:
能控性问题是多智能体协调控制领域中一个基本又十分重要的研究课题.本文对多智能体系统能控性问题的研究现状进行综述.介绍了多智能体能控性领域的基本问题和特点,并从智能体自身动力学、通信拓扑结构和邻居交互协议角度对该领域当前的研究热点和前沿进行分析阐述.进一步,对结构能控性的研究成果进行归纳总结,并对能观测性、可镇定性和复杂网络能控性等相关问题进行阐述.最后给出了仍然需要解决的问题和可能的研究方向.
关键词:
多智能体系统;能控性;邻居信息交互;领航者-跟随者结构
RecentDevelopmentonControllabilityofMulti-AgentSystems
Liuhuaqing
NCUT,BeiJing100144,China
Abstract:
Controllabilityisafundamentalresearchissueinthestudyofcooperativecontrolofmulti-agentsystems.Thispaperpresentsanoverviewinthecurrentstudyofmulti-agentcontrollability.Somebasicissuesinthefieldofcontrollabilityofmulti-agentsystemsareintroduced,andtheresearchhotspotsandfrontiersareanalyzedandsummarizedfromtheperspectiveofagents’dynamics,interconnectiontopologyandlocalinteractionsprotocol.
Furthermore,someofthelatestresearchachievementsonstructuralcontrollabilityarepresented,andsomerelatedproblemssuchasobservability,stabilizabilityandcontrollabilityofcomplexnetworksarealsointroduced.Finally,theexistingproblemstobesolvedandthepossibleresearchdirectionarepresented.
Keywords:
Multi-agentsystems;controllability;localinteractions;leader-followerstructure
1引言(Introduction)
自上世纪80年代以来,随着计算机技术、通信技术、网络技术的飞速发展,多智能体系统的研究已经成为控制领域中的一个研究热点[1–4],并引起了控制、数学、生物、物理、通信、计算机和人工智能等诸多领域科技工作者的浓厚兴趣[5–12].相对于传统的控制系统,多智能体系统具有可靠性高、灵活性强、反应速度快、自适应性能力强等优点,这使得多智能体系统在科学、工程、军事等诸多领域得到广泛的应用.近年来,多智能体系统的协调控制研究已经成功应用于移动多车辆系统的编队控制[13]、智能交通系统[14]、无线传感器网络的目标跟踪与监控[15]、通信网络的拥塞控制[16]、人造卫星簇的姿态控制[17]、多自主水下航行器的控制[18]等工程实践中.
能控性是现代控制理论中的一个基本概念,最早是由卡尔曼(R.E.Klaman)在20世纪60年代初首次提出的[19].能控性作为一种描述系统状态可由外部输入作用来控制的性能,它的研究为系统控制器和估计器的设计提供了理论基础.多智能体系统能控性的概念最早是由Tanner于2004年提出的[20].多智能体系统的能控性是指,通过对多智能体系统内部某个或某几个领航者(leader)智能体施加外部控制输入,系统内部各智能体之间通过相互合作和自组织,使得跟随者(follower)智能体由任意给定的初始状态到达期望最终状态.概括地说,多智能体系统能控性反映了外界通过领航者智能体对跟随者智能体的控制能力.多智能体系统能控性具有重要的理论价值和实践意义:
1)从自然现象的观点来看,少量的简单个体受到外界控制(刺激或者影响)加上一些简单交互规则就能够产生奇妙现象,例如:
少量受训的牧羊犬能够控制整个羊群到达指定地点食草或者回圈[21];少量蚂蚁通过自身释放的化学激素来引导整个蚁群以最短路径搬运食物[22];通过刺激线虫体内大约17%的神经元,可以影响线虫全身的整个神经网络[23].2)从系统科学的观点来看,能控性的研究不仅丰富和拓展了多智能体系统理论研究的范畴,同时也具有广泛工程背景和应用价值.近年来,多智能体系统能控性作为多智能体系统研究中一个新兴但又十分重要的研究课题,受到了诸多领域的专家学者的广泛关注,获得了丰硕的成果.为此,本文力图在剖析多智能体系统能控性领域最新研究成果的基础上,对该领域的发展现状进行综述,并提出该领域研究的前沿性问题.
2基本问题和特点(Basicproblem)
从系统与控制理论的角度来看,多智能体能控性的研究具有许多新的特点,富有挑战性.
首先,多智能体能控性的研究采用领航者-跟随者(leader-follower)结构.领航者-跟随者结构是指在多智能体系统中指定一个或者多个智能体作为领航者(leader),其他智能体作为跟随者(follower).领航者接受外部控制信号,并对跟随者发布控制指令,从而影响跟随者的运动.跟随者不接受外部控制信号,他们之间允许存在信息的传递,并且直接或者间接的受到领航者的影响.领航者-跟随者结构的引入给多智能体系统能控性的研究带来一些新的问题,比如:
领航者角色的研究;领航者的选取问题(包括领航者数目和位置);领航者丢失的问题等等.
其次,多智能体系统在结构上具有“个体动态+通信拓扑”的特点[24];在状态演化方面智能体受到邻居交互规则的影响.这些特征给多智能体系统的能控性研究带来了一些困难.根据个体自身动力学特点,多智能体系统能控性的研究分为离散时间系统、连续时间系统、具有单阶积分器动态的多智能体系、具有高阶积分器动态的多智能体系统和一般线性动态多智能体系统等.根据个体之间的通信拓扑关系,多智能体系统能控性的研究分为定常和切换拓扑、单向和双向拓扑、有通信时滞和无通信时滞、有权重和无权重等.此外,受个体演化规则的影响,如何分析和设计智能体行为规则,以实现期望群体的构形也是多智能体系统能控性理论和应用研究中的一个新的课题.
另外,随着智能体数目的增加以及智能体自身动力学特性和通信拓扑结构的复杂化,研究多智能体系统在复杂网络模型下的能控性问题也是一项极具挑战性的工作.一方面,复杂网络本身具有许多不同形式和模型,如随机网络、小世界网络、无标度网络等.另一方面,由于复杂网络节点数目众多、结构复杂、个体动态多变,经典的能控性分析和计算方法不再完全胜任.因此,将图论、代数分析、复杂网络理论与经典的能控性方法相结合来研究复杂网络结构下的多智能体系统能控性问题,是一项新的挑战和尝试.
3能控性分析(Controllabilityanalysis)
多智能体系统的能控性受到多种因素的影响,包括智能体自身的动力学、智能体之间的通信连接关系、智能体演化所遵循的协议等.为此,本节将针对影响能控性的多个因素及相关问题进行阐述.
3.1智能体自身动力学特性(Effectsofagents’dynamics)
从智能体自身动力学特性角度来看,能控性问题的研究可分为一阶积分器动态系统、二阶积分器动态系统、高阶积分器动态系统和一般线性动态系统.另一个方面,描述智能体模型又分为连续时间系统模型和离散时间系统模型.
考虑n个智能体组成的多智能体系统,每个智能体动态方程由如下单积分器模型描述:
Ξ:
其中,
∈Rd为第i个体的状态向量,
为施加的控制输入,
是由智能体i的所有邻居构成的集合.假设多智能体系统
(1)的通信拓扑由图G描述,相应的拉普拉斯矩阵(Laplacianmatrix)为L,且
则系统
(1)可表示为
x,⊗表示克罗内克积.
注1为描述方便起见,假设智能体的状态维数d=1.多维的情况可以利用克罗内克积表示,本文所涉及的结果对多维仍然成立.
假设系统中有m(≥1)个领航者和n−m个跟随者.引入领航者-跟随者结构,相应的拉普拉斯矩阵L写成如下分块形式:
L=
(2)
其中
和
分别对应跟随者和领航者的编号,
表示从领航者到跟随者的通信连接关系.根据领航者-跟随者的划分,系统
(1)可表示为
Ξ:
这里u为外界控制指令,
和
分别是所有跟随者状态和领航者状态的迭加向量.这里我们研究的问题是领航者对跟随者的控制能力,即系统
(4)
的能控性问题.
针对模型(4),Tanner[20]首先讨论了矩阵Lf和L的特征值和特征向量之间的关系,并研究了系统(4)在单一领航者情形下的能控性问题,给出判定系统(4)能控的一个充分必要条件.另外,作者还得到在无向图中增加连通性会对系统的可控性产生负面影响的结果,并指出非加权的完全图是不可控的.Tanner的研究引起了广泛关注,随后诸多学者对该问题进行了深入研究.Ji等[25]利用图论工具对系统(4)的能控性进行了分析,获得一些判定能控性问题的代数条件和一些简单的图论解释.
在单阶积分器系统研究结果的基础上,许多学者对具有二阶、高阶以及一般线性系统动态的多智能体系统能控性问题进行了研究,代表工作包括文献[26–31].特别地,文献[26]和[27]的研究表明:
在一定条件下,二阶、高阶和一般线性系统动态的多智能体能控性等价于单阶积分器系统的能控性.这样的结果表明:
在某种程度上,多智能体能控性不受智能体动态性能因素的影响.
对应于离散系统,文献[32,33]考虑了如下控制协议:
(5)
其中,
(≥0)为拓扑权重值.
为常数值,表示领着者对跟随者的作用.如果领航者(标记为0)施加控制于第i个智能体,则
=1,否则,
=0.
假设,多智能体系统中包含n个跟随者.则离散多智能体系统的能控性模型描述为:
其中,x=
F=I−L−R,R=diag[
...,
],r=
T.利用代数分析理论和PBH判(Popov-Belevitch-Hautustest),Liu等[32–34]对系统(6)的能控性进行了分析.随后,文献[35]和[36]针对具二阶积分器动态的系统模型,考虑了具有多个领航者的离散多智能体系统能控性问题,给出了一些判定能控性的代数条件.
3.2拓扑结构的作用和影响(Rolesandeffectsofinterconnectiontopology)
多智能体系统的能控性问题与智能体之间的信息拓扑结构有着密不可分的关系,这是由于:
一方面,多智能体系统是由许多个体通过某种相互作用构成的一类网络化系统,在建模方面可以利用图论的方法进行描述和研究.另一个方面,多智能体系统能控性等价于图的能控性问题,研究和分析图的结构特性不仅有助于更好的理解能控性,而且可以为拓扑结构的设计提供理论指导.因此,对能控性进行图论的刻画具有重要的理论和现实意义.本节将针对多智能体系统能控性现有的研究结果,从拓扑图角度进行分类阐述.
3.2.1拓扑图的划分(Graphpartitions)
能控性研究中,很大一部分结果是通过拓扑图划分得到的.其中涉及到的图划分包括:
等价划分(equitablepartition)、松弛/几乎等价划分(relaxed/almostequitablepartition)、最大松弛/几乎等价划分(maximalrelaxed/almostequitablepartition)、距离划分(distancepartition)、连通分支划分(connectedcomponentpartition)、广义等价划分(generalizedequitablepartition)、广义松弛/几乎等价划分(generalizedrelaxed/almostequitablepartition)等.
文献[37,38]利用了无向图的等价划分概念(即:
将具有相同邻居数目的节点划分成一类,构成一个划分单元(cell),整个拓扑图的节点集合由不相交的划分单元的并集构成),针对具有单个领航者和多个领航的多智能体系统,分别研究了其能控性问题.同时,基于自同构映射文献[37,38]定义了拓扑图的对称性,并给出了能控性的必要条件,即:
如果拓扑图关于领航者是对称的,那么对应的多智能体系统一定是不可控的.随后,Martini等[39]提出了松弛(几乎)等价划分的概念,即:
在等价划分基础上不再要求同一个划分单元内的节点也具有相同的邻居个数.借助此概念,文献[39]研究了具有对称性的单一领航者的多智能体系统能控性及能控性分解问题,给出了一个能控性的充要条件:
多智能体系统能控当且仅当拓扑图存在平凡的松弛等价划分.然而,系统的对称性并不是松弛等价划分存在的必要条件.因此,文献[40,41]通过构造反例分别证明了文献[39]得到的结果只是能控性的必要而非充分条件.Zhang等[42,43]利用最大松弛划分和距离划分的概念,研究了无向拓扑图能控子空间维数的上下界估计问题,同时给出了一个获得无向拓扑图最大松弛划分的算法.文献[44]将无向图等价划分和松弛等价划分的概念推广到了有向加权图,获得了广义等价和广义松弛等价划分的概念并对有向加权图的能控性问题进行了研究.Ji等[45,46]提出了无向图的连通分支划分,证明了多智能体系统在给定拓扑图下能控当且仅当每个连通分支是能控的.同时作者还研究了领航者-跟随者连通(leader-followerconnected)拓扑结构,并指出:
领航者-跟随者连通是多智能体系统能控的必要图形结构.依据这条结论,通过观察拓扑图结构,如果不满足领航者-跟随者连通拓扑条件,就直接可以判断系统不可控,这一条件的提出大大的减少了能控性研究的工作量.更多关于拓扑图结构划分的结果可参阅综述性文献[47].
需要指出:
从图的划分角度来研究能控性只是一种尝试和手段,事实上没有任何一种划分能够涵盖所有的拓扑图结构,进而无法通过拓扑图划分来确定任意给定图的能控性问题.
3.2.2特殊拓扑结构图(Specialgraphics)
由于一般性拓扑图的能控性问题很难得到满意的结果,大量学者转而讨论一些特殊拓扑图的能控性问题,并得到了一些有意义的结果.文献[48]讨论了无向路图和环图的能控性问题.作者分析了路图和环图对应的拉普拉斯矩阵的特征值和特征向量,给出了不可控系统对应的特征值和特征向量的具体形式.同时,利用数论工具,作者给出了在指定领航者的前提下,路图和环图完全能控的充要条件.文献[20]考察了完全图的能控性,指出在给定单一领航者的情况下完全图一定不可控.Ji等[49,50]研究了树图的能控性.通过引入的向下分支(downerbranch)的概念,作者分别从代数和图论角度给出了树图能控的一些充分/必要条件.文献[51]研究网格图(gridgraphs)的能控性问题.作者将网格图分解成一些简单的无向路图的组合,结合图论和数论理论得到了网格图能控的一些充分/必要条件.文献[52]研究了循环图的能控性问题.借助于柯西-比内公式(Cauchy-Binetformula)和经典的PBH判据,作者研究了循环图的特征值和特征向量,给出了循环图能控的一些代数判据.文献[53]构造了一类不可控的拓扑结构:
具有单一领航者的多重链状拓扑图.作者研究该图的结构特征,并提出了获得最大松弛等价划分的一个算法.
3.2.3有向加权拓扑图(Directedandweightedgraph)
之前的结果大多考虑的是无向非加权拓扑图,无向拓扑对应的智能体之前信息交流是双向的,即:
智能体发送信息的同时也能接受到邻居个体的信息.因而,能控性模型中的拉普拉斯矩阵是对称的.然而,在实践应用中,由于交互模式的限制、外界环境干扰、通信权重以及智能性能差异等因素的影响导致智能体之间的信息交互具有方向性、存在权重值.因而,拓扑图对应的拉普拉斯矩阵是非对称的,这给能控性问题的研究带来新的挑战.因此,研究有向权重拓扑图的能控性问题具有重要理论和实践意义.目前已有学者从不同角度对该问题进行了研究,获得了一些成果.例如,Jiang等[26,27]针对无向和有向权重拓扑图,建立了能控性问题的统一描述模型,给出了系统能控的一些代数和图论条件,并讨论了边权重对能控性的影响.文献[27]的研究结果表明,通过适当的选取边权重值,一个不可控的系统将变为能控系统.关于这点我们将会在结构能控部分深入讨论.文献[54]提出了有向权重图的距离划分和权重平衡划分,给出了能控子空间维数的上界.同时,作者针对权重值对能控性影响也进行了讨论.文献[55]讨论了有向权重树图的能控性,给出了一些能控性的充要条件,并讨论了权重值的选取问题.文献[56]考虑了具有不同节点动态的多智能体系统在有向权重拓扑图下的能控性问题.借助矩阵理论和图论工具作者给出了一些判定能控性的充分/必要条件.
3.2.4切换和时滞拓扑图(Switchingtopologiesandtopologywithtime-delay)
切换拓扑是指智能体的通信拓扑因某种原因从一种模式转换为其他模式[12].在多智能体系统能控性性研究中,尽管固定通信拓扑的假设可以简化相关问题,但是时变拓扑或者切换拓扑的情形更加符合实际.例如,考虑智能体之间受到障碍物的影响或通信距离发生变化时,通信拓扑中的某些连接边可能断开或连通[3].此外,信息传递中的丢包也可简化为通信拓扑的切换[2].因此,研究切换拓扑结构下的能控性问题具有重要理论价值和实际意义.另一个方面,在实践应用中,由于传输介质物理特性、传输信号的多样性、传输带宽的限制等诸多因素的影响,智能体系统中通信时滞现象广泛存在.因此,研究含有通信时滞的多智能体系统能控性问题也具有重要意义.
对于切换拓扑和含有通信时滞情形下能控性问题,目前主要的研究方法是将多智能体系统模型转化为切换系统和时滞系统,利用切换系统和时滞系统能控性的概念和处理方法[57–61]结合图论、代数工具进行分析,得到能控性的一些判据.例如,Liu等[32–34]研究了离散线性多智能体系统在切换拓扑条件下的能控性问题.作者分别考虑了具有单一领航者和多个领航者的情况,利用列空间、循环不变子空间等概念,给出了一些判定能控性的代数条件.文献[62,63]讨论了连续多智能体系统在切换拓扑条件下的能控性问题,给出一些能控性的充分和必要条件.结果表明:
即便每个子系统不可控,在切换条件下整个多智能体系统仍然可控.需要说明的是:
目前切换拓扑下多智能体能控性的结果都是利用经典切换系统能控性的几何判据[57–59]得到的,而针对多智能体自身特征,从拓扑图结构角度出发,分析多智能体系统能控性、考察拓扑图切换控制率的设计问题,得到图论方面的判据和结果等这工作有待于进一步深入研究.
时滞拓扑图方面,Liu等[36]研究了具有一阶离散系统能控性问题.作者考虑了具有定常多通信时滞的情况,给出了解决能控性问题的代数条件.Ji等[64]针对一阶和二积连续分器模型分别讨论了具有定常单一通信时滞和定常多通信时滞的情况.以上文献得到的能控性判据均与通信时滞无关,仅与拓扑结构相关,这一点进一步表明能控性与通信拓扑密切相关.
3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 进展