多智能体系统的协调控制研究综述.docx
- 文档编号:30008243
- 上传时间:2023-08-04
- 格式:DOCX
- 页数:29
- 大小:103.58KB
多智能体系统的协调控制研究综述.docx
《多智能体系统的协调控制研究综述.docx》由会员分享,可在线阅读,更多相关《多智能体系统的协调控制研究综述.docx(29页珍藏版)》请在冰豆网上搜索。
多智能体系统的协调控制研究综述
多智能体系统的协调控制研究综述
文章编号:
?
?
多智能体系统的协调控制研究综述
苗国英马倩。
摘要
引言
近年来,多智能体系统的协调控制
在多机器人合作控制、交通车辆控制、无
在落叶飘飞的秋天,人们经常看见大雁排着整齐的“人”字型队
人飞机编队和网络的资源分配等领域有
伍迁徙到南方;在阴暗潮湿的环境下,细菌部落聚集而生;夏天池塘
着广泛的应用,成为当前控制学科的一
的青蛙同时发出“哇哇”的叫声;夏日的一群萤火虫同时发出一闪一
个热点问题.首先介绍了多智能体系统
的研究背景、智能体的概念和相关的图
亮的光线;自然界中成群的蜜蜂,事先没有商量建筑蜂巢的蓝图,但
论知识:
然后从多智能体系统协调控制
是它们各自搬运泥土,筑成了坚固的蜂巢;在海洋中某些鱼类,具有
包含的几个问题入手,即群集问题、编队
规则队形聚集在一起运动,当发现新的食物来源或者受到外部攻击
控制问题、一致性问题和网络优化问题
等,对其国内外的发展现状进行了总结
时,原来规则的队形被打乱了,但是在没有外界力量的介入下,一段
和分析;最后,给出了多智能体系统有待
时间之后,这群鱼类又建立了规则的队形聚集在一起运动,如图是
解决的一些问题,以促进对多智能体系
统协调控制理论与应用的进一步研究.
摄影师在南极拍摄到企鹅捕猎前群集鱼类的图片.自然界中的这些
关键词
自组织现象在没有集中中央控制的条件下,是什么样的工作机制,使
多智能体系统;一致性;队形控制;
得内部个体相互感知和交换信息,从而外部表现出规则而有序的智
群集/蜂拥
能行为运动并且这种智能行为是单个个体所不能达到的,因而这
中图分类号
些现象引起了生物学家的兴趣.生物学家试图了解这些自然界生物
文献标志码系统内部的工作机制,期望把这些理论应用到实际的系统中,为一些
新出现的系统,例如交通车辆系统、机器人编队系统、无人飞机或者
水下航行器系统等复杂智能系统提供理论指导.生物学家最初使用
模拟仿真实验的方法,不能在理论上真正揭示这些生物界自组织现
象的本质.
收稿日期?
资助项目教育部高等学校博士学科点专项科
研基金作者简介
苗国英,女,博士,讲师,主要研究方向为
多智能体系统的协调控制..图摄影师在南极拍摄到企鹅捕猎前群集鱼类的图片
南京信息工程大学信息与控制学院,南京,.,
南京理工大学自动化学院,南京,苗国英,等.多智能体系统的协调控制研究综述...
在计算机和工程领域,随着它们的发展,早期的
行研究,可谓欣欣向荣、百花齐放,得到大量颇具价
集中式和分布式计算系统不能处理越来越复杂和规值的研究结果.例如香港城市大学的..
模越来越大的实际问题.世纪年代以后,分布教授和陈关荣教授,香港中文大学的黄捷¨
式人工智能方法出现,能够解决当时的问题,得到了教授,中国科学院的陈翰馥】‘。
教授、郭雷¨教授、程
代展】教授、张纪峰教授和洪奕光教授,北京
迅速的发展.但是这种分布式人工智能有其缺点,就
是低层子系统个体之间的相互作用方式是被高层系
大学的王龙教授,上海交通大学的汪小帆教
统根据任务预先设定好的,采用“自上而下”的分析授,北京航空航天大学的贾英民教授,南开大学
的陈增强¨教授,东南大学的田玉平教授和曹进
方法,因此缺乏灵活性,很难为实际中的复杂大系统
建模.为了克服上述的缺点,美国麻省理工学院的德。
。
教授,南京理工大学的徐胜元教授等.最早提出了智能体的概念,同时把
智能体的概念和相关图论知识
生物界个体社会行为的概念引入到计算机学科领
.智能体的概念
域.这时,生物学和计算机科学领域发生了交叉.所
多智能体系统是由一系列相互作用的智能体构
谓的智能体可以是相应的软件程序,也可以是实物
例如人、车辆、机器人、人造卫星等.成,内部的各个智能体之间通过相互通信、合作、竞
争等方式,完成单个智能体不能完成的,大量而又复
近些年来,由于生物学、计算机科学、人工智能、
杂的工作.多智能体系统有以下特点:
控制科学、社会学等多个学科交叉和渗透发展,多智每个智能体都有独立的决策、计算能力以及
能体系统越来越受到众多学者的广泛关注,已成为
独立的通信能力,但是自身的感知能力又是有限的,
当前控制学科的热点问题.对多智能体系统的研究
只能根据局部邻居的信息作出判断.例如,用一组机
成果日益增多.在《、《器人完成某个地方的地面情况勘察,每个机器人通、、
过自身携带的传感器获取自己周围地面的信息,然、
后把这些信息进行融合,于是这一组机器人获得地等工程和控制学科国际权威期刊上,都
面信息比单个机器人获得的地面信息全面.
有对多智能体系统协调控制最新的研究成果.来自多智能体系统中采用大规模的分布式控制,
众多学科的知名学者,从不同的学科角度研究了多
不会因为个别智能体之间的通信故障,而影响整个
智能体系统的协调控制.据文献的统计,年
多智能体系统的运行,因而具有更好的灵活性和可
月年月在期刊《.
扩展性.例如,现在的互联网就是一个多智能体系上发表的篇文章中,与多智能体
统,不会因为某些路由器的损坏,而影响网络的通
相关的论文达到篇.自年以来,很多国际论
信.这种分布式控制的方式,与集中式控制相比,具
坛和会议都有多智能体系统方面的论文,例如在国
有更强的鲁棒性.在工业成本上来讲,分布式控制的
际会议“”和“
工业成本要小于集中式的工业成本.例如,在工业”中,都有多智能体系统相关
上,往往一些简单而且价格低廉的设备相互协调作
的专题报告.即将于年在南京举办的第届
用,从而取代工业中价格昂贵、结构复杂的大设备,
中国控制会议征稿通知中,把“多智能体系统与分布
大大节省了工业成本.
式控制”作为一个专门的方向进行征稿,可见多智能每个智能体以自己的利益达到最大化为自
体系统备受关注.国内的很多高校及科研院所开展
己的行动和决策准则.当面临决策的时候,每个智能
了多智能体系统课题的深入研究,例如北京大学、清
体都会让自己的利益达到最大化.例如在有限的资
华大学、中国科学院、南开大学、上海交通大学、华中
源下,智能体之间会抢夺有限的资源.
科技大学、东南大学、北京航天航空大学、哈尔滨工
业大学、南京理工大学等.
.图论
众多知名学者致力于多智能体系统的研究,例
现实中的多智能体系统,具有个体的数量多,且
如美国的、.、.
它们之间的相互作用关系复杂,构成一个巨大的网和.¨,新加坡的学者.
络结构.因而,很多学者在研究多智能体系统时,把
它建模成图,再利用现有图论的知识,解决多智能体等.同时,国内的众多学者对多智能体系统进曲未压露葶学报:
自然科学版,,:
:
,:
系统的协调控制的有关问题.
下面就介绍一下基于多智能体系统的图论的相
关知识.为了方便说明图论的知识,假设一个多智能
体系统中含有个智能体,例如用一组机器人完成
某些任务,每个机器人可以看作是一个智能体.用阿
拉伯数字对这组智能体编号,用数字表示指定的
图智能体是全局可达的
第个机器人即第个智能体,用数字表示第.个智能体,同样的用数字表示第个智能体.用,,,,表示智能体的集合.如果第个机多智能体系统的协调控制研究
器人向第个机器人进行信息传递时,用,表示智能体和智能体之间的边,如图所示.
从控制理论的角度来看,由于各智能体之间的
智能体到智能体没有信息的传递,则智能体到合作、竞争、通信等关系能刻画复杂大系统内部的本
智能体不存在边.用,,,,表示
质特性,所以多智能体系统能为复杂大系统提供建
图中所有边的集合.用表示智能体和智模思想,成为前复杂系统理论中一个重要的研究方
能体边上的连接权重.从以上定义可以看出一存向.例如在文献中,在军事上,传统的战争模型
是兰切斯特方程,即用一组微积分方程
在的充分必要条件是智能体和智能体存在边表示的数学模型.这种模型的优点是比较形象且容,,其中,,?
,,,?
.用易操作,而且从方程中可以清楚地看到各种可量化表示这个多智能体系统的加权邻接矩阵,其
中凡表示智能体的个数.用,,表示这个因素和作战损耗的约束关系.缺点是,把战争建模成
一
个确定系统,即对于兰切斯特方程来
多智能体系统对应的图.与第个智能体存在边的智
讲,只要给定了初始条件,解方程得到结果,即战争
能体所成的集合,称为智能体的邻居,表示为
的结局.其实,现实中的战争是一个时刻动态变化而√∈.例如在图中,智能体的邻居是智
又及其复杂的系统,所以用这类数学模型是难以刻
能体.对于智能体,定义智能体的人度为
画的.而对于多智能体系统来讲,智能体之间的协∑,智能体的出度为。
调、合作、竞争等方式,能使智能体获取时刻变化的
信息,能形象地刻画现实系统的内部特性,是采取
∑.当。
时,称加权有向图为“自下而上”的分析方法,能很好地为复杂的大系统
平衡图.有向图的拉普拉斯矩阵定义
提供建模方法,同样也为现实中的战争提供很好的
为?
其中,?
建模方法.,表示智能体的总数,如在图中,为.
随着工业和经济的发展,人们越来越关注各个
从上述拉普拉斯矩阵的定义可以看出,存在一个
智能体之间相互协调合作而不冲突的完成任务,因
零特征根,.当有向图是平衡图时,则
此多智能体系统的协调控制显得非常重要.在多.在有向图中,如果从任何智能体出
智能体系统的协调控制中,基本而又重要的问题是
发,都有一条有向路径到达智能体,称智能体是全
群集问题/、队形问题
局可达的.例如,图中,智能体是全局可达的.和一致性问题.
.多智能体系统的群集问题
多智能体系统的群集问题/是通过智能体之间的相互感知和作
用,产生宏观上的整体同步效应,称作是涌现行为.
例如,前文例子中的蜜蜂筑巢、成群的鱼共同的觅食
图拓扑对应的有向图
和逃避天敌等行为.世纪年代以前,对生物界.的群集现象的研究只局限于根据长期的观察,得到苗国英,等.多智能体系统的协调控制研究综述,.
研究结果.由于计算机技术的发展,推动了对群集现体之间的通信方式,最终使各个智能体的状态满足模型的条规则.例如,在有向切换拓扑和外界
象的深入研究.文献推动了对群集的研究发展.
在年,在文献中基于仿真实验的环境的约束下,文献设计了自适应的群集算法.
方法研究了鸟类个体之间的行为,在仿真实验的时
.多智能体系统的队形问题
候,提出了鸟类在运动的过程中所遵循的条规则
对多智能体系统的队形控制模型:
研究最早起源于生物界?
.人们观察到自然界群居与周围的同伴密切保持在一起,即向飞行的
的捕食者通常是排成一定的队形捕获猎物,某些动
中心靠拢;
物排成一定的队形抵抗攻击,这是达尔文进化论中避免与周围的同伴碰撞,要求各个体之间保
的自然选择的结果,适者生存,自然界中的群居的动
持一定的距离,即避免碰撞;
物采用队形的方式有利于自身的生存.受自然界队与周围的同伴速度保持一致,即速度匹配
形思想的启发,多机器人队形问题、无人飞机编队、.
人造航天器编队和多车辆系统等,引起了国内外学年,等将模型进行了简化,
者的极大兴趣.
提出了一个简单的离散模型来模拟生物界大量粒子
多智能体的队形控制问题是指,一组多智能体
的自治运动.文献只是用计算机进行了模拟自
通过局部的相互作用通信、合作、竞争,使它们在
然界鸟类的运动,而文献是把鸟类运动建模成
运动过程中保持预先指定的几何图形,向指定的目
简单的离散模型称作是模型,其优点是可
标运动,要求每个智能体在运动的过程中,各智能体
以借助数学工具,研究鸟类的运动.在模型中
之间保持一定的距离避免发生碰撞,在运动的道路
假设所有的智能体速度的大小是一样的,第个智
上能绕过障碍物.多智能体系统的队形问题与多智
能体速度更新的方向用下式表示:
能体系统的群集问题的区别是,队形问题要求智能,
体之间在运动的过程中保持预先给定的几何图形.
其中,/
多智能体系统的队形问题在航天、工业、交通和娱乐表示时刻所有智能体速度的平均
等领域都有广泛的应用前景.例如,用一组智能的机
方向,表示噪声干扰.可以看出,式是非线性
器人编成合理的队形,代替士兵在极度恶劣的环境
的算法.
中执行人员搜求救援、侦查和排雷等工作.在航天领模型的提出引起了众多学者的关注.在
域,把人造卫星进行合理的编队,其功能远远超过了年,等将模型的式非线
卫星相加的功能之和.其他如日本的机器人足球比
性算法进行线性化得到如下的算法:
赛等.
多智能体系统的队形控制主要解决的是以下
南、,
问题:
其中,凡表示时刻多智能体系统中个体的总数.各智能体之间如何相互作用,才能生成指定
由于线性化以后,可以用经典的线性系统理论处理
的队形;
多智能体系统的相关问题,促进了多智能体系统的在队形移动的过程中,智能体之间是如何相
发展.等利用图论、矩阵理论和动态系
互作用,才能保持指定队形的;
统理论,给出了文献一致性问题的理论分析,指在运动的过程中,队形中的个体如何才能躲
出了在有界区域内网络拓扑保持联合联通的条件
避障碍物;
下,各智能体位置和速度的运动方向趋于一致.在文当外界环境突然改变时,如何自适应地改变
献中,虽然把大量粒子的自治运动建模成一个
队形或者保持队形,以适应环境.
离散模型,但是处理方法仍然是用仿真实验的方法,
研究多智能体系统的编队控制常用的方法第
而在文献中,利用理论分析的方法,为在本质上
种是基于行为的方法?
揭示多智能体系统群集现象打下了基础.,是由一系列行为控制器组成,每个行
文献和给出了群集的若干问题的研
为都有自己的目标和内部状态,其输入可以是智能
究现状,文献给出了蜂拥控制的研究.目前很多
体自身的信息,也可以是邻居智能体输出的信息,设
学者研究群集问题的时候,主要关注如何设计智能曲荣信盛学学报:
自然科学版,,:
.:
,:
计智能体之间的基本行为,使智能体的整体行为满人排成特定的队形,完成某个地域的地面扫雷工作,
足所期望的队形.这种方法的优点是灵活性、并行性突然一个机器的零件更换导致不能运行,其他的几
个机器人意识到这个突发状况,首先对这种情况达
和实时性好,其缺点是智能体之间局部行为很难设
计满足指定的队形,在设计的局部行为规则下,多智成共同的认识即一致性,然后才能做出决定,调整队
能体系统的稳定性很难保证.第种方法是虚拟结形,继续完成扫雷任务.所以,一致性问题是多智能
体系统协调合作控制问题的一个首要和基本的条
构法,把多智能体系统的队形
看作是一个虚拟结构,每个智能体看作是虚拟结构件,是非常有必要进行研究的.
根据上文的介绍,多智能体系统中的群集问题
上位置固定的一点,当队形移动的时候,每个智能体
和编队控制中,只考虑位置靠拢和速度匹配问题,就
跟踪虚拟结构上对应的固定点即可.第种方法是
势能场的方法,是利用物理学是一致性问题.群集问题和编队问题最后都要化为
多智能体系统的一致性的相关问题.因此,从另外一
上的吸引力和排斥力的概念,即目标对各智能体存
个角度说明了一致性问题是多智能体系统的协调合
在吸引力,障碍物对各智能体存在排斥力,各智能体
作控制的一个基本和首要问题.
在吸引和排斥的合力的最小势能方向运动.有很多
在世纪年代,多智能体系统的一致性问
学者研究队形控制的时候,是上述几种的方法的结
题最早在统计学和管理学中被研究,其借助随机
合.文献和文献给出了多智能体系统队形
分析的工具分析了这一问题.近些年来,由于文献
控制中的若干问题的研究发展现状.和的出现,推动了对多智能体一致性问题
下面给出多智能体系统队形问题的一个应用例
的研究.年,.等建立了研究多智
子.考虑由个机器人组成的动态系统,每个机
能体系统的理论框架.其中考虑每个智能体的连续
器人动态满足方程
动态方程如下:
,?
,,其中和分别是第个机器人的位置和状
其中是第个智能体的状态,是第个智
态输入,目标是使这组机器人排成一定的队形,形成
能体的控制输入.设计智能体之间的算法为
的队形由各个机器人的相对位置表示.假设第个机
器人和第.个之间期望的距离为位置矢量,,即
∑一.在上述算法下,一阶多智能体
?
。
_一,
系统动态达到一致的充分和必要条件是一
其中和_分别表示第个机器人和第个机.同时给出了平均一致的概念,就是使智
器人的位置.设计每个机器人的控制输入为
能体的各个状态最终达到初值状态的平均值,即一:
口一一,.,÷∑,其中是每个智采用梯度算法极小化如下目标即可得各智能体之间
能体的状态.从上述定义可以看出,平均一致的条件
期望的距离,即期望的队形:
要比一致性的条件要强.文献还提出了代数连
通度的概念,即无向图所对应的拉普拉斯矩阵第
_∑一一,
个最小特征根,用代数连通度即数学表达式表示
.多智能体系统的一致性控制
智能体之间的联通情况.研究带有时滞的系统时,最
多智能体系统中的一个基本问题就是一致性
大时滞的最大上界为,其中,即拉问题.一致性问题来源于多智能体系统二
的协调合作控制问题.一致性问题就是如何设计智普拉斯矩阵的最大特征值.
能体局部之间的作用方式,使各智能体根据邻居传
在以上研究成果的基础上,随后大量学者沿着
来的信息,不断调整自己的行为,使所有的智能体的
不同思路和方法对多智能体系统一致性问题进行了
状态随着时间的推移达到共同的值.设计智能体之研究,分别从连续和离散、固定和切换拓扑、带有时
间的通信方式,称作是一致性协议或者是滞和无时滞、有领导者和无领导者等多个方面进行
一
致性算法.为什么说一致性问题是多
研究多智能体系统的一致性问题.下面从多智能体
智能体系统中的一个基本问题例如,用一组机器系统一致性问题备受关注的几个子问题人手,介绍苗国英,等.多智能体系统的协调控制研究综述,.
一
下多智能体系统的发展现状.到多智能体系统的一致性的充分条件.有领导者的多智能体系统的一致性问题以上文献研究的是一个领导者的问题。
在实际
在多智能体系统中,有个别智能体代表着整个的生活中,例如用一组自主的机器人去移除一些对
多智能体系统的共同利益或者是其他智能体跟踪的人类有危害的物质例如一些放射性物质,为了保
目标,把这些智能体称作是领导者,把其他的智能体证这些装有有害物质的机器人按照预先指定的路线
称作是跟随者.带有领导者的多智能体系统的一致搬运到特定的地方,需要另外的一些机器人对它们
性问题,也称作是一致性跟踪问题.
进行约束,即这些机器人称为领导者,装有有害物质,就是通过合适的算法,使得领导者和的机器人称为跟随者.要求设计合适的算法,使跟随
跟随者的最终状态达到一致.这种方法有其缺陷,就者要在领导者形成的凸包里面,这就是多领导者的
一
是当领导者遭到破坏或者是领导者的速度变化过快致性问题,也称作是多智能体系统的包含控制问
导致跟随者跟踪不上时,领导者和跟随者的最终状题.等分别设计
态无法达到一致.
了静止和动态的多个领导者的一致性算法.
在研究带有领导者的一致性问题上,把领导者等考虑的是一阶连续多智能体系统,利用位置的
分为单个领导者和有多个领导者的情况.先介绍一几何中心,分别设计一致性算法,达到静态包含和动
下单个领导者的一致性问题的发展状况.在现实的态包含,用仿真说明了这种算法的有效性.等
系统中,跟随者不能在线得到领导者的速度,这给设研究的是二阶连续系统的多领导者的一致性问题,
计一致性控制算法带来了困难.因此为了设计算法在一致性算法中只利用了位置的信息,利用.
的需要,每个跟随者要估计领导者的速度.函数和图论的知识,给出了多领导者的一致性
等¨对于一阶连续系统,设计了基于局部信息的分
的充分条件.
布式观测器,使每个跟随者能在线估计领导者的速无领导者的多智能体系统一致性问题
在多智能体系统中,如果各智能体的地位和作
度.文献把文献的结果推广到二阶连续多
智能体系统,给出了跟随者和领导者达到一致的充用是平等的,称这样的系统是无领导者的多智能体
分条件.等研究了具有一阶动态的领导者的系统。
无领导者的系统也可以看作是带有领导者的
一
系统,即把其中一个智能体看作是虚拟的领导者就
致性问题,利用盖尔圆定理和图论的知识,给出了
可以了,大量的文献采用了虚拟领导者的方
矩阵:
的特征根具有正实部当且仅当拓扑
法研究了无领导者的问题.通用的一般方法是把其
所对应的有向图中领导者是一个全局可达的节点,
中的一个智能体作为第个智能体,其余的智能体
其中表示拉普拉斯矩阵,一,是一
和第个智能体状态求差值,这样就化成了线性系
个对角矩阵,表示第个跟随者与领导者之间
统的稳定性问题.利用经典的控制理论和图论知识,
有通信时,否则,.等副研究了带有多时
得到一致性的相关条件.等分别考虑了一阶
滞和领导者的二阶多智能体系统一致性问题,给出
离散和连续多智能体系统的一致性问题,给出了拉
了时滞的最大上界和一致性收敛速率的估计.由于
普拉斯矩阵只有一个零特征根和其他特征根分布在
多智能体系统内部元素的相互耦合,导致出现含有
左半平面充要条件是有向图中含有一颗生成树,利
非线性动态的多智能体系统.等研究了非线
用这一结论和相关的数学知识,得到在固定拓扑结
性动态的多智能体系统.等。
加把上述结果推广
构下,一阶离散和连续多智能体系统达到一致当且
到带有领导者的一致性问题上,其中的非线性动态
仅当拓扑对应的有向图中含有一颗生成树.同时,给
是满足局部条件的.考虑的领导者是个非
出了在切换拓扑下,上述多智能体系统的一致性的
线性系统,利用了牵制控制的方法,即选择小部分节
充分条件是联合生成的拓扑对应的有向图中含有一
点进行输入控制使得整个多智能体系统达到一致.
颗生成树.文献中考虑每个智能体动态满足二阶
文献和的非线性动态由于满足
方程:
条件,因此可以化为线性系统进行处理.等是,,
利用非线性系统理论进行处理一致性问题的.
【,
等把文献的结果推广到带有领导者和时滞
其中,,分别表示第个智能体的位
的多智能体系统,利用了模型的分解和相关知识得曲垂学学报:
自然科学版,,:
.:
,:
置、速度和控制输入,给出了经典的一致性算法为上述经典的一致性算法中,各个增益和每个边
上的连接权重是确定的,这样带来了局限性.实际:
一∑一』
中,智能体之间的通信方式在变化时,每条边上的连一,,
接权重是变化的.很多学者对自适应一致性算法很
其中是一个常数.在文献中,指出了固定拓扑
感兴趣.自适应一致性算法分为种,一种是假设每
所对应的有向图中含有一颗生成树,对于二阶连续
条边上的连接权重是变化的,另外一种是假设在经
多智能体系统一致性问题,只是一个必要不充分条
典的一致性算法中每个智能体对应的增益是变化
件,并且用仿真的形式说明了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 体系 协调 控制 研究 综述