多智能体第4章PPT推荐.pptx
- 文档编号:13970810
- 上传时间:2022-10-16
- 格式:PPTX
- 页数:60
- 大小:316KB
多智能体第4章PPT推荐.pptx
《多智能体第4章PPT推荐.pptx》由会员分享,可在线阅读,更多相关《多智能体第4章PPT推荐.pptx(60页珍藏版)》请在冰豆网上搜索。
也就是说,它们相信至少有一种方法使它们的意图得以实现。
Agents不相信它们不能实现它们的意图。
如果我相信意图是不可能实现的而采纳了意图,这样做对我来说是不合理的。
在某种情况下,Agents相信它们将实现它们的意图。
我可能实现我的意图,但失败了,这样对我来说通常是不合理的。
而且,我相信是必然的而可能采用它作为意图,这样做是没有意义的。
实用推理中的意图,4-6,7.Agents不需要知晓它们的意图可能产生的所有副作用。
如果我相信,并且我打算采纳,没有必要再考虑的问题。
最后一个问题被认为是副作用或交易条款问题。
我可能相信去看牙科医生会产生疼痛,但也打算去看牙科医生但这并不意味着我打算遭受痛苦!
实用推理中的意图,4-7,注意:
意图在影响行动方面比单纯的愿望更加强烈:
“我今天下午想打篮球的愿望只会潜在地影响今天下午的活动。
在确定做什么之前,它必然会和其它有关愿望发生竞争反过来,一旦我的意图是下午打篮球,事情就确定了:
一般不需要再继续从多个方面考虑。
等到下午的时候,一般只要继续执行这个意图就可以了。
”(Bratman,1990),规划Agent,4-8,自从七十年代,人工智能规划研究人员就一直密切关注人造Agent的设计。
规划本质上是自动程序设计:
实现某些期望目标的一连串动作设计。
在符号人工智能领域,已经长期假设,人工智能规划系统的形式将是任何人工Agent的重要组成部分。
在Fikes和Nilsson早期工作中,已经提出了很多规划算法,而且规划理论已经很成熟。
但在八十年代中期,Chapman取得了一些理论成果,它表明在任何受时间约束的系统中人工智能规划器将最后变得无法使用。
什么是手段目的推理?
4-9,基本的思想是让Agent拥有:
实现的目标/意图可以采取的动作环境状态然后让Agent产生一个实现目标的规划。
本质上,这是一个自动程序设计过程。
目标/意图/任务,环境状态,可能的动作,规划器,规划实现的目标,4-10,规划,4-11,问题是我们如何表示:
要实现的目标环境状态Agent可以采取的动作自我规划,积木世界,我们将参照积木世界来介绍规划技术。
积木世界包含一个机器手,三个相同尺寸的积木(A,B和C)和一个桌面。
A,4-12,B,C,积木世界存在论,4-13,为了表示这个环境,需要使用谓词如下:
On(x,y)OnTable(x)Clear(x)Holding(x)ArmEmpty,物体x在物体y之上物体x在桌面上物体x上没有东西机器手拿着x机器手为空,积木世界,下面是积木世界的一个表示:
Clear(A)On(A,B)OnTable(B)OnTable(C)这里使用了封闭世界假设,即任何事情没有明显地说明为真,则假设它为假。
4-14,积木世界,目标表示成一阶逻辑公式的集合。
下面是一个目标:
OnTable(A)OnTable(B),OnTable(C),A,4-15,B,C,积木世界,4-16,动作采用STRIPS规划器中已经实现的技术。
每个动作有:
名字可能带有参数前提条件表一些事实的表,动作执行后必须为真删除表一些事实的表,动作执行后不再为真增加表一些通过执行动作变成真的事实表上述每一项中可以包含变量。
积木世界操作者,例1:
当机器手把手中的物体x放在物体y上时,产生stack动作。
Stack(x,y),preClear(y)delClear(y)addArmEmpty,Holding(x)Holding(x)On(x,y),AB,4-17,积木世界操作者,例2:
当机器手从另一个物体y上拿起物体x时,产生unstack动作。
UnStack(x,y),preOn(x,y)delOn(x,y)addHolding(x),Clear(x)ArmEmptyArmEmptyClear(y),Stack和UnStack是相互可逆的动作。
AB,4-18,积木世界操作者,4-19,例3:
当机器手从桌面上拿起物体x时,产生pickup动作。
Pickup(x)preClear(x)OnTable(x)ArmEmptydelOnTable(x)ArmEmptyaddHolding(x)例4:
当机器手把物体x放在桌面上时,产生putdown动作。
Putdown(x),一个规划,I,G,a1,4-20,a17什么是一个规划?
一系列的动作(或动作列表),伴随着变量被常数取代。
a142,STRIPS方法,4-21,原始的STRIPS系统采用目标栈控制它的搜索过程。
这个系统有一个数据库和目标栈,并且集中精力解决最上面的目标(也可以包括随后压入栈的子目标)。
STRIPS系统的基本思想,把目标放入目标栈:
考虑到栈顶是Goal1,把它的子目标也放入栈中:
Goal1,先处理子目标GoaGlSo1a-l2S,1-再2处理其它事情GoalS1-1Goal1,4-22,STRIPS系统的栈操作规则,如果在目标栈的顶部:
混合或单一目标匹配了当前的状态描述混合目标不匹配当前的状态描述,那么执行:
移除它栈中保持原来的混合目标;
以某种新顺序在栈中排列未得到满足的混合目标。
单一目标不匹配当前的状态描述,找到执行后包含这个目标增加表的规则,然后,用执行后的规则替代这个目标;
把规则执行的前提条件公式放到栈顶。
规则,1.从栈中移除它;
2.用规则修改数据库;
什么也没有,3.明确规则(寻求结果)。
停机,注:
在搜索树中存在决策平衡,4-23,实现实用推理Agent,下面是实用推理Agent决策循环过程的结构:
Agent控制循环Version1,4-24,我们不1.讨wh论ile过tr程ue2和3。
2.3.4.5.6.,观察世界;
更新内部模型;
通过慎思决定下一步要实现的意图;
使用手段-目的推理找到这些意图的规划;
执行规划;
7.endwhile,实现实用推理Agent,4-25,问题:
慎思和手段-目的推理过程不是瞬间就可以完成的,需要时间代价。
假设Agent在t0时刻开始慎思,在t1时刻开始手段-目的推理,在t2时刻开始执行规划,慎思的时间是:
tdeliberate=t1t0手段-目的推理的时间是:
tme=t2t1,实现实用推理Agent,4-26,进一步假设:
如果它选择了某个可执行的意图,慎思过程是最佳的,这对Agent来说是最好的事情(最大期望效用)。
所以在时刻t1,Agent已经选择了可能是最佳的可执行的意图。
但是除非tdeliberate很小,否则Agent在决定后将冒着选择的意图不再是最佳的危险。
这就是计算的合理性。
慎思只是问题的一半,Agent仍然必须决定如何执行这个意图。
实现实用推理Agent,4-27,所以,这个Agent将在下面的情况下具有整体优化的行为:
慎思和手段-目的推理过程占用了极短的时间;
或在Agent进行慎思和手段-目的推理过程中,环境一直保持静态,直到Agent完成了慎思和手段-目的推理过程,所要执行的意图和规划的选择是有效的,才说明假设是成立的;
或在t0时刻执行意图是最佳的(这期间世界是可观察的),而且一直保持到时刻t2都是最佳的(这期间Agent找到一系列动作实现了意图)。
实现实用推理Agent,用算法描述如下:
4-28,有关规划的辅助定义,4-29,如果是一个规划,那么,pre()表示的前提条件,并且body(表示的内容。
如果是一个规划,那么,empty()说明规划是一个空序列因此,empty()是一个Boolean值函数。
Execute()是一个过程,它接受单一规划作为输入,并且不间断地执行这个规划执行一个规划意味着依次执行这个规划内容的每个动作。
如果是一个规划,那么,hd()表示由的规划内容的第一个动作组成的规划。
例如的内容是,,,n,那么hd(),的内容只包含动作。
5.如果是一个规划,那么,tail(表示由的规划内容中除了第一个动作以外组成的规划。
例如的内容是,,,n,,n,那么,tail(的内容只包含动作,,。
6.如果是一个规划,I是Int的子集(Int是意图的集合),B是Bel的子集(Bel是信念的集合),那么,sound(,I,B)表示是关于意图I对已知的信念B的正确的规划。
(Lifschitz,1986),慎思,4-30,一个Agent如何慎思?
试图理解所有可能的选项是什么?
在选项中选择,并且对某些做出承诺已选择的选项就是后来的意图。
慎思,4-31,慎思过程可以分为两个明显的部分:
选项的产生Agent产生可供选择事物的集合;
通过函数、优先权表示产生的选项,代表Agent当前的信念和意图,从中确定可供选择事物的集合(期望)。
过滤Agent在竞争的事物中选择,并承诺实现它们。
为了在竞争的事物中选择,Agent采用过滤功能。
慎思,4-32,承诺策略,4-33,在不远的未来某个时间,新的家务机器人给你带来了麻烦。
你说:
“Willie,给我拿瓶啤酒来。
”机器人回答:
“OK,老板”。
20分钟后,你大叫:
“Willie,为什么没有给我拿瓶啤酒来?
”它答到:
“哦,我是要给你拿啤酒来着,但是我决定去做另外的事情了。
”你不高兴地把这个聪明的家伙送回到制造商那里,抱怨它缺少承诺。
经过改型后,Willie回来了,带着“C型:
承诺型助理”的标志牌。
你再一次要求Willie给你拿一瓶啤酒,它再一次答应了,答到:
“一定”。
然后你问到:
“你买了什么牌子的啤酒?
”它回答:
“Genessee”。
你说“没有关系”。
一分钟以后,Willie夹着一瓶Genessee转过来。
这一次,因为过分承诺你生气地退回了Willie。
在做了进一步的整修以后,制造商送回了Willie,保证它的承诺不会再有问题。
因此作为一个可信赖的顾客,你接受了这个糟糕的家伙继续为你做家务。
你想实验一下,要它给你拿来最后一瓶啤酒,Willie再一次答应了,说:
“是,先生”。
(它的态度问题似乎已经改正了)。
机器人拿来啤酒走向你。
走到你跟前,它抬臂、转身、故意打碎了瓶子,然后走开了。
回到工厂,当售后服务询问为什么放弃承诺时,机器人回答,根据它的约定,它保持承诺直到它不再需要当承诺已满足或者不可能实现时,必须放弃。
通过打碎瓶子,承诺就不可能实现了。
承诺策略,4-34,下列承诺策略一般在理性Agnet的文献中讨论:
盲目承诺盲目承诺的Agent将一直维持一个意图,直到它相信这个意图真的已经实现为止。
盲目承诺有时也称为狂热承诺。
专一承诺专一承诺的Agent将一直维持一个意图,直到它相信这个意图真的已经实现,或已经不可能实现为止。
坦率承诺坦率承诺的Agent将维持一个意图,只要它相信这个意图仍然可能实现。
承诺策略,4-35,Agent既对目的承诺(即它希望承诺的状态),又对手段承诺
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能