博弈论(对策论)扩展-完全信息静态博弈.ppt
- 文档编号:2695184
- 上传时间:2022-11-07
- 格式:PPT
- 页数:30
- 大小:248KB
博弈论(对策论)扩展-完全信息静态博弈.ppt
《博弈论(对策论)扩展-完全信息静态博弈.ppt》由会员分享,可在线阅读,更多相关《博弈论(对策论)扩展-完全信息静态博弈.ppt(30页珍藏版)》请在冰豆网上搜索。
1博弈论博弈论(对策论对策论)扩展扩展完全信息静态博弈完全信息静态博弈2参考书1.谢识予,经济博弈论,复旦大学出版社2.施锡荃,博弈论3.张维迎,博弈论与信息经济学,上海人民出版社4.吉本斯,博弈论基础,中国社会科学出版社3引言:
引言:
19941994年诺贝尔经济学奖授予了三位博弈论专家年诺贝尔经济学奖授予了三位博弈论专家纳什、泽纳什、泽纳什、泽纳什、泽尔腾尔腾尔腾尔腾和和海萨尼海萨尼海萨尼海萨尼。
19961996年诺奖授予两位博弈论与信息经济学研究专家莫里年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞;斯、维克瑞;20012001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。
理论研究中的开创性贡献。
20052005年诺奖授予年诺奖授予有以色列和美国双重国籍的罗伯特有以色列和美国双重国籍的罗伯特奥曼奥曼和美国人托马斯和美国人托马斯谢林,以表彰他们在博弈论领域作谢林,以表彰他们在博弈论领域作出的贡献。
出的贡献。
20122012年诺奖授予美国经济学家埃尔文年诺奖授予美国经济学家埃尔文.罗斯罗斯(Alvin(AlvinRoth)Roth)与罗伊德与罗伊德.沙普利沙普利(Lloyd(LloydShapley)(Shapley)(稳定配置稳定配置和市场设计实践理论和市场设计实践理论)4博弈的分类博弈的分类根据参与人的多少,可将博弈分为两人博弈或多人博弈;根据参与人是否合作,可将博弈分为合作博弈或非合作博弈;根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈。
51、从行动的先后次序来分,博弈可以分为静态博弈和动态博弈。
静态博弈指在博弈中,参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动;动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动的博弈。
62、从参与人对其他参与人的各种特征信息的获得差异来分,博弈可分为完全信息博弈和不完全信息博弈。
完全信息指的是每一个参与人对所有其他参与人的特征,如策略集合及得益函数都有准确完备的知识;否则就是不完全信息。
将上述两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:
完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。
7行动次序信息静态动态完全信息纳什均衡纳什纳什子博弈精练纳什均衡泽尔腾泽尔腾不完全信息贝叶斯均衡海萨尼海萨尼精炼贝叶斯均衡泽尔腾等泽尔腾等博弈的分类和均衡博弈的分类和均衡8完全信息静态博弈完全信息静态博弈
(一)完全信息静态博弈定义所谓完全信息静态博弈指的是各博弈方同时决策,或者决策行动虽有先后,但后行动者不知道先行动者的具体行动是什么,且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。
9纳什均衡纳什均衡1、占优策略均衡。
一般来说,由于每个参与人的得益是博弈中所有参与人的策略的函数,因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。
但在一些特殊的博弈中,一个参与人的最优策略可能可以不依赖于其他参与人的策略选择,就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为“占优策略”。
如果一个博弈中,某个参与人有占优策略,那么该参与人的其他可选择策略就被称为“劣策略”。
10在在一一个个博博弈弈里里,如如果果所所有有参参与与人人都都有有占占优优策策略略存存在在,那那么么占占优优策策略略均均衡衡是是可可以以预预测测到到的的唯唯一一的的均均衡衡,因因为为没没有有一一个个理理性性的的参参与与人人会会选选择择劣劣策策略略。
所所以以在在囚囚徒徒困困境境博博弈弈里里,坦坦白白,坦坦白白是是占占优优策策略略均均衡衡。
囚囚徒徒困困境境反反映映了了一一个个深深刻刻的的问问题题,即即个个人人理理性性与与团团体体理理性性的的冲冲突突。
这这给给我我们们一一个个启启示示,我我们们学学习习博博弈弈论论,也也许许更更应应该该研研究究的的是是怎怎样样设设计计一一种种制制度度,在在满满足足个个人人理理性性的的同同时时,去去争争取取达达到到“集集体体理理性性”。
1122、严格劣策略的重复剔除、严格劣策略的重复剔除重复剔除严格劣策略”的思路如下:
首先找出某个参与人的严格劣策略(假定其存在),把这个劣策略剔除掉,重新构造一个不包含已剔除策略的新的博弈;重复这个过程,一直到只剩下一个唯一的策略组合为止。
这个唯一剩下的策略组合就是这个博弈的均衡解,称为”重复剔除的占优均衡”。
注意,上述表述中强调了“唯一”这个词。
也就是说,如果重复剔除后剩下的策略组合不唯一,那么该博弈就不是可通过重复剔除劣策略求解的。
1233纳什均衡纳什均衡纳什均衡是完全信息静态博弈解的一般概念,构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略,即没有任何一个策略严格优于纳什均衡策略。
当然,逆定理是不存在的。
更为重要的是,许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,也存在纳什均衡。
下面,我们给出纳什均衡的正式定义。
13纳什均衡的正式定义纳什均衡的正式定义纳什均衡:
有n个参与人的战略式表述博弈GS1,Sn;u1,,un,战略组合S*(S1*,Sn*)是一个纳什均衡,如果对于每一个i,Si*是给定其他参与人Si*(S1*,,S-1*,Si+1*,Sn*)的情况下第i个参与人的最优战略,即:
ui(si*,s-i*)ui(si,s-i*)对任意SiSi,和任意的I都成立。
14指一组给定对手行为前提下对各指一组给定对手行为前提下对各博弈方存在的最佳选择;在纳什博弈方存在的最佳选择;在纳什均衡状态下,只要其它参与者不均衡状态下,只要其它参与者不变换策略选择,任何单个参与者变换策略选择,任何单个参与者不可能单方面通过变换策略来提不可能单方面通过变换策略来提高他的所获支付。
高他的所获支付。
15古诺的寡头模型寡头产量竞争以两厂商产量竞争为例222126qqqq-=16古诺模型的反应函数(3,0)(6,0)(0,3)(0,6)古诺模型的反应函数图示理性局限和古诺调整17伯特兰德(Bortrand)寡头模型价格竞争寡头的博弈模型价格竞争寡头的博弈模型异质产品异质产品18公共资源问题公共草地养羊问题以三农户为例n=3,c=419合作:
总体利益最大化合作:
总体利益最大化竞争:
个体利益最大化竞争:
个体利益最大化20纳什均衡的多重性纳什均衡的多重性在两人的有限策略博弈中,我们还可以简单地用划线法来找出纳什均衡在位者进入者默许打击进入40,50-10,0不进入0,3000,300从这个例子中我们知道一个博弈可能有多个纳什均衡,而具体哪个均衡会实现,纳什均衡本身不能给出回答,任何有限博弈都存在至少一个纳什均衡,若是无限博弈则不一定。
21多重均衡博弈和混合策略夫妻之争2,10,00,01,2时装足球时装足球丈丈夫夫妻妻子子夫妻之争夫妻之争rq111/32/3(r,1-r):
妻子的混合策略概率分布(q,1-q):
丈夫的混合策略概率分布两个纯均衡策略,一个混合策略22猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方猜硬币方正面反面猜硬币博弈猜硬币博弈盖盖硬硬币币方方rq111/21/2(r,1-r):
盖硬币方选择正反面的混合策略概率分布(q,1-q):
猜硬币方选择正反面的混合策略概率分布23纳什均衡的存在性纳什定理纳什定理:
在一个由n个博弈方的博弈中,如果n是有限的,且都是有限集(对),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。
两人两策略时,均衡为1个(纯或混合)或3个(2纯,1混合)24多重纳什均衡博弈的分析两个以上均衡,确认最优均衡的问题,原则:
n帕累托上策均衡n风险上策均衡n聚点均衡n相关均衡25一、帕累托上策均衡(鹰鸽博弈)这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。
-5,-5-10,88,-1010,10战争和平国家国家2战争和平国国家家1战争与和平战争与和平26二、风险上策均衡考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:
风险上策均衡。
下面就是两个例子。
9,98,00,87,7LR博弈方博弈方2UD博博弈弈方方1风险上策均衡(风险上策均衡(D,R)5,53,00,33,3鹿兔子猎人猎人2鹿兔子猎猎人人1猎鹿博弈风险上策均衡(兔子,兔子)风险上策均衡(兔子,兔子)27三、聚点均衡n利用博弈设定以外的信息和依据选择的均衡n文化、习惯或者其他各种特征都可能是聚点均衡的依据n城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子28四、相关均衡5,14,40,01,5LR博弈方博弈方2UD博博弈弈方方1相关均衡例子相关均衡例子三个纳什均衡三个纳什均衡:
(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)结果都不理想,不如(D,L)。
可利用聚点均衡(天气,抛硬天气,抛硬币)币),但仍不理想。
相关装置:
1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。
29一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:
(U,L,A)、(D,R,B)前者帕累托优于后者。
博弈的结果会是什么呢?
(U,L,A)有共谋(Coalition)问题:
博弈方1和2同时偏离。
而(D,R,B)0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3B共谋和防共谋均衡防共谋最优。
30防共谋均衡如果一个博弈的某个策略组合满足下列要求:
(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;
(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。
称为“防共谋均衡”。
前面例子中:
(D,R,B)是防共谋均衡(U,L,A)不是防共谋均衡
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 策论 扩展 完全 信息 静态 博弈