博弈论复习题及答案Word文档格式.docx
- 文档编号:13177779
- 上传时间:2022-10-07
- 格式:DOCX
- 页数:28
- 大小:305.13KB
博弈论复习题及答案Word文档格式.docx
《博弈论复习题及答案Word文档格式.docx》由会员分享,可在线阅读,更多相关《博弈论复习题及答案Word文档格式.docx(28页珍藏版)》请在冰豆网上搜索。
11、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
12、上策均衡是帕累托最优的均衡。
13、因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
14、在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。
)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:
在斯塔克伯格模型中,企业就可能具有先动优势。
15、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
16、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
17、不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。
18、多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:
两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。
19、如果阶段博弈G={A1,A2,…,An;
u1,u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t<
T,在t阶段的结局并不是G的Nash均衡。
(√)(或:
如果阶段博弈G={A1,A2,…,An;
u1,u2,…,un)具有多重Nash均衡,那么该重复博弈G(T)的子博弈完美均衡结局,对于任意的t<
T,在t阶段的结局一定是G的Nash均衡。
20、零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。
零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。
))
21、原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:
采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。
22、原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。
原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。
23、根据参与人行动的先后顺序,博弈可以划分为静态博弈(staticgame)和动态博弈(dynamicgame)。
24、如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:
在每一阶段取G的Nash均衡策略。
四、名词解释(每小题3分,共15分)
参与人(player):
指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体;
策略(strategy):
是参与人选择行动的规则,如“以牙还牙”是一种策略;
信息(information):
是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;
支付(payoff)函数:
是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西;
结果(outcome):
是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;
均衡(equilibrium):
是所有参与人的最优策略或行动的组合。
静态博弈:
指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;
动态博弈:
指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈:
就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
零和博弈:
也称“严格竞争博弈”。
博弈方之间利益始终对立,偏好通常不同
完全信息静态博弈:
即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。
上策:
不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略
上策均衡:
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果
严格下策:
不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略
合作博弈
纳什均衡:
二、计算与分析题(每小题15分,共45分)
1、无限次重复博弈与有限重复博弈的区别:
无限次重复博弈没有结束重复的确定时间。
在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。
无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。
无限次重复博弈与有限次重复博弈的共同点:
试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。
2、可口可乐与百事可乐(参与者)的价格决策:
双方都可以保持价格不变或者提高价格(策略);
博弈的目标和得失情况体现为利润的多少(收益);
利润的大小取决于双方的策略组合(收益函数);
博弈有四种策略组合,其结局是
(1)如果双方都不涨价,各得利润10单位;
(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;
(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;
(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;
求纳什均衡。
博弈的稳定状态有两个:
都不涨价或者都涨价(均衡),均衡称为博弈的解。
3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;
都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;
若同时到,大猪吃7个单位,小猪吃3个单位;
若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):
小猪
按 等待
大猪 按5,1 4,4
等待9,-1 0,0
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。
即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。
这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。
所以纳什均衡是(大猪按,小猪等待)。
4、根据两人博弈的支付矩阵回答问题:
a
b
A
2,3
0,0
B
4,2
(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)
(2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。
(3)求出该博弈的混合策略纳什均衡。
(7分)
(1)策略
甲:
A B
乙:
a b
博弈树 (草图如下:
(2)PureNE(A,a);
(B,b)
都是Pareto有效,仅(B,b)是K-H有效。
(3)MixedNE((2/5,3/5);
(2/3,1/3))
5、用反应函数法求出下列博弈的所有纯战略纳什均衡。
参与人2
c
d
3,2
3,4
0,3
参与人1
4,4
5,2
0,1
1,2
C
3,1
4,1
1,4
10,2
D
-1,2
10,1
解答:
纯策略纳什均衡为(B,a)与(A,c)
分析过程:
设两个参与人的行动分别为,
player1的反应函数
player2的反应函数
交点为(B,a)与(A,c),因此纯策略纳什均衡为(B,a)与(A,c)。
6、(entrydeterrence市场威慑)考虑下面一个动态博弈:
首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。
在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。
.进入者
在位者
进入
不进入
默许
斗争
(20,30)
(-10,0)
(0,100)
进入者
(-10,25)
(10,20)
左图:
温柔型右图:
残酷型
(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡(12分)
(2)已有企业为温柔型的概率至少多少时,新企业才愿意进入(8分)
(1)温柔 NE(in,accommodate)和 (out,fight)。
SPNE为(in,accommodate)
残酷 NE(out,fight).SPNE同理
(2)
8、博弈方1和博弈方2就如何分10,000元钱进行讨价还价。
假设确定了以下规则:
双方同时提出自己要求的数额A和B,0≤A,B≤10,000。
如果A+B≤10,000,则两博弈方的要求得到满足,即分别得A和B,但如果A+B>
10,000,则该笔钱就没收。
问该博弈的纳什均衡是什么?
如果你是其中一个博弈方,你会选择什么数额?
为什么?
答十、纳什均衡有无数个。
最可能的结果是(5000,5000)这个聚点均衡。
9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。
如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。
如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。
(1)将这一市场用囚徒困境的博弈加以表示。
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
答:
(1)用囚徒困境的博弈表示如下表:
北方航空公司
合作
竞争
新华航空公司
500000,500000
0,900000
900000,0
60000,60000
(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>
0);
若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>
500000)。
若北方航空公司选择竞争,新华航空公司也将选择竞争(6000
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 复习题 答案