博弈论习题及参考答案.docx
- 文档编号:25126378
- 上传时间:2023-06-05
- 格式:DOCX
- 页数:19
- 大小:95.56KB
博弈论习题及参考答案.docx
《博弈论习题及参考答案.docx》由会员分享,可在线阅读,更多相关《博弈论习题及参考答案.docx(19页珍藏版)》请在冰豆网上搜索。
博弈论习题及参考答案
《博弈论》习题
一、单项选择题
1、博弈论中,局中人从一个博弈中得到的结果常被称为()。
A、效用B、支付
C、决策D、利润
2、博弈中通常包括下面的内容,除了()。
A、局中人B、占优战略均衡
C、策略D、支付
3、在具有占优战略均衡的囚徒困境博弈中()。
A、只有一个囚徒会坦白B、两个囚徒都没有坦白
C、两个囚徒都会坦白D、任何坦白都被法庭否决了
4、在多次重复的双头博弈中,每一个博弈者努力()。
A、使行业的总利润达到最大B、使另一个博弈者的利润最小
C、使其市场份额最大D、使其利润最大
5、一个博弈中,直接决定局中人支付的因素就是()。
A、策略组合B、策略
C、信息D、行动
6、对博弈中的每一个博弈者而言,无论对手作何选择,其总就是拥有惟一最佳行为,此时的博弈具有()。
A、囚徒困境式的均衡B、一报还一报的均衡
C、占优策略均衡D、激发战略均衡
7、如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A、一报还一报的策略B、激发策略
C、双头策略D、主导企业策略
8、在囚徒困境的博弈中,合作策略会导致( )。
A、博弈双方都获胜B、博弈双方都失败
C、使得先采取行动者获胜D、使得后采取行动者获胜
9、在什么时候,囚徒困境式博弈均衡最可能实现( )。
A、当一个垄断竞争行业就是由一个主导企业控制时
B、当一个寡头行业面对的就是重复博弈时
C、当一个垄断行业被迫重复地与一个寡头行业博弈时
D、当一个寡头行业进行一次博弈时
10、一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略就是一种()。
A、主导策略B、激发策略
C、一报还一报策略D、主导策略
11、关于策略式博弈,正确的说法就是( )。
A、策略式博弈无法刻划动态博弈
B、策略式博弈无法表明行动顺序
C、策略式博弈更容易求解
D、策略式博弈就就是一个支付矩阵
12、下列关于策略的叙述哪个就是错误的():
A、策略就是局中人选择的一套行动计划;
B、参与博弈的每一个局中人都有若干个策略;
C、一个局中人在原博弈中的策略与在子博弈中的策略就是相同的;
D、策略与行动就是两个不同的概念,策略就是行动的规则,而不就是行动本身。
13、囚徒困境说明():
A、双方都独立依照自己的利益行事,则双方不能得到最好的结果;
B、如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡;
C、双方都依照自己的利益行事,结果一方赢,一方输;
D、每个局中人在做决策时,不需考虑对手的反应
14、一个博弈中,直接决定局中人损益的因素就是():
A、策略组合B、策略
C、信息D、行动
15、动态博弈参与者在关于博弈过程的信息方面就是()
A不对称的B对称的
C不确定的D无序的
16、古诺模型体现了寡头企业的()决策模型。
A成本B价格
C产量D质量
17、伯特兰德模型体现了寡头企业()决策模型。
A成本B价格
C产量D质量
18、用囚徒困境来说明两个寡头企业的情况,说明了:
()
A、每个企业在做决策时,不需考虑竞争对手的反应
B、一个企业制定的价格对其它企业没有影响
C、企业为了避免最差的结果,将不能得到更好的结果
D、一个企业制定的产量对其它企业的产量没有影响
19、子博弈精炼纳什均衡():
A、就是一个一般意义上的纳什均衡;
B、与纳什均衡没有什么关系;
C、要求某一策略组合在每一个子博弈上都构成一个纳什均衡;
D、要求某一策略组合在原博弈上都构成一个纳什均衡。
20、在一般产品销售市场上,以下哪种原因导致了逆向选择。
()
A产品质量的不确定性B私人信息
C公共信息D产品价格
21、完全信息动态博弈参与者的行动就是()
A无序的B有先后顺序的
C不确定的D因环境改变的
22、市场交易中普遍存在的讨价还价属于哪种博弈。
()
A完全信息静态博弈B完全信息动态博弈
C不完全信息静态博弈D不完全信息动态博弈
23、下面哪种模型就是一种动态的寡头市场博弈模型()
A古诺模型B伯川德模型
C斯塔克尔伯格模型D田忌齐威王赛马
24、博弈方根据一组选定的概率,在两种或两种以上可能行为中随机选择的策略为()
A纯策略B混合策略
C激发策略D一报还一报策略
25、影响重复博弈均衡结果的主要因素就是()
A博弈重复的次数B信息的完备性
C支付的大小DA与B
26、在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才就是可信的。
A大于B等于
C小于D以上都有可能
二、判断正误并简要说明理由
1、纳什均衡一定就是上策均衡,上策均衡一定就是纳什均衡。
2.在一个博弈中博弈方可以有很多个。
3、在一个博弈中只可能存在一个纳什均衡。
4、因为零与博弈中博弈方之间关系都就是竞争性的、对立的,因此零与博弈就就是非合作博弈。
5、在一个博弈中如果存在多个纳什均衡则不存在上策均衡。
6.由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。
但如果她们打算重复合伙多次,比如说20次,那么对策论预测她们将采取彼此合作的态度,即谁都不招供。
7、在博弈中纳什均衡就是博弈双方能获得的最好结果。
8、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
9、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
10、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,就是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
11、斯塔克博格产量领导者所获得的利润的下限就是古诺均衡下它得到的利润。
12、在有限次重复博弈中,存在最后一次重复正就是破坏重复博弈中局中人利益与行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。
13、子博弈精炼纳什均衡不就是一个纳什均衡。
14、零与博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。
15、原博弈惟一的纳什均衡本身就是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:
采用原博弈的纯战略纳什均衡本身就是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管就是重复有限次还就是无限次,不会与一次性博弈有区别。
16、在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总就是有利的。
三、计算与分析题
1、A、B两企业利用广告进行竞争。
若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。
(1)画出A、B两企业的损益矩阵。
(2)求纯策略纳什均衡。
2、可口可乐与百事可乐(参与者)的价格决策:
双方都可以保持价格不变或者提高价格(策略);博弈的目标与得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局就是:
(1)双方都不涨价,各得利润10单位;
(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;
(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;
(4)双方都涨价,可口可乐利润140,百事可乐利润35;
画出两企业的损益矩阵求纳什均衡。
3、假定某博弈的报酬矩阵如下:
乙
左
右
甲
上
a,b
c,d
下
e,f
g,h
(1)如果(上,左)就是上策均衡,那么,a>?
b>?
g
f>?
(2)如果(上,左)就是纳什均衡,上述哪几个不等式必须满足?
4、北方航空公司与新华航空公司分享了从北京到南方冬天度假胜地的市场。
如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。
如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。
(1)将这一市场用囚徒困境的博弈加以表示。
(2)解释为什么均衡结果可能就是两家公司都选择竞争性策略。
5、博弈的收益矩阵如下表:
乙
左
右
甲
上
a,b
c,d
下
e,f
g,h
(1)如果(上,左)就是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?
(尽量把所有必要的关系式都写出来)
(2)如果(上,左)就是纳什均衡,则
(1)中的关系式哪些必须满足?
(3)如果(上,左)就是上策均衡,那么它就是否必定就是纳什均衡?
为什么?
(4)在什么情况下,纯策略纳什均衡不存在?
6、猪圈里有一头大猪与一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
求
(1)各种情况组合扣除成本后的支付矩阵
(2)求纳什均衡。
7、设啤酒市场上有两家厂商,各自选择就是生产高价啤酒还就是低价啤酒,相应的利润(单位:
万元)由下图的得益矩阵给出:
乙
低价
高价
甲
低价
100,800
50,50
高价
-20,-30
900,600
(1)有哪些结果就是纳什均衡?
(2)两厂商合作的结果就是什么?
8、求出下列博弈的所有纯策略纳什均衡。
局中人2
甲
乙
丙
丁
局中人1
A
2,3
3,2
3,4
0,3
B
4,4
5,2
0,1
1,2
C
3,1
4,1
1,4
10,2
D
3,1
4,1
-1,2
10,1
9、求出下面博弈的纳什均衡(含纯策略与混合策略)。
乙
L
R
甲
U
5,0
0,8
D
2,6
4,5
10、根据两人博弈的损益矩阵回答问题:
乙
左
右
甲
上
2,3
0,0
下
0,0
4,2
(1)写出两人各自的全部策略。
(2)找出该博弈的全部纯策略纳什均衡。
(3)求出该博弈的混合策略纳什均衡。
11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函
数为Q=200-P。
求:
(1)若两个厂商同时决定产量,产量分别就是多少?
(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?
(3)用该案例解释囚徒困境。
12、假设双头垄断企业的成本函数分别为:
市场需求曲线为
其中,
。
(1)求出古诺(Cournot)均衡情况下的产量、价格与利润,求出各自的反应函数,并图示均衡点。
(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格与利润。
(3)说明导致上述两种均衡结果差异的原因。
13、下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果就是什么?
14、两个兄弟分一块冰激凌。
哥哥先提出一个分割比例,弟弟可以接受或拒绝,接受则按哥哥的提议分割,若拒绝就自己提出一个比例。
但这时候冰激凌已化得只剩1/2了,对弟弟提议的比例哥哥也可以接受或拒绝,若接受则按弟弟的建议分割,若拒绝冰激凌会全部化光。
因为兄弟之间不应该做损人不利己的就是,因此我们假设接受与拒绝利益相同时兄弟俩都会接受。
求该博弈的子博弈完美纳什均衡。
15、如果学生在考试之前全面复习,考好的概率为90%,如果学生只复习一部分重点,则有50%的概率考好。
全面复习花费的时间t1=100小时,重点复习之需要花费t2=20小时。
学生的效用函数为:
U=W-2e,其中W就是考试成绩,有高低两种分数Wh与Wl,e为努力学习的时间。
问老师如何才能促使学生全面复习?
16.在下列监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果。
监工
监督
不监督
工人
偷懒
1,-1
-1,2
不偷懒
-2,3
2,2
17.求解下列博弈的纳什均衡。
博弈方2
左
中
右
博弈方1
上
4,3
5,1
6,2
中
2,1
8,4
3,6
下
3,0
12,6
2,9
18.某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关。
假设当律师努力工作(100小时)时有50%的概率能赢,律师不努力工作(10小时)则只有15%的概率能赢。
如果诉讼获胜可得到250万元赔偿,失败则没有赔偿。
因为委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败则律师一分钱也得不到。
如果律师的效用函数为
其中
就是报酬,
就是努力小时数,且律师有机会成本5万元。
求这个博弈的均衡。
四、论述题
1、解释“囚犯困境”,并举商业案例说明。
2、用“小偷与守卫的博弈”说明“激励(监管)悖论”。
《博弈论》习题参考答案
一、单项选择题
1~5B、B、C、D、A、6~10C、A、A、D、C、
11~15、B、C、A、A、C、16~20C、B、C、C、B、
21~26、B、B、C、B、D、A、
二、判断正误并简要说明理由
1、F上策均衡就是比纳什均衡更严格的均衡。
所以上策均衡一定就是纳什均衡,而纳什均衡不一定就是上策均衡,
2、T博弈类型按局中人数多少分为单人博弈、双人博弈与多人博弈
3、F博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡,如性别战。
4、T零与博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之与恒为零,所以双方不存在合作可能性
5、T上策均衡就是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡
6.F只要两囚犯只打算合作有限次,其最优策略均为招供。
比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。
回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。
依此类推,对于有限次内的任何一次,两小偷均不可能合作。
7、F纳什均衡就是上策的集合,指在给定的别人策略情况下,博弈方总就是选择利益相对较大的策略,并不保证结果就是最好的。
8、F局中人总就是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标
9、T纳什均衡就是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益
10、F局中人总就是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标
11、T虽然斯塔格伯格模型各方利润总与小于古诺模型,但就是领导者的利润比古诺模型时高
12、、T无限次重复博弈没有结束重复的确定时间;而在有限次重复博弈中,存在最后一次重复,并且正就是有结束重复的确定时间,使重复博弈无法实现更高效率均衡。
13、F子博弈精炼纳什均衡一定就是一个纳什均衡。
14、F零与博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。
15、T原博弈惟一的纳什均衡本身就是帕雷托效率意义上最佳战略组合,因此不管就是重复有限次还就是无限次,不会与一次性博弈有区别。
16、F动态博弈就是指各博弈方的选择与行动又先后次序的博弈。
动态博弈的信息可以就是不对称的。
所以策略分为先发制人与。
斯塔克伯格博弈揭示“先发制人”更有利,而“后发制人”-----后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地。
三、计算与分析题
1、
(1)
B
做广告
不做广告
A
做广告
20,8
25,2
不做广告
10,12
30,6
(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)。
2、
百事可乐
不涨价
涨价
可口可乐
不涨价
10,10
100,-30
涨价
-20,30
140,35
纳什均衡(不涨价,不涨价),(涨价,涨价)。
从帕累托均衡角度,为(涨价,涨价)
3、
(1)如果(上,左)就是上策均衡,那么,a>eb>d,g
(2)如果(上,左)就是纳什均衡,a>eb>d,不等式必须满足
4、
新华航空
合作
竞争
北方航空
合作
50,50
0,90
竞争
90,0
6,6
5、略
6、
小猪
按
等
大猪
按
5,1
4,4
等
9,-1
0,0
纳什均衡为(按,等)。
7、略
8、纯策略纳什均衡(B,甲),(A,丙)
9、
甲
乙
L
R
U
5,0
0,8
D
2,6
4,5
(1)不存在纯策略纳什均衡
(2)设甲选择“U”的概率为P1,则选择“D”的概率为1-P1
乙选择“L”的概率为P2,则选择“R”的概率为1-P2
对甲而言,最佳策略就是按一定的概率选“上”与“下”,使乙选择“左”与“右”的期望值相等
即P1*8+(1-P1)*0=P1*1+(1-P1)*5
解得P1=5/12
即(5/12,7/12)按5/12概率选“上”、7/12概率选“下”为甲的混合策略Nash均衡
对乙而言,最佳策略就是按一定的概率选“左”与“右”,使乙选择“上”与“下”的期望值相等
即P2*5+(1-P2)*0=P2*2+(1-P2)*4
解得P2=4/7
即(4/7,3/7)按4/7概率选“左”、3/7概率选“右”为乙的混合策略Nash均衡
10、略。
11、见笔记
12、见笔记。
13、
首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B就是相对于T的严格下策。
把博弈方1的B策略消去后又可以发现,博弈方2的策略中C就是相对于R的严格下策,从而也可以消去。
两个博弈方各消去一个策略后的博弈就是如下的两人2×2博弈,已经不存在任何严格下策。
再运用划线或箭头法,很容易发现这个2×2博弈有两个纯策略纳什均衡(M,L)与(T,R)。
由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定。
由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以就是4个纯策略组合中的任何一个。
14、
假设哥的方案就是S1:
1-S1,其中S1就是自己的份额,弟的方案就是S2:
1-S2,S2就是哥的份额,那么可用如下的扩展形表示该博弈:
运用逆推归纳法先分析最后一阶段哥的选择。
由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2≥0,也就就是S2≥0,哥就会接受,否则不会接受。
由于冰激凌的份额不可能就是负数,也就就是说因为哥不接受弟的方案冰激凌会全部化掉,因此任何方案哥都会接受。
现在回到前一阶段弟的选择。
由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到1-S1,显然只要1-S1≥1/2,即S1≤1/2,弟就会接受哥的提议。
再回到第一阶段哥的选择。
哥清楚后两个阶段双方的选择逻辑与结果,因此她在这一阶段选择S1=1/2,正就是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此S1=1/2就是最佳选择。
综上,该博弈的子博弈完美纳什均衡就是:
哥哥开始时就提议按(1/2,1/2)分割,弟弟接受。
15、本题中老师的调控手段高分与低分的差距。
该博弈的扩展形如下:
学生选择全面复习的期望得益就是U1=0、9(Wh-200)+0、1(Wl-200)
重点复习的期望得益就是U2=0、5(Wh-40)+0、5(Wl-40)
只有当U1》U2时学生才会选择全面复习。
根据U1》U2我们可以算出Wh-Wl》400。
这就就是老师能有效全面复习需要满足的条件。
其实在奖学金与成绩挂钩时,Wh-Wl也可以理解成不同等奖学金的差额。
16.没有纯策略均衡,只有混合策略均衡((0、25,0、75),(0、5,0、5))
17.可以根据画线法求得有唯一纯策略均衡(上,左)
18.参见第15题
四、论述题
1、解释“囚犯困境”,并举商业案例说明。
(1)假设条件举例:
两囚徒被指控就是一宗罪案的同案犯。
她们被分别关在不同的牢房无法互通信息。
各囚徒都被要求坦白罪行。
如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。
(2)囚徒困境的策略矩阵表。
每个囚徒都有两种策略:
坦白或不坦白。
表中的数字分别代表囚徒甲与乙的得益。
囚徒乙
坦白
不坦白
囚徒甲
坦白
-5,-5
-1,-10
不坦白
-10,-1
-2,-2
(3)分析:
通过划线法可知:
在囚徒困境这个模型中,纳什均衡就就是双方都“坦白”。
给定甲坦白的情况下,乙的最优策略就是坦白;给定乙坦白的情况下,甲的最优策略也就是坦白。
这里双方都坦白不仅就是纳什均衡,而且就是一个上策均衡,即不论对方如何选择,个人的最优选择就是坦白。
其结果就是双方都坦白。
(4)商业案例:
寡头垄断厂商经常发现它们自己处于一种囚徒的困境。
当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。
但卡特尔协定不就是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果就是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。
2、用“小偷与守卫的博弈”说明“激励(监管)悖论”。
(1)假设条件举例:
偷窃与防止偷窃就是小偷与门卫之间进行博弈的一场游戏。
门卫可以不睡觉,或者睡觉。
小偷可以采取偷、不偷两种策略。
如果小偷知道门卫睡觉,她的最佳选择就就是偷;如果门卫不睡觉,她最好还就是不偷。
对于门卫,如果她知道小偷想偷,她的最佳选择就是不睡觉,如果小偷采取不偷,自己最好去睡觉。
(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):
门卫
睡觉
不睡觉
小偷
偷
1,-1
-2,0
不偷
0,2
0,0
(3)分析:
通过划线法可知:
这个博弈就是没有纳什均衡的。
门卫不睡觉,小偷不偷,双方都没有收益也没有损失;门卫不睡觉,小偷偷
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 习题 参考答案