博弈论 第一章.docx
- 文档编号:3239146
- 上传时间:2022-11-20
- 格式:DOCX
- 页数:21
- 大小:77.67KB
博弈论 第一章.docx
《博弈论 第一章.docx》由会员分享,可在线阅读,更多相关《博弈论 第一章.docx(21页珍藏版)》请在冰豆网上搜索。
博弈论第一章
1完全信息静态博弈
1.0对策论研究的内容与基本形式
对策论研究的内容
对策论研究多个行为主体的决策问题。
对策论研究的形式
博弈(game),由多个行为主体构成的系统。
例
Stackelbergmodel
Cournotmodel
博弈的类型
参与者行动的时间与顺序
同时行动——静态博弈;
先后行动——动态博弈。
参与者的信息多少
信息相同——完全信息;
信息不同——不完全信息。
1.1基本理论:
博弈的标准式和纳什均衡
例1儿童游戏:
“石头、剪刀、布”。
博弈的标准式表示(normal-formrepresentation)
(1)参与人(player).
n个参与人:
1,2,…,i,…,n.
(2)战略(strategy).
一个参与人的战略是他采取的一个行动。
参与人i的战略:
si.
参与人i的战略空间:
Si.
战略的一个组合:
s={s1,s2,…,sn}.
简化表示:
s-i={s1,…,si-1,si+1,…,sn}.
(3)收益(payoff).
参与人i的收益:
ui=ui(s1,s2,…,sn)
n个参与人博弈的标准形式表示:
G={S1,S2,…,Sn;u1,u2,…,un}
完全信息(completeinformation):
每个参与人知道其他人的战略空间和收益。
静态博弈(staticgame):
所有的参与人同时行动。
每个人行动时,不知道其他人的行动。
例1(续):
博弈{石头、剪刀、布}的描述:
参与人:
1,2。
战略空间:
S1=S2={石头、剪刀、布}
收益:
两人出手的函数
u1(石头,石头)=0,u1(石头,剪刀)=1,u1(石头,布)=-1
…
u2(石头,石头)=0,u2(石头,剪刀)=-1,u2(石头,布)=1
……
收益表:
两个参与人,有限个战略的博弈的表示方法。
P2
石头剪刀布
石头0,01,-1-1,1
P1剪刀-1,10,01,-1
布1,-1-1,10,0
博弈的问题:
能否知道每个参与人选择的战略?
例2:
囚徒困境(ThePrisoner’sDilemma)
囚徒2
沉默招认
沉默-1,-1-9,0
囚徒1
招认0,-9-6,-6
囚徒1的考虑:
无论对方选沉默还是招认,自己选“招认”好于“沉默”。
囚徒2的考虑:
无论对方选什么,“招认”好于“沉默”。
两人的选择:
(招认,招认)。
定义:
si是si的严格劣势战略(strictlydominated),如果:
ui(si,s-i)ui(si,s-i)
“沉默”是“招认”的严格劣战略
例3:
参与人2
左中右
上1,01,33,0
参与人1中0,20,16,0
下0,22,45,3
参与人1:
没有严格劣战略。
参与人2:
“右”严格劣于“中”
考虑:
重复剔除严格劣战略(iteratedeliminationofstrictlydominatedstrategies)
可预见的两人选择:
(下,中)。
例4:
图1.1.4
参与人2
左中右
上0,44,05,3
参与人1中4,00,45,3
下3,53,56,6
两人都没有严格劣战略。
两人会如何选择各自的战略?
定义:
s*=(s1*,…,sn*)是一个纳什均衡(Nashequilibrium),如果
ui(si*,s-i*)ui(si,s-i*)
纳什均衡为最大化问题的解
ui=ui(s1*,…,si,…,sn*)
各例中的纳什均衡:
囚徒困境:
(招认,招认)
例3:
(下,中)
例4(图1.1.4):
(下,右).
纳什均衡与重复剔除严格劣势战略的关系:
没有被剔除的唯一的战略组合是纳什均衡.
如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.
多个纳什均衡
例5性别战(thebattleoftheSexes)
帕特
歌剧拳击
歌剧2,10,0
克里斯
拳击0,01,2
纳什均衡:
(歌剧,歌剧),(拳击,拳击)
1.2应用
例古诺双头垄断模型(CournotModelofDuopoly)
二个企业,生产产量:
q1,q2
市场需求:
P=a–Q,Q=q1+q2
企业成本:
Ci(qi)=cqi,i=1,2.
企业利润:
i(q1,q2)=Pqi–Ci(qi)=(a–(q1+q2))qi–cqi,
博弈的描述:
参与人:
企业1,企业2
战略:
产量qi
收益:
i(q1,q2)
企业i选择产量求
i(si,,sj*):
一阶条件
=a–c–2q1–q2*=0
和
=a–c–q1*–2q2=0
厂商选择自己利润最大的产量
q1=
q2=
解纳什均衡得
q1*=q2*=
利润
π1=π2=(a–c–(
+
))
=
当ui是可微分的时候,纳什均衡为下列方程组的的解:
=0,i=1,…,n
思考:
用重复剔除严格劣势战略求纳什均衡
比较:
如果两个厂商生产
q1=q2=
利润
π1=π2=(a–c–(
+
))
=
例贝特兰德双头垄断模型(BertrandModelofDuopoly)
两个企业生产有差别的商品。
消费者对企业i的需求
qi(pi,pj)=a–pi+bpj,
成本:
Ci(qi)=cqi,i=1,2.
战略si:
pi0
收益:
i(pi,pj)=(a–pi+bpj)(pi–c)
纳什均衡(p1*,p2*)满足
maxi(pi,pj*)=max(a–pi+bpj*)(pi–c)
解得p1*=p2*=
例最后要价仲裁(Final-offerArbitration)
一个企业和一个工会,通过一个仲裁人决定工资。
企业和工会同时提出工资:
wf,wu
仲裁人有一个标准:
x,选择双方提议中比较靠近x的提议:
如果x<(wf+wu)/2,则wf
如果x>(wf+wu)/2,则wu
wf(wf+wu)/2xwu
企业和工会不知道x,但知道x的分布函数F(x)和密度函数f(x)。
分析
wf被选择的概率:
Prob{x<
}=F
wu被选择的概率:
Prob{x>
}=1–F
期望工资
Ew=wfF
+wu1–F
wf*满足
wfF
+wu*1–F
wu*满足
wf*F
+wu1–F
由一阶条件
F
+
wff
-
wuf
=0
wff
+1-F
-
wuf
=0
由此解出工资的均衡提议。
两式相减
F
=
两式相加
wu*f
–wf*f
=1
如果x为正态分布:
x~N(m,2)
=m
wu*–wf*=
=
纳什均衡
wu*=m+
wf*=m–
例公共财产问题
一个村庄,有n个村民,在公共草地上放羊。
村民i放牧的羊数:
gi
全村的羊总数:
G=g1+...+gn
养一只羊的(私人)成本为c,一只羊的价值为v(G)
当G
当G>Gmax,v(G)=0
每个村民选择养羊数量使自己收益最大
giv(G)–cgi
一阶条件
v(G)+giv'(G)–c=0,i=1,...,n
将n个等式相加得到
nv(G)+Gv'(G)–nc=0
即纳什均衡G1满足
v(G1)+
v'(G1)–c=0
全村在总收益最大的放牧数G2满足
maxG2v(G2)–cG2
一阶条件
v(G2)+G2v'(G2)–c=0
G1与G2哪一个大?
G1大
v
v(G)
OGmaxG
Gv'(G)/n
v'(G)
Gv'(G)
决策问题:
在条件变差时,收益上升还是下降?
在通常的(一人)决策中,如果有几个选择,决策者选择收益最大的一个。
如果外界条件改变,使他的一个或几个收益下降,则它无论怎样选择,都不会使收益比原来更大。
例在一块田里选择种植的(纯)收入:
棉花3000元
花生3700元
玉米3500元
如果成本上升,收入变为
棉花3000元
花生3200元
玉米3400元
人决策收益通常下降
例在多人决策时的收益下降与增加
(1)初始时
参与人2
T1T2
S15,48,3
参与人1
S24,36,5
均衡为(S1,T1),参与人1的收益为5。
(2)外界条件使参与人1在选择S1时的收益下降
参与人2
T1T2
S13,45,2
参与人1
S24,36,5
均衡变为(S2,T2)
参与人1的收益为6。
多人决策时,收益可能上升。
1.3混合战略和均衡的存在
例1儿童游戏:
“石头、剪刀、布”
不存在纳什均衡。
如何选择战略?
例6猜硬币(MatchingPennies)
参与人2
正面反面
正面-1,11,-1
参与人1
反面1,-1-1,1
也不存在纳什均衡。
将原来的战略sik称为纯战略(purestrategy)。
战略空间Si=(si1,…,siK)。
混合战略(mixedstrategy):
战略空间Si的概率分布:
pi=(pi1,…,piK).
——由参与人选定。
(参与者在可选行动中所有行动的一个概率分布)
收益:
vi(p1,…,pn)=k(jpjk)ui(s1,…,sn)
=Eui(s1,…,sn)
——由概率计算的期望值。
较简单的情形:
二个参与人
S1={s11,…,s1J},S2={s21,…,s2K}
收益:
v1(p1,p2)=
p1jp2ku1(s1j,s2k)
猜硬币的收益:
如果p1=(
),p2=(
),则
v1=–
×
+
×
+
×
–
×
=-1/6
v2=
×
–
×
–
×
+
×
=1/6
任意的混合战略,p1=(p,1-p),p2=(q,1-q),则
v1(p1,p2)=pq(-1)+p(1-q)+(1-p)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 第一章