博弈论第一章.docx
- 文档编号:25325609
- 上传时间:2023-06-07
- 格式:DOCX
- 页数:60
- 大小:160.20KB
博弈论第一章.docx
《博弈论第一章.docx》由会员分享,可在线阅读,更多相关《博弈论第一章.docx(60页珍藏版)》请在冰豆网上搜索。
博弈论第一章
1完整信息静态博弈
1.0对策论研究的内容与根本形式
对策论研究的内容
对策论研究多个行为主体的决议问题。
对策论研究的形式
博弈(game),由多个行为主体组成的系统。
例
Stackelbergmodel
Cournotmodel
博弈的种类
参加者行动的时间与次序
同时行动——静态博弈;
先后行动——动向博弈。
参加者的信息多少
信息同样——完整信息;
信息不一样——不完整信息。
1.1根本理论:
博弈的标准式和纳什平衡
例1少儿游戏:
“石头、剪刀、布〞。
博弈的准式表示(normal-formrepresentation)
(1)参加人(player).
n个参加人:
1,2,⋯,i,⋯,n.
(2)略(strategy).
一个参加人的略是他采纳的一个行。
参加人i的略:
si.
参加人i的略空:
Si.
略的一个合:
s={s1,s2,⋯,sn}.
化表示:
s-i={s1,⋯,si-1,si+1,⋯,sn}.
(3)利润(payoff).
参加人i的利润:
ui=ui(s1,s2,⋯,sn)
n个参加人博弈的准形式表示:
G={S1,S2,⋯S,n;u1,u2,⋯u,n}
完整信息(completeinformation):
每个参加人知道其余人的略空和利润。
静博弈(staticgame):
全部的参加人同行。
每一个人行,不知道其余人的行。
例1〔〕:
博弈{石、剪刀、布}的描绘:
参加人:
1,2。
略空:
S1=S2={石、剪刀、布}
利润:
两人出手的函数
u1(石,石)=0,u1(石,剪刀)=1,u1(石,布)=-1
⋯
u2(石,石)=0,u2(石,剪刀)=-1,u2(石,布)=1
⋯⋯
利润表:
两个参加人,有限个略的博弈的表示方法。
P2
石头剪刀布
石头
0,0
1,-1
-1,1
P剪刀
-1,1
0,0
1,-1
1
布
1,-1
-1,1
0,0
博弈的:
可否知道每个参加人的略?
例2:
囚犯窘境(ThePrisoner’sDilemma)
囚犯2
缄默招认
缄默
-1,-1
-9,0
囚犯1
招认
0,-9
-6,-6
囚犯1的考:
无方缄默是招,自己“招〞好于“缄默〞。
囚犯2的考:
无方什么,“招〞好于“缄默〞。
两人的:
(招,招)。
定:
si是si的格劣略〔strictlydominated〕,假如:
ui(si,s-i)ui(si,s-i)
“缄默〞是“招认〞的严格劣战略
例3:
参加人2
左中右
上
1,0
1,3
3,0
参加人1中0,20,16,0
下
0,
2
2,
4
5,
3
参加人1:
没有严格劣战略。
参加人2:
“右〞严格劣于“中〞
考虑:
重复剔除严格劣战略(iteratedeliminationofstrictlydominated
strategies)
可预示的两人选择:
(下,中)。
例4:
图
参加人2
左中右
上
0,4
4,0
5,3
参加人1中4,00,45,3
下3,53,56,6
两人都没有格劣略。
两人会如何各自的略?
定:
s*=(s1,⋯,n
是一个什平衡
(Nashequilibrium),
假如
*
s*)
ui(si*,s-i*)
ui(si,s-i*)
什平衡最大化的解
maxui=ui(s1*,⋯s,i,⋯s,n*)
siSi
各例中的什平衡:
囚犯窘境:
〔招,招〕
例3:
〔下,中〕
例4〔1.1.4〕:
(下,右).
什平衡与重复剔除格劣略的关系:
没有被剔除的独一的略合是什平衡.
假如略是一个什平衡,它在重复剔除格劣略后留下.
多个什平衡
例5性(thebattleoftheSexes)
帕特
歌剧拳击
歌剧
2,1
0,0
克里斯
拳击
0,0
1,2
纳什平衡:
(歌剧,歌剧),(拳击,拳击)
1.2应用
例古诺双头垄断模型〔CournotModelofDuopoly〕
二个公司,生产产量:
q12
q
市场需求:
P=a–Q,
Q=q1
2
+q
公司本钱:
Cii
i
(q)=cq,i=1,2.
公司利润:
i(q1,q2)=Pqi–Ci(qi)=(a–(q1+q2))qi–cqi,
博弈的描绘:
参加人:
公司1,公司2
战略:
产量qi
利润:
i(q1,q2)
公司i选择产量求
max
(s,,s*):
iij
siSi
一阶条件
d1=a–c–2q1–q2*=0
dq1
和
d2=a–c–q1*–2q2=0
dq2
厂商选择自己利润最大的产量
q1=acq2
q2=acq1
2
2
解纳什平衡得
q1*=q2*=ac
3
利
π1=π2=(a–c–(ac+ac))ac=(ac)2
3339
当ui是可微分的候,什平衡以下方程的的解:
ui(s1,s2
...,sn)=0,i=1,⋯n,
si
思虑:
用重复剔除格劣略求什平衡
比:
假如两个厂商生
q1=q2=ac
4
利
2
π1=π2=(a–c–(ac+ac))ac=(ac)
4448
例特德双断模型〔BertrandModelofDuopoly〕
两个企生有差的商品。
消者企i的需求
qi(pi,pj)=a–pi+bpj,
本钱:
Ci(qi)=cqi,i=1,2.
略si:
pi0
利润:
i(pi,pj)=(a–pi+bpj)(pi–c)
什平衡(p1
2
足
*,p*)
max
i(pi,pj*)
=max(a–pi+bpj*)(pi–c)
解得p1
2
a
c
*=p*=
2
b
例最后要价仲裁(Final-offerArbitration)
一个公司和一个工会,经过一个仲裁员决定薪资。
公司和工会同时提出薪资:
wf,wu
仲裁员有一个标准:
x,选择两方建议中比较凑近x的建议:
假如x<(wf+wu)/2,那么wf
假如x>(wf+wu)/2,那么wu
wf(wf+wu)/2xwu
公司和工会不知道x,但知道x
的散布函数F(x)和密度函数f(x)。
剖析
wf被选择的概率:
Prob{x 2 wu }=Fwf 2 wu wu被选择的概率: Prob{x>wf 2 wu}=1–F wf wu 2 希望薪资 Ew=wfF wf wu +wu1–F wf wu 2 2 wf* 知足 min wfF wf wu* +wu* 1–F wf wu* wf 2 2 wu* 知足 max wf*F w*f wu+wu 1–F w*f wu wu 2 2 由一阶条件 F wfwu +1wff wf wu-1wuf wfwu=0 2 2 2 2 2 1wff wfwu +1-Fwf wu-1wuf wfwu=0 2 2 2 2 2 由此解出薪资的平衡建议。 两式相减 F wf wu =1 2 2 两式相加 u wf wu f wf wu =1 w*f 2 –w*f 2 假如x 为正态散布: x~N(m, 2) w*f wu* =m 2 wu*–wf*=1 =2 2, f(m) 纳什平衡 wu*=m+2/2,wf*=m–2/2 例公共财富问题 一个乡村,有n个村民,在公共草地上放羊。 村民i放牧的羊数: gi 全村的羊总数: G=g1+...+gn 养一只羊的(个人)本钱为c,一只羊的价值为v(G) 当G 当G>Gmax,v(G)=0 每个村民选择养羊数目使自己利润最大 giv(G)–cgi 一阶条件 v(G)+giv'(G)–c=0,i=1,...,n 将n个等式相加获得 nv(G)+Gv'(G)–nc=0 即纳什平衡G1知足 v(G1)+G1v'(G1)–c=0 n 全村在总利润最大的放牧数G2知足 maxG2v(G2)–cG2 一阶条件 v(G2)+G2v'(G2)–c=0 G1与G2哪一个大? G1大 v v(G) OGmaxG Gv'(G)/n v'(G) Gv'(G) 决议问题: 在条件变差时,利润上涨仍是降落? 在往常的(一人)决议中,假如有几个选择,决议者选择利润最大的一个。 假如外界条件改变,使他的一个或几个利润降落,那么它不论如何选择, 都不会使利润比本来更大。 例 在一块田里选择栽种的(纯)收入: 棉花 3000元 花生 3700元 玉米 3500元 假如本钱上涨,收入变成 棉花 3000元 花生 3200元 玉米 3400元 人决议利润往常降落 例 在多人决议时的利润降落与增添 〔1〕初始时 参加人 2 1 2 T T S 5,4 8,3 1 参加人1 S 4,3 6,5 2 平衡为〔S1,T1〕,参加人1的利润为5。 〔2〕外界条件使参加人1在选择S1时的利润降落 参加人2 T1T2 S13,45,2 参加人1 S24,36,5 平衡〔S2,T2〕 参加人1的利润6。 多人决议,利润可能上涨。 混淆战略和平衡的存在 例1少儿游: “石、剪刀、布〞不存在什平衡。 如何略? 例6猜硬(MatchingPennies) 参加人2 正面反面 正面 -1,1 1,-1 参加人1 反面1,-1-1,1 也不存在什平衡。 将本来的略 sik称略(purestrategy)。 略空 Si 〔i1,⋯,iK〕。 =s s 混淆略(mixedstrategy): 略空Si的概率散布 i〔i1,⋯,iK〕 : p=pp. ——由参加人定。 〔参加者在可行中全部行的一个概 率散布〕 利润: vi (p 1,⋯,n k ( jjk i1,⋯,n p)= p )u(s s) =Eui(s1,⋯,sn) ——由概率算的希望。 的情况: 二个参加人 S1={s11,⋯,s1J},S2={s21,⋯s,2K}利润: JK v1(p1,p2)=p1jp2ku1(s1j,s2k) j1k1 猜硬的利润: 假如 p1=(1, 3),p2 =( 1,2), 4 4 3 3 v1 =–1 ×1 + 1×2+ 3×1 –3×2 =-1/6 4 3 4 3 4 3 4 3 v2 = 1 1 1 2 3 1 3 2 4 ×–×– 4 × + 4 ×=1/6 3 4 3 3 3 随意的混淆略, p1 , 1-p) , 2 , 1-q), =(p p=(q v1(p1,p2)=pq(-1)+p(1-q)+(1-p)q+(1-p)(1-q)(-1) =2p(1-2q)+2q-1 v2(p1,p2)=pq+p(1-q)(-1)+(1-p)q(-1)+(1-p)(1-q) =2q(2p-1)+1–2p 混淆略中的劣略 例7 参加人2 LR T 3,-- 0,-- 参加人1M 0,-- 3,-- B 1,-- 1,-- 假如只考略,B不是格劣略。 在略,假如参加人 L,那么1选T,假如参加人2选R,那么1选R。 可否剔除B? 假如1选择p=(0.5,0.5,0),那么对2的任何混淆战略(q,1–q) v1(p,q)=0.5q3+0.5(1-q)0+0.5q0+0.5(1-q)3=1.5考虑以概率1选择B,即pB=(0,0,1),那么 v1(pB,q)=q1+(1-q)1=1 即B为p的严格劣战略。 v 3 MT p 1B O1q 仿佛能够剔除B? 假如改写一下: 参加人2 LR T 3,-- 0,-- 参加人1M 0,-- 3,-- B 2,-- 2,-- 结果有何变化? 给出其余人的混淆战略p-i,i的最优反应: p vi(pi,p-i)vi(pi,p-i) 例6〔续〕在猜硬币中,参加人1的利润: v1(p1,p2)=pq(-1)+p(1-q)+(1-p)q+(1-p)(1-q)(-1) =2p(1-2q)+2q-1 参加人1的最优反应 假如q1,p=1; 2 假如q1,p=0; 2 假如q=1,p在[0,1]中随意。 2 参加人2的利润: v2(p1,p2)=pq+p(1-q)(-1)+(1-p)q(-1)+(1-p)(1-q) =2q(2p-1)+1–2p 参加人2的最优反应 假如p1,q=0; 2 假如p1,q=1; 2 假如p=1,q在[0,1]中随意。 2 pp 11 1/2 O 1/2 1q O 1 q 参加人1 参加人2 混淆战略的纳什平衡 什平衡: p*=〔p1*,⋯,pn*〕足 vi(p*i,p*-i)vi(pi,p*-i) 什平衡最大化的解 maxvi=vi(p1*,⋯p,i,⋯p,n*) pi 在猜硬中,{〔1 1 〕,〔1 1〕}是一个什平衡. 2 2 2 2 p 1 O1/21q 例8性〔〕 克里斯取混淆略(p,(1–p)),帕特取〔q,(1–q)〕 克里斯利润 v1=2pq+(1-p)(1-q) =p(3q-1)+1-q 她的最反 p=0,当q 1, 3 p=1,当q 1 3 p随意在[0,1]中,当q=1 3 帕特利润 v2=pq+2(1-p)(1-q) =q(3p-2)+2–2p 他的最优反应 q=0,当p 2; 3 q=1,当p 2; 3 q随意在[0,1]中,当p=2. 3 pp O q O q 克里斯 帕特 纳什平衡: {(2,1),(1,2)}; 3333 {(0,1),(0,1)}; {(1,0),(1,0)}. 纳什平衡的存在 二个参加人,二个战略 参加人2 LR Ux,ay,b 参加人1 Dz,cw,d 参加人1的混淆战略: (p,1-p); 参加人2的混淆战略: (q,1-q). 参加人1的利润: v1(p,q)=pqx+p(1–q)y+(1–p)qz+(1–p)(1–q)w=p[q(x–z+w–y)–(w–y)]+q(z–w)+w 分3种状况: (1)x–z+w–y=0。 v1(p,q)=p(y–w)+q(z–w)+w p=1,当yw; p=0,当yw; p[0,1],当y=w. p p O q O q yw yw (2)x –z+w–y p=0,当q p=1,当q 0 (w (w –y)/(x–y)/(x –z+w–z+w –y) –y); p[0,1],当q=(w–y)/(x–z+w–y). p O q 0(w –y)/(x –z+w –y) 1 pp OqOq 1(w–y)/(x–z+w–y)(w–y)/(x–z+w–y)0 (3)x–z+w–y0 p=1,当q(w–y)/(x–z+w–y); p=0,当q(w-y)/(x–z+w–y), p[0,1],当q=(w-y)/(x–z+w–y). p Oq 0(w–y)/(x–z+w–y)<1 pp OqOq (w–y)/(x–z+w–y)01(w–y)/(x–z+w–y) 最优反应曲线一共能够归纳为4种状况。 似的剖析可得参加人2的最反曲只有4种可能: pp O p q O p q OqOq 什平衡的存在: 参加人1的任何最反与参加人2的任何最 反起码有一个交点。 超二个参
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 第一章