博弈论不完全信息静态博弈讲义Word格式.docx
- 文档编号:14079119
- 上传时间:2022-10-18
- 格式:DOCX
- 页数:14
- 大小:86.45KB
博弈论不完全信息静态博弈讲义Word格式.docx
《博弈论不完全信息静态博弈讲义Word格式.docx》由会员分享,可在线阅读,更多相关《博弈论不完全信息静态博弈讲义Word格式.docx(14页珍藏版)》请在冰豆网上搜索。
中人相关的各种概念都随其类型的不同而不同。
局中人的行动空间A
将随类型诂而变化,即Ai二Ai(^i)。
支付函数也是类型依存的,可将其记为:
Ui=5(內,…,ai,an卫)i=1,…,n。
该式给出的是在其他局中人已选定行动aj,j…,n,j-i时,局中人选行动a^AU)获得的支付。
显然给定aj时最大化山的ai与二i有关,即ai=ai^i),其中ai是给定aj时最大化Ui的ai。
用“类型依存”来描述包括最优战略在内的相关概念与类型的对应关系
对局中人i,他不知道其他局中人的类型。
当他选择行动a「Ai(“)时,如果给定其他局中人类型与其最优战略aj的一个对应组合a*(日j),j知,j=1,…,n,其支付为:
Ui(a;
©
)…a;
」但口)44、(日肆厂a;
(日.)◎)。
假定局中人i认为其他局中人的类型组合恰好为…的概率为
Rd)。
记事前的分布密度为R(日;
…%…,氏),称为“先验概率”即局中
人在博弈之前掌握的知识使其对山…片的取值可能性判断。
显然,
)就是一种条件概率的概念,即当局中人i的类型为①时,他认
为二丄取值可的概率为
P(RO
、PL「i)aJ
这是概率论中著名的贝叶斯公式(Bayesequition
因为i不知道二4,我们这里用von•NeumannMorganstern
效用函数刻画这种不确定下的支付函数,即i的期望支付为
乞R(日屮iU(aU,ai®
)
显然,最大化上式的ai就是i的最优战略a*,它与R有关,故a*p*G)。
当存在一组“类型依存”的最优战略a~(a;
…,a;
),满足a*argmax'
R{r户i)u(a:
C4),aiJi)i=1,,n
a0(Q)0
则称a*是一个(纯战略)纳什均衡,也称为贝叶斯纳什均衡(Bayes
Nashequilibrium)。
a*是类型依存的,即a*=a*(8)。
为了减少复杂性,假定博弈开始之前各个局中人掌握的关于(九…Cn)的分布密度知识是相同的,即概率分布密度P(九…,片)是所有局中人的共同知识。
这被称为Harsanyi公理。
这一公理表明所有局中人有关自然行动的信念(belief)是相同的。
贝叶斯纳什均衡(也简称贝叶斯均衡)是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展。
有时也称不完全信息静态博弈为静态贝叶斯博弈或贝叶斯静态博弈。
n人静态贝叶斯博弈的战略式表述:
局中人类型空间Hi,…,Hn;
条件概率R,…,Pn;
战略空间AD…,AnUn);
支付函数ug,,an,R),,Un(ai,…,anCn)。
i知道二i。
用G—Ai,…,An,九…Cn,R,…,Pn,Ui/,u/?
表示该博弈。
博弈顺序为:
1自然N选V-(九…,齐),,i•Hi,局中人i观察到“,但局中人j-i仅知道Pjd已),不能观察到3。
2n个局中人同时选行动(战略)aNaj,…,an),APi)。
3i得到支付Ui(ai,…,an_),i=1,…,n。
该定义不排除局中人j可能拥有关于局中人i类型的某种信息,而当所有局中人类型空间只有一个元素时,不完全信息静态博弈就退化为完全信息静态博弈。
同时,这里假定AfJ和5(ai,a4^i)本身是共同知识,即尽管其他局中人不知道i的类型可,但他们知道i的战略空间和支付函数是如何依赖于他的类型的,即当他们知道R时,就必然知道A()和ui()。
纯战略贝叶斯纳什均衡是一个类型依存战略组合5*("
儿,满足:
a*(q)瓦P{日丄冋)5(a[但二)®
)i=1,…,n
有限博弈的不完全信息静态博弈至少存在一个贝叶斯纳什均衡
纯战略只是一个行动ai如何依类型小而变的规则,不是指一个具体的结果。
例市场进入博弈
一个完全垄断企业B正垄断着一个行业的市场,另一个潜在的试图进入该行业的企业A,称A为进入者,B为在位者。
A不知道B的成本特征,设B有两种可能的成本,即高成本和低成本。
两种成本情况下的博弈矩阵见下表。
市场进入博弈
高成本低成本
默认斗争默认斗争
40,50
-10,0
30,80
-10,100
0,300
0,400
进入
不进入
假定B知道进入者A的成本为高成本,且与B为高成本时的成本相同。
假若信息是完全的,则当B为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。
当B为低成本时,唯一的纳什均衡为(不进入,斗争),
即若A进入行业,具有低成本优势的B将通过降低价格将A逐出市场。
由于存在行业进入成本,所以A被逐出市场后将有净的10单位进入成本的损失。
当A不知道B的成本情况时,他的选择将依赖于他对B的成本
类型的主观概率或先验概率密度。
设A对B是高成本的先验概率判断为P,则A认为B为低成本的概率为1-PO
如果A进入,其期望支付为
P(40)(1-P)(-10)
如果1不进入,其期望支付为0。
当且仅当P(40)•(1—P)(—10)_0或P—1时,A选择进入;
反之,当
5
时,A不进入。
于是,贝叶斯均衡为:
(进入,默认),高成本,P_」;
(进入,斗争),低成本,P—丄;
(不进入,*),P」
5其中*表示可以是斗争,也可以是默认。
例不对称信息(asymmetricinformation下的古诺竞争
市场中有两个企业。
市场需求:
P(Q)=a-Q,Q=qi+呛
企业1成本:
Cgd=cq.
以概率1—取C2(q2)=Cl®
企业2的产量依赖于成本:
max[(a-qi*-qz)-4]业max[(a-qi*-g)-CL]q2
企业1选择q1
max現(a-qi-q2*(g))-c]qi+(1-)[(a-qi-q2*(0_))-c]qi
一阶条件
(a-qi*-Ch)-2q2*(CH)=0
(a-qi*-Cl)-2q2*(CL)=0
U[(a-q2*(CH))-c]+(1-J[(a72*(6))-c]}-2qi*=0
解出
3.3应用
例1信息不完全的性别战
帕特
歌剧
2+tc,1
0,0
克丽斯
拳击
1,2+tp
类型空间:
Tc=Tp=[0,x]
tp和tc为[0,x]上的均匀分布.
推断(密度函数):
pc(tp)=pp(tc)=1/x
直觉:
分别存在临界值c与p:
当tc>
c时,克丽斯选择歌剧,否则选择拳击.
当tp>
p时,帕特选择拳击,否则选择歌剧.
克丽斯的期望收益
看歌剧:
E(2+tc)+(1-p)X0=卫(2+tc)
xXX
看拳击:
卫X0+(1-p)=1-p
XXX
选择歌剧最优
R(2+tc)>
1-jp
XX
即tc-―-3
P
因此临界值c=--3
帕特的期望收益
护VA+看拳击:
(1-C)>
0+-(2+tp)=-(2+tp)
xxx
(1--)+-»
=1-c
由选择拳击最优
tp-宇-3
临界值p=—-3
c
解得p=c
和p2+3p-x=0.
克丽斯选择歌剧的概率
-3-j94x
2x
帕特选择拳击的概率
一3•.94x
当X-0时,
这正是完全信息下性别战博弈的混合战略纳什均衡例2拍卖(anauction)
拍卖方式
最为流行的拍卖方式有4种:
英式(增价公开)拍卖,荷兰式(减价公开)拍卖,一级价格密封拍卖(first-pricesealedauction,二级价格密圭寸拍卖(second-pricesealedauction又称Vickrey拍卖)。
从形式上说前两种是公开拍卖,后两种是密封式拍卖;
从实质上来说,英式拍卖和二级价格拍卖是(第)二价拍卖,其余两种是(第)一价
拍卖
(1)英式拍卖:
卖者以一个价格(可能很底)起拍,并逐步提高这个价格。
如果一个投标者放弃了,就不能在后面再参与拍卖。
当拍卖只有一个竞拍者时,他就是获胜者,并支付该时刻的价格。
(2)荷兰式拍卖:
卖者以一个价格(高)起拍,并逐步降低这个价格,第一个应拍的竞拍者以该时刻的价格获取拍卖品。
(3)一级密封拍卖:
每个竞拍者拿出一个密封的竞价交给出售者。
出价最高者获胜并支付这个最高的价格。
(4)二级密封拍卖:
与一级密封拍卖唯一不同的是,出价最高者获胜但支付的第二高的竞价。
尽管英国式拍卖和第二价格拍卖看起来很不相同,但从它们如何引导参与人理性决策来说,效果是一样的。
因此,我们说这两种拍卖在策略上是等价的,有些经济学家甚至借用数学语言说它们是“同构”的。
在这两种拍卖中,参与人受到要“显示私人真实评价”的激励。
在第二价格拍卖中,这是最明显的,因为每个买主直接把他们对拍卖品的评价写在密封的信封里。
在英国式的拍卖中,买主则需要通过逐渐抬高出价来慢慢接近自己的评价。
考虑密封第二价格拍卖
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 不完全 信息 静态 博弈 讲义