不完备偏好扩展式博弈的序贯均衡.docx
- 文档编号:3011257
- 上传时间:2022-11-17
- 格式:DOCX
- 页数:13
- 大小:53.04KB
不完备偏好扩展式博弈的序贯均衡.docx
《不完备偏好扩展式博弈的序贯均衡.docx》由会员分享,可在线阅读,更多相关《不完备偏好扩展式博弈的序贯均衡.docx(13页珍藏版)》请在冰豆网上搜索。
不完备偏好扩展式博弈的序贯均衡
不完备偏好扩展式博弈的序贯均衡
关键词博弈;不完备偏好;序贯均衡;纳什均衡;颤抖手完美均衡
中图分类号F016文献标识码A
SequentialEquilibriuminExtensiveGameswithIncompletePreferences
SHIQi1,2,CHENYiqing1
(1.SchoolofEconomicsandManagement,NanchangUniversity,Nanchang,Jiangxi330031,China;
2.SchoolofEconomics,ShanghaiUniversityofFinanceandEconomics,Shanghai200433,China)
AbstractTheKrepsandWilson’ssolutionconceptofsequentialequilibriumwasgeneralizedtotheextensivegameswithincompletepreferences.Firstarevisedconceptoftremblinghandperfectequilibriumwasgiven,andthenwasappliedtoverifytheexistenceofsequentialequilibriuminextensivegameswithincompletepreferences.
Keywordsgame;Incompletepreference;Sequentialequilibrium;Nashequilibrium;
Tremblinghandperfectequilibrium
1引言
上个十年不完备偏好理论得到了复兴,1-3,。
Bade,4,把它应用到博弈论中,广泛
地探讨了在参与者具有不完备偏好时的纳什均衡概念。
Bade将经典纳什均衡概念扩展到不
完备偏好的环境下,发现一个博弈的纳什均衡恰好就是该博弈的所有完备化博弈的纳什均
衡集的并集。
而且,如果不完备偏好可以被一个多效用函数,1,所表示,那么在一定假
设下,纳什均衡集恰好就是该博弈所有线性完备化博弈的纳什均衡集的并集。
纳什均衡是博弈论中最重要的解概念,但是,它可能会给出了太多均衡;当博弈存
在不完美信息的时候,它甚至可能造成误导。
Kreps和Wilson提出的序贯均衡,5,是纳什
均衡的精练,其基本思想在于均衡不仅应该描述参与者的策略,还要描述参与者在每个信
息集上关于究竟是哪个历史发生了的信念。
一个很自然的问题是:
当去掉完备偏好的假设,
是否仍然能够定义一个序贯均衡的概念,使得它在每个有限扩展式博弈都存在呢,与Kreps
和Wilson类似,想使用原扩展式博弈的代理人标准式表示的颤抖手完美均衡来证明序贯均
衡的存在性。
然而,对于不完备偏好,颤抖手完美均衡可能不是一个纳什均衡。
幸运的
是,任意有限博弈都有一个颤抖手完美纳什均衡(THPNE),这样就能得到与Kreps和Wilson
类似的结论。
2基本概念
在本文中,Γ:
={N?
{c},H,P,fc,(Ii)i?
N,(?
i)i?
N}表示一个完美记忆有限扩展式博弈。
其中,N为有限的参与人集合,c为自然,H为历史集合,P为参与人函数,fc为每个P(h)=c的历史h指定一个A(h)上的概率测度f
而且,集合Ιi?
Ii为参与人i的一个信息集。
c(?
|h)),
终结历史集合标记为Z.每个参与人i?
N拥有一个定义在Z上的(可能为不完备的)偏好关系?
i.假设每个偏好关系?
i都是传递的,反身的,但是,与经典理论不同,不一定是完备的。
参与人i在x和y之间无差异,标记为x——iy,当且仅当x?
iy且y?
ix.参与人i严格偏好x甚于y,标记为x,iy,当且仅当x?
iy但不是y?
ix.
与不完备偏好表示理论的最近文献,2,相似,考虑偏好关系?
i是可以被函数表示的,也即,存在一个函数u:
Z?
Rn使得x?
y当且仅当u(x)?
u(y)。
在下文中,将用
Γα:
={N?
{c},H,P,fc,(Ii)i?
N,(ui)i?
N}表示博弈
Γα:
={N?
{c},H,P,fc,(Ii)i?
N,(?
i)i?
N},其中函数ui:
Z?
Rmi表示偏好?
i.更具体而言,对于任意向量α={α1,„,αI},αi?
Rm
i,定义一个博弈
Γα:
=N?
{c},H,P,fc,(Ii)i?
N,uii?
I,
其中,αiui:
Z?
R定义为αi和ui的点积,或αiui=?
mij=1αi
juij.进一步的,定义
Δ:
={α={α1,„,αI},αi?
Δmi,i},
经济数学第29卷第1期时奇等:
不完备偏好扩展式博弈的序贯均衡
且
Δ+:
=Δ?
R?
mi++,
其中,Δmi表示mi——1维单纯形。
如果?
′和?
都是定义在Z上的偏好关系,?
?
′且,,′,那么称?
′是?
的完备化。
说一个扩展式博弈Γ′:
={N?
{c},H,P,fc,(Ii)i?
N,
(?
′i)i?
N}是另一个扩展式博弈Γ:
={N?
{c},H,P,fc,(Ii)
i?
N,(?
i)i?
N}的完备化,如果对于每个参与人i,?
′i都是?
i的完备化。
那么,对于任意αi》0,函数αiui代表了由ui所代表的偏好关系的完备化。
因此,对于任意α?
Δ+,博弈Γα是原博弈Γ的线性完备化。
仿照Kreps和Wilson的证明方法,考虑博弈Γα的代理人标准表示(ANFR)
6,。
但在此之前,给出一些术语。
用Ii标记参与人i应该行动的那些信息集的集合,用s标记任意信息集,用i.s标记应该在信息集s?
Ii行动的那个代理人。
而且,用Ds标记信息集s可以采取的行动;更具体的说,如果知道在信息集s采取行动的应该是参与人i,那么称他可以采取的行动集为Di.s.那么,博弈Γα的ANFR可以表示为
Γaα:
={I?
{c},(Di.s)i.s?
I,(ui)i?
N},
其中,I表示所有代理人的集合。
3纳什均衡和颤抖手完美均衡
给定博弈Γα,定义代理人i.s的最优反应映射BRui,使得
BRui(σ——i.s):
=argmaxdi.s?
Di.sui(d
i.s,σ——i.s),
其中,-i.s表示除i.s之外的其他代理人.那么,对于任意y(σ,i.s)?
BRui.s(σ,i.s),给定其他代理人的行为策略σ,i.s,不存在y′(σ,i.s)使得(σ,i.s,y′(σ,i.s)),i(σ,i.s,y(σ,i.s)).
对于博弈Γa的完备化Γaα,也可以定义参与人i.s的最优反应映射BRαiui使得
BRαiui(σ,i.s):
=argmax
di.s?
Di.sαiui(di.s,σ,i.s).
定理1对于所有代理人i.s,以及所有αi?
Δmi+,有
BRαiui(σ,i.s)BRui(σ,i.s).
证明用反证法.假设定理1不成立,那么必存在σ,i.s和di.s使得di.s?
BRαiuiσ,i.s但di.s?
BRuiσ,i.s成立.这样必存在d′i,s使得di,s.因为αi?
Δmi+,那么αid′i,s,αidi,s,这与di.s?
BRαiuiσ,i.s相矛盾.
定理2对于所有代理人i.s和所有σ,i.s,BRuiσ,i.s是上半连续的.证明因为博弈是有限的,BRuiσ,i.s总是紧值的.根据最大值定理,7,,有,对于所有代理人i.s,所有αi?
Δmi+,以及所有是上半连续的.那么,对于任意序列(σk,i.s)?
σ,i.s和yk?
BRuiσk,i.s,存在yk的一个子序列收敛于BRuiσ,i.s中的一点.但是,根据定理1,有BRαiuiσ,i.sBRuiσ,i.s.那么BRuiσ,i.s也是上半连续的.一个随机策略组合σ:
=(σ1,σ2,…,σI)是博弈Γaα的纳什均衡,如果不存在一个代理人i.s有策略σ′i,s?
Δ(Di,s)使得(σ′i,s,σ-i,s),(σi,s,σ-i,s).将一个扩展式博弈的所有纳什均衡集合标记为NEΓ.一个随机策略组合σ:
=(σ1,σ2,…,σI)是博弈Γaα的一个颤抖手完美均衡,如果存在一个序列σk?
k=0使得
σk?
×i.s?
IΔ+Di.s,k?
1,2,3,…,
limk?
?
σki.sdi.s=σi.sdi.s,i.s?
I,di.s?
Di.s,σi.s?
argmaxuiσk,i.s,τi.s,i.s?
N,
但是,如果允许不完备偏好,一个颤抖手完美均衡可能不是纳什均衡,这与完备偏好情形时是不同的.Bade,4,给出了一个简单的反例,并且建议应该把目光集中在那些也是纳什均衡的颤抖手完美均衡上,这就产生了一个新概念,即颤抖手完美纳什均衡(tremblinghand
perfectNashequilibrium,THPNE).幸运的是,在一个有限扩展式博弈的代理人战略式中,总是可以找到一个THPNE,这一点由Bade,4,的推论1所保证.
定理3(Bade)任意有限博弈Γaα都有一个颤抖手完美纳什均衡.4序贯均衡
现在进入到本文的核心部分,原博弈Γ的序贯均衡的存在性.先考虑这样一个评估σ,μ,8,,其中σ为行为策略组合,μ为一个这样的信念函数:
为每个信息集的历史指定一个概率测度.
定义,结果Oσ,μs为给定信息集s已达到由行为策略σ决定的终结历史的概率分布.一个评估σ,μ是序贯理性的,如果对于每个参与人i?
N和每个信息集s?
Ii不存在一个σ′i,s使得
O((σ′i,s,σ-i,s),μ),iO((σi,s,σ-i,s),μ).
注意到对序贯理性的定义不同于经典定义,这是因为在结果空间引入了不完备偏好.说一个评估σ,μ是一个扩展式博弈
Γα:
=N?
{c},H,P,fc,(Ii)i?
N,uii?
I的序贯均衡,如果σ,μ是序贯理性的且具有一致性.一致性的定义是标准的,5,.
定理4假设Γα:
{N?
{c},H,P,fc,(Ii)i?
N,(ui)i?
I}为一个完美记忆扩展式博弈,且σ为Γα的代理人标准式表示的一个颤抖手完美纳什均衡.那么必存在一个信念向量μ使得σ,μ为Γα的一个序贯均衡.
证明对于博弈Γα中的任意参与人i,用s表示Ii中任意信息集.那么s中的历史集合被表示为Hs.以Xs表示不被Hs中所有节点所达到的终结历史集合;以
σ?
k=1表示在×r?
IΔ+Dr中的行为策略组合序列.对于Γα的代理人标准式表示而言,它们既是颤抖
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完备 偏好 扩展 博弈 均衡