书签分享收藏举报版权申诉 / 21

立即下载加入VIP,免费下载

当前位置：首页 > 小学教育 > 语文 > 博弈论第一章.docx

博弈论第一章.docx

文档编号：3239146
上传时间：2022-11-20
格式：DOCX
页数：21
大小：77.67KB

博弈论第一章.docx

《博弈论第一章.docx》由会员分享，可在线阅读，更多相关《博弈论第一章.docx（21页珍藏版）》请在冰豆网上搜索。

博弈论第一章.docx

博弈论第一章

1完全信息静态博弈

1.0对策论研究的内容与基本形式

对策论研究的内容

对策论研究多个行为主体的决策问题。

对策论研究的形式

博弈（game），由多个行为主体构成的系统。

例

Stackelbergmodel

Cournotmodel

博弈的类型

参与者行动的时间与顺序

同时行动——静态博弈；

先后行动——动态博弈。

参与者的信息多少

信息相同——完全信息；

信息不同——不完全信息。

1.1基本理论:

博弈的标准式和纳什均衡

例1儿童游戏：

“石头、剪刀、布”。

博弈的标准式表示（normal-formrepresentation）

（1）参与人（player）.

n个参与人：

1,2,…,i,…,n.

（2）战略（strategy）.

一个参与人的战略是他采取的一个行动。

参与人i的战略：

si.

参与人i的战略空间:

Si.

战略的一个组合:

s={s1，s2,…,sn}.

简化表示：

s-i={s1，…,si-1，si+1,…,sn}.

（3）收益（payoff）.

参与人i的收益：

ui=ui（s1，s2,…,sn）

n个参与人博弈的标准形式表示:

G={S1,S2,…,Sn；u1,u2,…,un}

完全信息（completeinformation）：

每个参与人知道其他人的战略空间和收益。

静态博弈（staticgame）：

所有的参与人同时行动。

每个人行动时，不知道其他人的行动。

例1（续）：

博弈{石头、剪刀、布}的描述：

参与人：

1，2。

战略空间：

S1=S2={石头、剪刀、布}

收益：

两人出手的函数

u1（石头，石头）=0，u1（石头，剪刀）=1，u1（石头，布）=-1

…

u2（石头，石头）=0，u2（石头，剪刀）=-1，u2（石头，布）=1

……

收益表：

两个参与人，有限个战略的博弈的表示方法。

P2

石头剪刀布

石头0，01，-1-1，1

P1剪刀-1，10，01，-1

布1，-1-1，10，0

博弈的问题：

能否知道每个参与人选择的战略？

例2:

囚徒困境（ThePrisoner’sDilemma）

囚徒2

沉默招认

沉默-1，-1-9，0

囚徒1

招认0，-9-6，-6

囚徒1的考虑：

无论对方选沉默还是招认，自己选“招认”好于“沉默”。

囚徒2的考虑：

无论对方选什么，“招认”好于“沉默”。

两人的选择:

（招认，招认）。

定义：

si是si的严格劣势战略（strictlydominated），如果:

ui（si，s-i）ui（si，s-i）

“沉默”是“招认”的严格劣战略

例3:

参与人2

左中右

上1，01，33，0

参与人1中0,20，16，0

下0,22,45,3

参与人1:

没有严格劣战略。

参与人2:

“右”严格劣于“中”

考虑：

重复剔除严格劣战略（iteratedeliminationofstrictlydominatedstrategies）

可预见的两人选择:

（下,中）。

例4:

图1.1.4

参与人2

左中右

上0，44，05，3

参与人1中4,00，45，3

下3,53,56,6

两人都没有严格劣战略。

两人会如何选择各自的战略？

定义：

s*=（s1*，…，sn*）是一个纳什均衡（Nashequilibrium）,如果

ui（si*，s-i*）ui（si，s-i*）

纳什均衡为最大化问题的解

ui=ui（s1*,…,si,…,sn*）

各例中的纳什均衡:

囚徒困境:

（招认，招认）

例3:

（下，中）

例4（图1.1.4）:

（下,右）.

纳什均衡与重复剔除严格劣势战略的关系:

没有被剔除的唯一的战略组合是纳什均衡.

如果战略是一个纳什均衡，它们在重复剔除严格劣势战略后留下.

多个纳什均衡

例5性别战（thebattleoftheSexes）

帕特

歌剧拳击

歌剧2，10，0

克里斯

拳击0，01，2

纳什均衡:

（歌剧,歌剧），（拳击,拳击）

1.2应用

例古诺双头垄断模型（CournotModelofDuopoly）

二个企业，生产产量:

q1,q2

市场需求:

P=a–Q,Q=q1+q2

企业成本:

Ci（qi）=cqi,i=1,2.

企业利润：

i（q1,q2）=Pqi–Ci（qi）=（a–（q1+q2））qi–cqi，

博弈的描述：

参与人：

企业1，企业2

战略：

产量qi

收益：

i（q1,q2）

企业i选择产量求

i（si,,sj*）:

一阶条件

=a–c–2q1–q2*=0

和

=a–c–q1*–2q2=0

厂商选择自己利润最大的产量

q1=

q2=

解纳什均衡得

q1*=q2*=

利润

π1=π2=（a–c–（

+

））

=

当ui是可微分的时候,纳什均衡为下列方程组的的解：

=0,i=1,…,n

思考：

用重复剔除严格劣势战略求纳什均衡

比较：

如果两个厂商生产

q1=q2=

利润

π1=π2=（a–c–（

+

））

=

例贝特兰德双头垄断模型（BertrandModelofDuopoly）

两个企业生产有差别的商品。

消费者对企业i的需求

qi（pi,pj）=a–pi+bpj，

成本:

Ci（qi）=cqi,i=1,2.

战略si:

pi0

收益:

i（pi,pj）=（a–pi+bpj）（pi–c）

纳什均衡（p1*,p2*）满足

maxi（pi,pj*）=max（a–pi+bpj*）（pi–c）

解得p1*=p2*=

例最后要价仲裁（Final-offerArbitration）

一个企业和一个工会，通过一个仲裁人决定工资。

企业和工会同时提出工资:

wf,wu

仲裁人有一个标准：

x，选择双方提议中比较靠近x的提议：

如果x<（wf+wu）/2，则wf

如果x>（wf+wu）/2，则wu

wf（wf+wu）/2xwu

企业和工会不知道x，但知道x的分布函数F（x）和密度函数f（x）。

分析

wf被选择的概率：

Prob{x<

}=F

wu被选择的概率：

Prob{x>

}=1–F

期望工资

Ew=wfF

+wu1–F

wf*满足

wfF

+wu*1–F

wu*满足

wf*F

+wu1–F

由一阶条件

F

+

wff

-

wuf

=0

wff

+1-F

-

wuf

=0

由此解出工资的均衡提议。

两式相减

F

=

两式相加

wu*f

–wf*f

=1

如果x为正态分布:

x~N（m,2）

=m

wu*–wf*=

=

纳什均衡

wu*=m+

wf*=m–

例公共财产问题

一个村庄,有n个村民，在公共草地上放羊。

村民i放牧的羊数：

gi

全村的羊总数：

G=g1+...+gn

养一只羊的（私人）成本为c，一只羊的价值为v（G）

当G0,v'（G）<0,v''（G）<0

当G>Gmax,v（G）=0

每个村民选择养羊数量使自己收益最大

giv（G）–cgi

一阶条件

v（G）+giv'（G）–c=0,i=1,...,n

将n个等式相加得到

nv（G）+Gv'（G）–nc=0

即纳什均衡G1满足

v（G1）+

v'（G1）–c=0

全村在总收益最大的放牧数G2满足

maxG2v（G2）–cG2

一阶条件

v（G2）+G2v'（G2）–c=0

G1与G2哪一个大？

G1大

v

v（G）

OGmaxG

Gv'（G）/n

v'（G）

Gv'（G）

决策问题：

在条件变差时,收益上升还是下降？

在通常的（一人）决策中，如果有几个选择，决策者选择收益最大的一个。

如果外界条件改变，使他的一个或几个收益下降，则它无论怎样选择，都不会使收益比原来更大。

例在一块田里选择种植的（纯）收入：

棉花3000元

花生3700元

玉米3500元

如果成本上升，收入变为

棉花3000元

花生3200元

玉米3400元

人决策收益通常下降

例在多人决策时的收益下降与增加

（1）初始时

参与人2

T1T2

S15，48，3

参与人1

S24，36，5

均衡为（S1，T1），参与人1的收益为5。

（2）外界条件使参与人1在选择S1时的收益下降

参与人2

T1T2

S13，45，2

参与人1

S24,36，5

均衡变为（S2，T2）

参与人1的收益为6。

多人决策时，收益可能上升。

1.3混合战略和均衡的存在

例1儿童游戏：

“石头、剪刀、布”

不存在纳什均衡。

如何选择战略？

例6猜硬币（MatchingPennies）

参与人2

正面反面

正面-1，11，-1

参与人1

反面1，-1-1，1

也不存在纳什均衡。

将原来的战略sik称为纯战略（purestrategy）。

战略空间Si=（si1，…，siK）。

混合战略（mixedstrategy）:

战略空间Si的概率分布:

pi=（pi1，…，piK）.

——由参与人选定。

（参与者在可选行动中所有行动的一个概率分布）

收益:

vi（p1，…，pn）=k（jpjk）ui（s1，…，sn）

=Eui（s1，…，sn）

——由概率计算的期望值。

较简单的情形:

二个参与人

S1={s11，…，s1J},S2={s21,…,s2K}

收益:

v1（p1,p2）=

p1jp2ku1（s1j,s2k）

猜硬币的收益：

如果p1=（

）,p2=（

）,则

v1=–

×

+

×

+

×

–

×

=-1/6

v2=

×

–

×

–

×

+

×

=1/6

任意的混合战略，p1=（p，1-p），p2=（q，1-q）,则

v1（p1，p2）=pq（-1）+p（1-q）+（1-p）

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 博弈论第一章

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：博弈论第一章.docx
链接地址：https://www.bdocx.com/doc/3239146.html

博弈论 第一章.docx

热门标签

博弈论第一章.docx