书签分享收藏举报版权申诉 / 60

立即下载加入VIP,免费下载

当前位置：首页 > 工作范文 > 行政公文 > 博弈论第一章.docx

博弈论第一章.docx

文档编号：25325609
上传时间：2023-06-07
格式：DOCX
页数：60
大小：160.20KB

博弈论第一章.docx

《博弈论第一章.docx》由会员分享，可在线阅读，更多相关《博弈论第一章.docx（60页珍藏版）》请在冰豆网上搜索。

博弈论第一章.docx

博弈论第一章

1完整信息静态博弈

1.0对策论研究的内容与根本形式

对策论研究的内容

对策论研究多个行为主体的决议问题。

对策论研究的形式

博弈（game），由多个行为主体组成的系统。

例

Stackelbergmodel

Cournotmodel

博弈的种类

参加者行动的时间与次序

同时行动——静态博弈；

先后行动——动向博弈。

参加者的信息多少

信息同样——完整信息；

信息不一样——不完整信息。

1.1根本理论:

博弈的标准式和纳什平衡

例1少儿游戏：

“石头、剪刀、布〞。

博弈的准式表示（normal-formrepresentation）

（1）参加人（player）.

n个参加人：

1,2,⋯,i,⋯,n.

（2）略（strategy）.

一个参加人的略是他采纳的一个行。

参加人i的略：

si.

参加人i的略空:

Si.

略的一个合:

s={s1，s2,⋯,sn}.

化表示：

s-i={s1，⋯,si-1，si+1,⋯,sn}.

（3）利润（payoff）.

参加人i的利润：

ui=ui（s1，s2,⋯,sn）

n个参加人博弈的准形式表示:

G={S1,S2,⋯S,n；u1,u2,⋯u,n}

完整信息（completeinformation）：

每个参加人知道其余人的略空和利润。

静博弈（staticgame）：

全部的参加人同行。

每一个人行，不知道其余人的行。

例1〔〕：

博弈{石、剪刀、布}的描绘：

参加人：

1，2。

略空：

S1=S2={石、剪刀、布}

利润：

两人出手的函数

u1（石，石）=0，u1（石，剪刀）=1，u1（石，布）=-1

⋯

u2（石，石）=0，u2（石，剪刀）=-1，u2（石，布）=1

⋯⋯

利润表：

两个参加人，有限个略的博弈的表示方法。

P2

石头剪刀布

石头

0，0

1，-1

-1，1

P剪刀

-1，1

0，0

1，-1

1

布

1，-1

-1，1

0，0

博弈的：

可否知道每个参加人的略？

例2:

囚犯窘境（ThePrisoner’sDilemma）

囚犯2

缄默招认

缄默

-1，-1

-9，0

囚犯1

招认

0，-9

-6，-6

囚犯1的考：

无方缄默是招，自己“招〞好于“缄默〞。

囚犯2的考：

无方什么，“招〞好于“缄默〞。

两人的:

（招，招）。

定：

si是si的格劣略〔strictlydominated〕，假如:

ui（si，s-i）ui（si，s-i）

“缄默〞是“招认〞的严格劣战略

例3:

参加人2

左中右

上

1，0

1，3

3，0

参加人1中0,20，16，0

下

0,

2

2,

4

5,

3

参加人1:

没有严格劣战略。

参加人2:

“右〞严格劣于“中〞

考虑：

重复剔除严格劣战略（iteratedeliminationofstrictlydominated

strategies）

可预示的两人选择:

（下,中）。

例4:

图

参加人2

左中右

上

0，4

4，0

5，3

参加人1中4,00，45，3

下3,53,56,6

两人都没有格劣略。

两人会如何各自的略？

定：

s*=（s1，⋯，n

是一个什平衡

（Nashequilibrium）,

假如

*

s*）

ui（si*，s-i*）

ui（si，s-i*）

什平衡最大化的解

maxui=ui（s1*,⋯s,i,⋯s,n*）

siSi

各例中的什平衡:

囚犯窘境:

〔招，招〕

例3:

〔下，中〕

例4〔1.1.4〕:

（下,右）.

什平衡与重复剔除格劣略的关系:

没有被剔除的独一的略合是什平衡.

假如略是一个什平衡，它在重复剔除格劣略后留下.

多个什平衡

例5性（thebattleoftheSexes）

帕特

歌剧拳击

歌剧

2，1

0，0

克里斯

拳击

0，0

1，2

纳什平衡:

（歌剧,歌剧），（拳击,拳击）

1.2应用

例古诺双头垄断模型〔CournotModelofDuopoly〕

二个公司，生产产量:

q12

q

市场需求:

P=a–Q,

Q=q1

2

+q

公司本钱:

Cii

i

（q）=cq,i=1,2.

公司利润：

i（q1,q2）=Pqi–Ci（qi）=（a–（q1+q2））qi–cqi，

博弈的描绘：

参加人：

公司1，公司2

战略：

产量qi

利润：

i（q1,q2）

公司i选择产量求

max

（s,,s*）:

iij

siSi

一阶条件

d1=a–c–2q1–q2*=0

dq1

和

d2=a–c–q1*–2q2=0

dq2

厂商选择自己利润最大的产量

q1=acq2

q2=acq1

2

解纳什平衡得

q1*=q2*=ac

3

利

π1=π2=（a–c–（ac+ac））ac=（ac）2

3339

当ui是可微分的候,什平衡以下方程的的解：

ui（s1,s2

...,sn）=0,i=1,⋯n,

si

思虑：

用重复剔除格劣略求什平衡

比：

假如两个厂商生

q1=q2=ac

4

利

2

π1=π2=（a–c–（ac+ac））ac=（ac）

4448

例特德双断模型〔BertrandModelofDuopoly〕

两个企生有差的商品。

消者企i的需求

qi（pi,pj）=a–pi+bpj，

本钱:

Ci（qi）=cqi,i=1,2.

略si:

pi0

利润:

i（pi,pj）=（a–pi+bpj）（pi–c）

什平衡（p1

2

足

*,p*）

max

i（pi,pj*）

=max（a–pi+bpj*）（pi–c）

解得p1

2

a

c

*=p*=

2

b

例最后要价仲裁（Final-offerArbitration）

一个公司和一个工会，经过一个仲裁员决定薪资。

公司和工会同时提出薪资:

wf,wu

仲裁员有一个标准：

x，选择两方建议中比较凑近x的建议：

假如x<（wf+wu）/2，那么wf

假如x>（wf+wu）/2，那么wu

wf（wf+wu）/2xwu

公司和工会不知道x，但知道x

的散布函数F（x）和密度函数f（x）。

剖析

wf被选择的概率：

Prob{x

2

wu

}=Fwf

2

wu

wu被选择的概率：

Prob{x>wf

2

wu}=1–F

wf

wu

2

希望薪资

Ew=wfF

wf

wu

+wu1–F

wf

wu

2

wf*

知足

min

wfF

wf

wu*

+wu*

1–F

wf

wu*

wf

2

wu*

知足

max

wf*F

w*f

wu+wu

1–F

w*f

wu

2

由一阶条件

F

wfwu

+1wff

wf

wu-1wuf

wfwu=0

2

1wff

wfwu

+1-Fwf

wu-1wuf

wfwu=0

2

由此解出薪资的平衡建议。

两式相减

F

wf

wu

=1

2

两式相加

u

wf

wu

f

wf

wu

=1

w*f

2

–w*f

2

假如x

为正态散布:

x~N（m,

2）

w*f

wu*

=m

2

wu*–wf*=1

=2

2,

f（m）

纳什平衡

wu*=m+2/2,wf*=m–2/2

例公共财富问题

一个乡村,有n个村民，在公共草地上放羊。

村民i放牧的羊数：

gi

全村的羊总数：

G=g1+...+gn

养一只羊的（个人）本钱为c，一只羊的价值为v（G）

当G0,v'（G）<0,v''（G）<0

当G>Gmax,v（G）=0

每个村民选择养羊数目使自己利润最大

giv（G）–cgi

一阶条件

v（G）+giv'（G）–c=0,i=1,...,n

将n个等式相加获得

nv（G）+Gv'（G）–nc=0

即纳什平衡G1知足

v（G1）+G1v'（G1）–c=0

n

全村在总利润最大的放牧数G2知足

maxG2v（G2）–cG2

一阶条件

v（G2）+G2v'（G2）–c=0

G1与G2哪一个大？

G1大

v

v（G）

OGmaxG

Gv'（G）/n

v'（G）

Gv'（G）

决议问题：

在条件变差时,利润上涨仍是降落？

在往常的（一人）决议中，假如有几个选择，决议者选择利润最大的一个。

假如外界条件改变，使他的一个或几个利润降落，那么它不论如何选择，

都不会使利润比本来更大。

例

在一块田里选择栽种的（纯）收入：

棉花

3000元

花生

3700元

玉米

3500元

假如本钱上涨，收入变成

棉花

3000元

花生

3200元

玉米

3400元

人决议利润往常降落

例

在多人决议时的利润降落与增添

〔1〕初始时

参加人

2

1

2

T

S

5，4

8，3

1

参加人1

S

4，3

6，5

2

平衡为〔S1，T1〕，参加人1的利润为5。

〔2〕外界条件使参加人1在选择S1时的利润降落

参加人2

T1T2

S13，45，2

参加人1

S24,36，5

平衡〔S2，T2〕

参加人1的利润6。

多人决议，利润可能上涨。

混淆战略和平衡的存在

例1少儿游：

“石、剪刀、布〞不存在什平衡。

如何略？

例6猜硬（MatchingPennies）

参加人2

正面反面

正面

-1，1

1，-1

参加人1

反面1，-1-1，1

也不存在什平衡。

将本来的略

sik称略（purestrategy）。

略空

Si

〔i1，⋯，iK〕。

=s

s

混淆略（mixedstrategy）:

略空Si的概率散布

i〔i1，⋯，iK〕

:

p=pp.

——由参加人定。

〔参加者在可行中全部行的一个概

率散布〕

利润:

vi

（p

1，⋯，n

k

（

jjk

i1，⋯，n

p）=

p

）u（s

s）

=Eui（s1，⋯，sn）

——由概率算的希望。

的情况:

二个参加人

S1={s11，⋯，s1J},S2={s21,⋯s,2K}利润:

JK

v1（p1,p2）=p1jp2ku1（s1j,s2k）

j1k1

猜硬的利润：

假如

p1=（1,

3）,p2

=（

1,2）,

4

3

v1

=–1

×1

+

1×2+

3×1

–3×2

=-1/6

4

3

4

3

4

3

4

3

v2

=

1

2

3

1

3

2

4

×–×–

4

×

+

4

×=1/6

3

4

3

随意的混淆略，

p1

，

1-p）

，

2

，

1-q）,

=（p

p=（q

v1（p1，p2）=pq（-1）+p（1-q）+（1-p）q+（1-p）（1-q）（-1）

=2p（1-2q）+2q-1

v2（p1，p2）=pq+p（1-q）（-1）+（1-p）q（-1）+（1-p）（1-q）

=2q（2p-1）+1–2p

混淆略中的劣略

例7

参加人2

LR

T

3，--

0，--

参加人1M

0,--

3，--

B

1,--

假如只考略，B不是格劣略。

在略，假如参加人

L，那么1选T，假如参加人2选R，那么1选R。

可否剔除B？

假如1选择p=（0.5,0.5,0），那么对2的任何混淆战略（q，1–q）

v1（p,q）=0.5q3+0.5（1-q）0+0.5q0+0.5（1-q）3=1.5考虑以概率1选择B，即pB=（0,0,1）,那么

v1（pB,q）=q1+（1-q）1=1

即B为p的严格劣战略。

v

3

MT

p

1B

O1q

仿佛能够剔除B？

假如改写一下：

参加人2

LR

T

3，--

0，--

参加人1M

0,--

3，--

B

2,--

结果有何变化？

给出其余人的混淆战略p-i，i的最优反应:

p

vi（pi,p-i）vi（pi,p-i）

例6〔续〕在猜硬币中，参加人1的利润：

v1（p1，p2）=pq（-1）+p（1-q）+（1-p）q+（1-p）（1-q）（-1）

=2p（1-2q）+2q-1

参加人1的最优反应

假如q1，p=1；

2

假如q1，p=0；

2

假如q=1，p在[0,1]中随意。

2

参加人2的利润：

v2（p1，p2）=pq+p（1-q）（-1）+（1-p）q（-1）+（1-p）（1-q）

=2q（2p-1）+1–2p

参加人2的最优反应

假如p1，q=0；

2

假如p1，q=1；

2

假如p=1，q在[0,1]中随意。

2

pp

11

1/2

O

1/2

1q

O

1

q

参加人1

参加人2

混淆战略的纳什平衡

什平衡：

p*=〔p1*，⋯，pn*〕足

vi（p*i，p*-i）vi（pi，p*-i）

什平衡最大化的解

maxvi=vi（p1*,⋯p,i,⋯p,n*）

pi

在猜硬中,{〔1

1

〕,〔1

1〕}是一个什平衡.

2

p

1

O1/21q

例8性〔〕

克里斯取混淆略（p,（1–p）），帕特取〔q,（1–q）〕

克里斯利润

v1=2pq+（1-p）（1-q）

=p（3q-1）+1-q

她的最反

p=0，当q

1,

3

p=1,当q

1

3

p随意在[0,1]中，当q=1

3

帕特利润

v2=pq+2（1-p）（1-q）

=q（3p-2）+2–2p

他的最优反应

q=0，当p

2；

3

q=1，当p

2；

3

q随意在[0,1]中，当p=2.

3

pp

O

q

O

q

克里斯

帕特

纳什平衡：

{（2,1）,（1,2）};

3333

{（0,1）,（0,1）};

{（1,0）,（1,0）}.

纳什平衡的存在

二个参加人，二个战略

参加人2

LR

Ux，ay，b

参加人1

Dz，cw，d

参加人1的混淆战略:

（p,1-p）;

参加人2的混淆战略:

（q,1-q）.

参加人1的利润:

v1（p,q）=pqx+p（1–q）y+（1–p）qz+（1–p）（1–q）w=p[q（x–z+w–y）–（w–y）]+q（z–w）+w

分3种状况：

（1）x–z+w–y=0。

v1（p，q）=p（y–w）+q（z–w）+w

p=1,当yw；

p=0,当yw；

p[0,1]，当y=w.

p

O

q

O

q

yw

（2）x

–z+w–y

p=0,当q

p=1,当q

0

（w

–y）/（x–y）/（x

–z+w–z+w

–y）

–y）；

p[0,1],当q=（w–y）/（x–z+w–y）.

p

O

q

0（w

–y）/（x

–z+w

–y）

1

pp

OqOq

1（w–y）/（x–z+w–y）（w–y）/（x–z+w–y）0

（3）x–z+w–y0

p=1,当q（w–y）/（x–z+w–y）;

p=0,当q（w-y）/（x–z+w–y）,

p[0,1],当q=（w-y）/（x–z+w–y）.

p

Oq

0（w–y）/（x–z+w–y）<1

pp

OqOq

（w–y）/（x–z+w–y）01（w–y）/（x–z+w–y）

最优反应曲线一共能够归纳为4种状况。

似的剖析可得参加人2的最反曲只有4种可能：

pp

O

p

q

O

p

q

OqOq

什平衡的存在:

参加人1的任何最反与参加人2的任何最

反起码有一个交点。

超二个参

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 博弈论第一章

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：博弈论第一章.docx
链接地址：https://www.bdocx.com/doc/25325609.html

博弈论第一章.docx

热门标签