书签分享收藏举报版权申诉 / 7

立即下载加入VIP,免费下载

当前位置：首页 > IT计算机 > 互联网 > 综合I类跟II类理性人的博弈策略doc172.docx

综合I类跟II类理性人的博弈策略doc172.docx

文档编号：1236854
上传时间：2022-10-19
格式：DOCX
页数：7
大小：20.52KB

《综合I类跟II类理性人的博弈策略doc172.docx》由会员分享，可在线阅读，更多相关《综合I类跟II类理性人的博弈策略doc172.docx（7页珍藏版）》请在冰豆网上搜索。

综合I类跟II类理性人的博弈策略doc172.docx

综合I类跟II类理性人的博弈策略doc172

综合I类与II类理性人的博弈策略

两人零和博弈作为较归整的形式，在博弈论的早期研究中已经得到的深入讨论。

本文引入了Ｉ类理性与ＩＩ类理性的概念，认为现实博弈中的参与人往往既可能从Ｉ类理性的角度采取战略，也可能是从ＩＩ类理性人的角度出发，因此，构造了一个综合了Ｉ类和ＩＩ类理性特征的支付矩阵，通过对一些常见的非零和博弈实例进行讨论，认为这一模型可以解决战略选择的不确定性问题。

但本文没有对此进行严格的数学证明。

在经济学的博弈理论中,一般假设参与人（PLAYERS）具有理性人的特征, 即总是寻求自身的最大化利益，选择能使个人利益最大化的策略。

在计算收益的时候，使用的是个人所得。

这是一个“绝对量”，而现实中，也存在着另外一种情况，也就是参与者之间除了考虑自己的所得之外，也很关心对方的所得，并比较相互间的差异，采取使“相对”所得最大化的策略。

我们不妨把以追求相对所得最大化的行为人称为II类理性人，并从博弈论的角度对他们的行为模式进行研究。

具有II类理性特征的现象在很多方面都有存在。

比如，我们在人际交往中确实会碰到一些“损人利己”的人，也会见到“损人不利己”的人，从我们观点看来，他们是非理性的，但是进行换位思考就会发现，其实他们的行事原则是相对来说，总要让自己占便宜或者自己吃得亏比对方少，至于别人是否会吃亏，不是他们考虑的因素，这也是一种“理性”行为，也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。

在激烈的市场角逐中，竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地，希望对手先被淘汰而自己会坚持到最后。

如果做不到这点，也要最大程度地削弱对手力量，使其一蹶不振而不会对自己再构成威胁。

这种商场竞争，并期望自己能笑到最后的思维，也是“理性”的。

有研究表明，国际关系中这样的II类理性的例子更不少见。

这些虽然是比较极端的例子，现实生活中，更多的可能是，每个人或组织都会考虑自己的所得，并期望自己的所得比别人的大。

关键是对两种所得在考虑时的权数是随情况不同而变化的。

如果否定在策略选择中的II类理性因素，可能会对一些现象无法解释。

尽管从道德角度讲不值得提倡，而且从价值评判上总是受到谴责, 但作为一种存在的现象,仍然有必要加以研究。

但本文从II类理性个体的博弈战略开始，并过渡到一个综合了I类和II类理性行为的博弈模型，对例中设计的参与人的战略选择，只进行经济学分析而不做道义上的衡量。

当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。

假设两个参与人甲和乙都是II类理性人时，对比在I类理性的得益矩阵（图１）

　　乙

S1 S2

甲S1（m1,n1）（m2,n2）

S2（m3,n3）（m4,n4）

　　　　　　　　　图１．Ｉ类理性参与人收益矩阵

ＩＩ类理性参与人的得益矩阵如下图所示：

　　乙

S1 S2

甲S1（m1-n1,n1-m1）（m2-n2,n2-m2）

S2（m3-n3,n3-m3）（m4-n4,n4-m4）

　　　　　　　　　　　图２．ＩＩ类理性参与人收益矩阵

很明显，在ＩＩ类理性参与人进行的博弈里，在每一个战略组合下，双方的得益之和必为零，此时的博弈具有零和的性质。

这就是早期博弈论中重点研究的二人零和博弈的情形,在1910年~1930年间, 作为绝对竞争的形式,零和博弈被认为是博弈理论中的主要形态得到了深入的研究。

而且对零和博弈的研究成果成为了现代博弈理论中很多新理论的基础概念。

作为一个练习，我们把常见博弈模型改为零和博弈情形，来看相应的结果会是怎样的。

一般认为，零和博弈是一种常和博弈，而最普遍意义下的博弈情形是非常和的。

例1．囚犯困境

甲，乙涉嫌同谋犯罪，分别在两个房间被提审。

提审官预先向两人交代政策：

如果他们都承认犯罪事实，各判刑10年；如果两人都否认，双方都无罪释放；如果一方认罪一方抵赖，认罪方获500元奖励，抵赖方被判15年。

在非零和博弈情形下的支付矩阵如下：

　　乙

承认抵赖

甲承认（-10,-10）（5,-15）

抵赖（-15,5）（0,0）

图3

纳什均衡策略是（承认，承认），如果甲乙两人是II类理性人，他们的相应支付矩阵就变成了：

　　乙

承认抵赖

甲承认（0,0）（20,-20）

抵赖（-20,20）（0,0）

图4

可以看出，纳什均衡策略还是（承认，承认）。

例2．春节前夕，某小镇上两个商铺甲和乙同时看到一个赚钱机会：

去城里贩一批鞭炮回来卖，购货款加上运输费共5000元，如果没有竞争对手，这批货在小镇上能卖6000元；但如果另一家商铺也同时在小镇上卖鞭炮，价格下跌使得这批鞭炮只能卖4000元。

对于甲乙都是I类理性人而言，有支付矩阵：

　　乙

进货不进货

甲进货（-1000,-1000）（1000,0）

不进货（0,1000）（0,0）

图5

（不进货，进货）和（进货，不进货）为纳什均衡策略。

但是问题在于，甲乙双方同时行动，而互相不知道对方采取的行动。

如果甲乙都是II类理性人，那么情况会变成：

　　乙

进货不进货

甲进货（0,0）（1000,-1000）

不进货（-1000,1000）（0,0）

图6

此时的纳什均衡策略就是（进货，进货）。

例3．利己与利他

甲乙作为I类理性人，其支付矩阵为

　　乙

利己利他

甲利己（1,1）（4,0）

利他（0,4）（3,3）

图7

纳什均衡是（利己，利己）；

甲乙作为II类理性人，其支付矩阵转化为：

　　乙

利己利他

甲利己（0,0）（4,-4）

利他（-4,4）（0,0）

图8

纳什均衡仍然是（利己，利己）。

例4．智猪博弈

一头大猪和一头小猪被关在同一个猪圈里。

猪圈的一头安装着一个特制的按键，另一头安装着一个食槽。

但一头猪按下按键时，会有10单位的食物进入槽中，但按键的猪会付出2单位的成本；如果大猪先到食槽，则小猪只能吃到1单位的残羹剩饭；但若小猪先到的话，则它能吃到4单位的食物。

若两猪同时到，则小猪可吃到3单位的食物。

如果按照I类理性，有支付矩阵：

　　小猪

按键等待

大猪按键（5,1）（4,4）

等待（9,-1）（0,0）

图9

纳什均衡策略是（按键，等待）。

在II类理性下，重写支付矩阵为：

　　小猪

按键等待

大猪按键（4,-4）（0,0）

等待（10,-10）（0,0）

图10

纳什均衡是（按键，等待）和（等待，等待）。

有趣的是，此时小猪一定会选择等待（占优战略），而大猪无论怎么做，都是一无所获！

最终结果是两头猪都会饿死。

在这种情况下，两头猪的结局似乎和“布里丹的饥饿的驴”有共同点，后者因为面对同样两堆干草不能做出选择而饿死。

在智猪博弈里，小猪认为自己的结果只能是损失或者既无损失又无所得，这时它会选择后者，而将责任推给大猪。

现实中，不大可能出现两猪都饿死的结果，因为大猪最终会明白，与其被饿死还不如去按键，此时自己会得到4单位的食物；而小猪也会因为大猪作出这样的选择，而同样得到4单位的食物。

例5．性别战

两个恋人，男方想看拳击，女方想看芭蕾。

如果需要的话，他们会牺牲自己的爱好而迁就对方。

有下面的支付矩阵：

　　女

拳击芭蕾

男拳击（2,1）（0,0）

芭蕾（0,0）（1,2）

图11

纳什均衡是（拳击，拳击）和（芭蕾，芭蕾）。

将支付矩阵做个变换：

　　女

拳击芭蕾

男拳击（1,-1）（0,0）

芭蕾（0,0）（-1,1）

图12

那么，（拳击，芭蕾）就是纳什均衡策略。

例6．斗鸡博弈

两个人举着火棍从独木桥两端向中间前进，每个人都有两种战略：

前进或退下阵来。

若两人都继续前进，则两败俱伤；如果一方前进，另一方退下来，前进者取得胜利，退后者丢了面子；若两人都退了下来，则都丢了面子。

支付矩阵如下：

　　 A

进退

B进（-3,-3）（2,0）

退（0,2）（0,0）

图13

纳什均衡策略是（进，退）和（退，进）；

按II类理性对支付矩阵进行变换后得：

　　 A

进退

B进（0,0）（2,-2）

退（-2,2）（0,0）

图14

纳什均衡策略是（进，进）。

　　在上面的讨论中，可以看到，在例2中，对于I类理性参与人，（不进货，进货）和（进货，不进货）都是纳什均衡策略，采取哪个战略要取决于对方的行动，在一次静态博弈中是很难在行动之初就了解到对方的战略的，因此存在选择上的不确定性。

在智猪博弈中，对于II类理性参与人而言，不能根据支付矩阵决定出大猪的战略，如何才能避免在选择时出现这样的不确定状态呢？

有必要考虑某种混合战略。

一般来讲，博弈的每个参与者在某些时间会按I类理性人行为模式行事，而有时又会采用II类理性人模式行事。

不妨将这种组合看成是决定于概率p和q。

这时候，假设甲遵循I类理性的概率是p，那么他是II类理性人的概率就是1-p,乙遵循I类理性的概率是q，相应他是II类理性人的概率是1-q。

这时我们也可以构造出一种混合战略，得到支付矩阵：

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 综合 II 理性博弈策略 doc172

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：综合I类跟II类理性人的博弈策略doc172.docx
链接地址：https://www.bdocx.com/doc/1236854.html

综合I类跟II类理性人的博弈策略doc172.docx

热门标签