博弈论经典例子课件.docx
- 文档编号:6610545
- 上传时间:2023-01-08
- 格式:DOCX
- 页数:17
- 大小:56.78KB
博弈论经典例子课件.docx
《博弈论经典例子课件.docx》由会员分享,可在线阅读,更多相关《博弈论经典例子课件.docx(17页珍藏版)》请在冰豆网上搜索。
博弈论经典例子课件
电影《美丽心灵》
博弈论经典例子
(2008-02-2415:
23:
45)
转载▼
标签:
杂谈
分类:
学术点滴
囚徒困境
故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:
如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:
坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:
如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。
结果,两个嫌疑犯都选择坦白,各判刑八年。
如果两人都抵赖,各判一年,显然这个结果好。
但这个帕累托改进办不到,因为它不能满足人类的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
旅行者困境
两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。
提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。
航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。
于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。
如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。
为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。
可是不,甲很聪明,他想:
如果我少写1元变成99元,而乙会写100元,这样我将得到101元。
何乐而不为?
所以他准备写99元。
可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。
想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。
你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。
在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。
事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡,是两人都写0.
是竞争也是劫持
费城西区有两个互为敌手的商店——纽约廉价品商店和美国廉价品商店.他們正好紧挨着,两店的老板是死敌,他們一直进行着没完没了的价格战.出售爱尔兰亚麻床单,甚至连有鹰一般眼睛的贝蒂·瑞珀女士都不能找出任何疵点,不信请问她;而這床单的价格又低得可笑,只需6美元50美分".当一个店的橱窗里出现這样的手写告示时每位顾客都会习惯地等另一家廉价品商店的回音.果然,大约过了两小时,另一家商店的橱窗里出现了這样的告示:
"瑞珀女士该配副近视眼镜了,我的床单质量一流,只需5美元95美分".价格大战的一天就這样开始了.除了贴告示以外,两店的老板还经常站在店外尖声对骂,经常发展到拳脚相加,最后总有一方的老板在這场价格战中停止争斗,价格不再下降.骂那个人是疯子,這就意味着那方胜利了.這时,围观的、路过的、还有附近每一个人都会拥入获胜的廉价品商店,將床单和其他物品抢购一空.在這个地区,這两个店的争吵是最激烈的,也是持续时间最长的,因此竟很有名声,住在附近的每个人都从他們的争斗中获益不少,买到了各式各样的"精美"商品.突然有一天,一个店的老板死了,几天以后,另一个店的老板声称去外地办货,這两家商店都停业了.过了几个星期,两个商店分别來了新老板.他們各自对两个商店前任老板的财产进行了详细的调查.一天检查时,他們发现两店之间有条秘密通道,并且在两商店的楼上两老板住过的套房里发现了一扇连接两套房子的门.新老板很奇怪,后來一了解才知道,這两个死对头竟是兄弟俩.原來,所有的诅咒、谩骂、威胁以及一切相互间的人身攻击全是在演戏,每场价格战都是装出來的,不管谁战胜谁,最后还是把另一位的一切库存商品与自己的一起卖给顾客.真是绝妙的骗局.
酒吧博弈问题(barproblem)
?
/P>
酒吧博弈问题是美国人W.B.Arthur1994年在《美国经济评论》发表的题为《归纳论证和有界理性》一问中提出的,然后他又从1999年的《科学》杂志上发表的《复杂性和经济学》一文中阐述了这个博弈。
""该博弈是说:
有一群人,例如n=100,每个周末,均要决定是去一酒吧活动还是呆在家里。
酒吧的容量是有限的,假定是60人。
如果某人预测去酒吧的人超过60人,那么他决定去还是不去?
......每个参与者或决策者面临的信息只是以前去酒吧的人数,只能根据以前的人数的信息来归纳出策略来。
这是一个典型的动态博弈问题。
......通过计算机的模型实验,阿瑟得出了一个有意思的结果:
不同的行动者是根据自己的归纳来行动的,并且,去酒吧的人数没有一个固定的规律,然而,经过一段时间以后,去的平均人数总是趋于60。
阿瑟说,预测者自组织到一个均衡系统中去和不去的人群,或形成一个生态稳定系统。
......这就是酒吧问题。
?
/P>
酒吧问题所反映的是这样一个社会现象,正象阿瑟教授说的那样,我们在许多行动中,要猜测别人的行动,然而我们没有更多关于他人的信息,我们只有通过分析过去的历史来预测未来。
枪手博弈
今天,我讲一个有关博弈论的经典故事。
彼此痛恨的甲、乙、丙三个枪手准备决斗。
甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。
先提第一个问题:
如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?
一般人认为甲的枪法好,活下来的可能性大一些。
但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。
我们来分析一下各个枪手的策略。
枪手甲一定要对枪手乙先开枪。
因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。
同样的道理,枪手乙的最佳策略是第一枪瞄准甲。
乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。
枪手丙的最佳策略也是先对甲开枪。
乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。
我们计算一下三个枪手在上述情况下的存活几率:
甲:
24%(被乙丙合射40%X60%=24%)
乙:
20%(被甲射100%-80%=20%)
丙:
100%(无人射丙)
通过概率分析,我们发现枪法最差的丙存活的几率最大,枪法好于丙的甲和乙的存活几率远低于丙的存活几率。
但是,上面的例子隐含一个假定,那就是甲乙丙三人都清楚地了解对手打枪的命中率。
但现实生活中,因为信息不对称,比如枪手甲伪装自己,让枪手乙和丙认为甲的枪法最差,在这种情况下,最终的幸存者一定是甲。
所以,无论是历史,还是现实,那些城府很深的奸雄往往能成为最后的胜利者。
这样的例子,对你的职场生涯或者官场生涯是否很有启发呢?
我们继续假定,甲乙丙三人互相不了解对手的枪法水平。
在这种情况下,甲被乙射、甲被丙射、甲被乙丙射及甲不被乙丙射的机率各为25%,按贝氏(Bayes)定理计算甲的存活率:
甲活率:
31%([被乙射:
25%X40%=10%]+[被丙射:
25%X60%=15%]+[被乙丙射:
25%X40%X60%=6%])。
乙活率:
23%([被甲射:
25%X20%=5%]+[被丙射:
25%X60%=15%]+[被甲丙射:
25%X20%X60%=3%])。
丙活率:
17%([被甲射:
25%X20%=5%]+[被乙射:
25%X40%=10%]+[被甲乙射:
25%X20%X40%=2%])。
在枪手互相不知道对手命中率的信息的情况下,这时命中率最高的枪手甲存活的几率最大,枪法最差的丙存活的可能性最小。
我们现在回到甲乙丙都知道对手命中率的情形,进行第二轮枪战的分析。
在第一轮枪战后,丙有可能面对甲,也可能面对乙,甚至同时面对甲与乙,除非第一轮中甲乙皆死。
尽管第一轮结束后,丙极有可能获胜(即甲乙双亡),但是第二轮开始,丙就一定处于劣势,因为不论甲或乙,他们的命中率都比丙的命中率为高。
这就是枪手丙的悲哀。
能力不行的丙玩些花样虽然能在第一轮枪战中暂时获胜。
但是,如果甲乙在第一轮枪战中没有双亡的话,在第二轮枪战结束后,丙的存活的几率就一定比甲或乙为低。
第二轮枪战中甲乙丙存活的几率粗算如下:
(1)假设甲丙对决:
甲的存活率为60%,丙的存活率为20%。
(2)假设乙丙对决:
乙的存活率为60%,丙的存活率为40%。
这似乎说明,能力差的人在竞争中耍弄手腕能赢一时,但最终往往不能成事。
我们现在用严格的概率方法计算一下两轮枪战后,甲乙丙各自的存活的几率。
(1) 第一轮:
甲射乙,乙射甲,丙射甲。
甲的活率为24%(40%X60%),乙的活率为20%(100%-80%),丙的活率为100%(无人射丙)。
(2) 第二轮:
情况1:
甲活乙死(24%X80%=19.2%)
甲射丙,丙射甲──甲的活率为60%,丙的活率为20%。
情况2:
乙活甲死(20%X76%=15.2%)
乙射丙,丙射乙──乙的活率为60%,丙的活率为40%。
情况3:
甲乙皆活(24%X20%=4.8%)
重复第一轮。
情况4:
甲乙皆死(76%X80%=60.8%)
枪战结束。
甲的活率为12.672%
(19.2%X60%)+(4.8%X24%)=12.672%
乙的活率为10.08%
(15.2%X60%)+(4.8%X20%)=10.08%
丙的活率为75.52%
(19.2%X20%)+(15.2%X40%)+(4.8%X100%)+(60.8%X100%)=75.52%
通过对两轮枪战的详细概率计算,我们仍然发现枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。
对于这样的例子,有人会发出“英雄创造历史,庸人繁衍子孙”的感叹。
我们现在改变游戏规则,假定甲乙丙不是同时开枪,而是他们轮流开一枪。
在这个例子中,我们发现丙的机会好于他的实力,丙不会被第一枪干掉,并且他可能极有机会在下一轮中先开枪。
先假定开枪的顺序是甲、乙、丙,甲一枪将乙干掉后(80%的几率),就轮到丙开枪,丙有40%的几率一枪将甲干掉。
即使乙躲过甲的第一枪,轮到乙开枪,乙还是会瞄准枪法最好的甲开枪,即使乙这一枪干掉了甲,下一轮仍然是轮到丙开枪。
无论是甲或者乙先开枪,乙都有在下一轮先开枪的优势。
如果是丙先开枪,情况又如何呢?
丙可以向甲先开枪,即使丙打不中甲,甲的最佳策略仍然是向乙开枪。
但是,如果丙打中了甲,下一轮可就是乙开枪打丙了。
因此,丙的最佳策略是胡乱开一枪,只要丙不打中甲或者乙,在下一轮射击中他就处于有利的形势。
我们通过这个例子,可以理解人们在博弈中能否获胜,不单纯取决于他们的实力,更重要的是取决于博弈方实力对比所形成的关系。
在上面的例子中,乙和丙实际上是一种联盟关系,先把甲干掉,他们的生存几率都上升了。
我们现在来判断一下,乙和丙之中,谁更有可能背叛,谁更可能忠诚?
任何一个联盟的成员都会时刻权衡利弊,一旦背叛的好处大于忠诚的好处,联盟就会破裂。
在乙和丙的联盟中,乙是最忠诚的。
这不是因为乙本身具有更加忠诚的品质,而是利益关系使然。
只要甲不死,乙的枪口就一定会瞄准甲。
但丙就不是这样了,丙不瞄准甲而胡乱开一枪显然违背了联盟关系,丙这样做的结果,将使乙处于更危险的境地。
合作才能对抗强敌。
只有乙丙合作,才能把甲先干掉。
如果,乙丙不和,乙或丙单独对甲都不占优,必然被甲先后解决。
智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?
答案是:
小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?
因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。
改变方案一:
减量方案。
投食仅原来的一半分量。
结果是小猪大猪都不去踩踏板了。
小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。
谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:
增量方案。
投食为原来的一倍分量。
结果是小猪、大猪都会去踩踏板。
谁想吃,谁就会去踩踏板。
反正对方不会一次把食物吃完。
小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:
减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到踏板附近。
结果呢,小猪和大猪都在拼命地抢着踩踏板。
等待者不得食,而多劳者多得。
每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。
成本不高,但收获最大。
许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。
股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。
这相当于“智猪博弈”增量方案所描述的情形。
但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。
最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
而从整个社会来讲,自身需求大的群体往往才是社会生产力推动的主力。
换句话说,要迅速提高整个社会的生产力水平,就需要有一个自身具有很大消费需求的群体,并且需要给他们一定程度的奖励。
第三种改变方案反映的就是这种情况,方案中降低了取食的成本,在现实中,也可以等同于增加了对取食者的奖励。
[笔记]——博弈论经典例子的思考
摘要:
博弈论就是关于在包含相互依存情况中的理性行为的研究,是研究对策现象中各方是否存在最合理的行动方案,以及如何找到合理的行动方案的理论和方法。
本文分析思考了博弈论的两个典型例子,也对博弈价格战提出了自己的看法,希望能带给大家一些启发。
关键词:
纳什均衡 非合作博弈 无限博弈
田忌赛马
战国时期,齐王和大将田忌赛马,双方各出三匹马各赛一局。
各方的马根据好坏分别称为上马、中马、下马。
田忌的马比齐王同一级的马差但比齐王低一级的马好一些。
若用同一级马比赛,田忌必然连输三局。
每局的赌注为1千金,田忌要输3千金。
田忌的谋士建议田忌在赛前先探听齐王赛马的出场次序,然后用自己的下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。
结果负一局胜两局赢得1千金。
但若事先并不知道对方马的出场次序,双方应取何种策略?
双方采用的赛马出场次序安排及相应的结果(齐王赢的千金数)可由下表所示列出。
齐王
田忌
上中下
上下中
中上下
中下上
下中上
下上中
上中下
3
1
1
—1
1
1
上下中
1
3
—1
1
1
1
中上下
1
1
3
1
—1
1
中下上
1
1
1
3
1
—1
下中上
1
—1
1
1
3
1
下上中
—1
1
1
1
1
3
由图可知,田忌赢的概率只有六分之一,孙膑只是掌握了齐王的思维定势侥幸赢了一把,在一把定胜负的时候管用,当试验的机会增多,田忌就输了。
如果赛马的规则发生变化,每个人要将自己的马严格的划分等级,上等马速度必须比中等马快,中等马必须比下等马快,且比赛时同等级的马才可以比赛的话,那么田忌就只有输的份了。
孙膑只是一时抓住了规则的某些漏洞耍了些小聪明才取得一盘的胜利,我们只对他的小聪明淡然一笑罢了。
博弈根据不同的游戏规则会产生与之相适应的策略。
囚徒的困境
有一天,一位富翁在家中被杀,财物被盗。
警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。
但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。
于是警方将两人隔离,分别关在不同的房间进行审讯。
由地方检察官分别和每个人单独谈话:
检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。
但是,我可以和你做个交易。
如果你单独坦白杀人的罪行,你将无罪释放,但你的同伙要被判10年刑。
如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他无罪释放。
但是,如果你们两人都坦白交代,那么,你们都要被判8年刑。
”斯卡尔菲丝和那库尔斯该怎么办呢?
他们面临着两难的选择——坦白或抵赖。
显然最好的策略是双方都抵赖,结果是大家都只被判1年。
但是由于两人处于隔离的情况下无法串供,所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。
因为坦白交代可以期望得到无罪释放,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。
这种策略是损人利己的策略。
不仅如此,坦白还有更多的好处。
如果对方坦白了而自己抵赖了,那自己就得坐10年牢。
太不划算了!
因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判8年,总比被判10年好。
所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
这样两人都选择坦白的策略以及因此被判8年的结局被称为“纳什均衡”,也叫非合作均衡。
因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要延长的刑期。
只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时问的监禁的结果。
有理由相信现实生活当中不是冤家不聚头。
结果第二次,第三次这两个囚徒又被抓到一起。
有了第一次教训之后他们会在接下来的审讯里做何选择呢?
这就是有限次重复的"囚徒的困境"。
博弈论里有一种倒推法来解决这个问题。
假设这个例子只重复5次,因为在狱中渡过太多的岁月之后他们都老到做不动坏事了。
我们先看第5次他们会怎么选。
显然第5次的面临的选择和第1次是一模一样的,因此没有理由相信这两个囚徒会在第5次审讯里合作。
如果第5次不合作,为什么他们会在第4次合作呢?
如此倒推,有限次重复的"囚徒的困境"和一次的结果没有任何不同,即双双坦白,入狱8年。
如果把这种体验无限延长,或至少是他们俩知道肯定还有这种事,只是不知道什么时候才能停止这种把戏,这就是无限次重复的"囚徒的困境",让我们再来看看这会不会有不同。
因为无限博弈不存在最后一次,倒推法不再适用。
假设一个人在监狱里呆久了会适应这种环境变得油滑。
因此第一个8年最长,后来再进去的8年变得只有象6年一样长,再后来是4年...。
因此这里引入一个表示监狱生活适应性指数的符号——"&",0<&<1。
这个&值越大表明对监狱生活越难适应,前一个8年和后一个8年差不多一样漫长。
如果&越小则表示这个囚犯对环境适应很快,后来呆上8年都没什么感觉了。
对于一个经常被判8年的人来说,他的受惩罚实际感受的总量是:
(-8)+&(-8)+&[&(-8)]+...。
易知,如果0<&<1,则1+&+&&+&&&+...的极限值是1/(1-&)。
假设这两个囚徒选择这样一种战略:
最开始选择抵赖,然后一直选择抵赖直到另一方选择了坦白,然后就永远选择坦白。
这样的话其中任一个囚徒选择永远抵赖的总收益是:
(-1)+&(-1)+&[&(-1)]+...=(-1)/1-&。
如果其中某一次他选择了坦白,则那一次他将获无罪释放,之后对方将用永远坦白来惩罚他,他们俩都一直被判8年。
因此总收益是:
0+&(-8)+&[&(-8)]+...=(-8&)/(1-&)。
如果要使某次坦白对其中一个囚犯有利,显然需要其中坦白一次这种选择所带来的收益(-8&)/(1-&)大于等于一直互相合作抵赖所带来的总收益(-1)/1-&,也就是&<=1/8的情况下(即某人实在认为狱中岁月妙不可言,判得久对他来说无所谓,&值极低)才会有人选择中途坦白,否则在无限次重复的"囚徒的困境"当中他们都会选择一直抵赖以使自己能尽量减少在监狱中渡过时光。
因此在无限次重复的"囚徒的困境"中最后的结果和一次或是有限次完全不同。
在很大概率上囚徒会选择合作而不是各自为战。
也就是说,在长期的双方关系中任何短视的行为都是得不偿失的。
这个结果可以用来说明为什么我们的传统文化里强调人与人的关系"以和为贵"。
数千年来中国一直是农业国家,农业人口缚系于土地,乡间邻里相对固定。
因此人们彼此之间的很多利益冲突可以用无限次重复的囚徒困境来描述。
也就是说如果某次利益是通过冲突而不是合作解决,那么失利的一方必然会设法报复,而且这种对立的情绪很有可能在后辈中延续,也就是无限次被重复,结果必然是双方都得不偿失。
此所谓"冤冤相报何时了"!
我的看法是:
现实中囚徒要考虑更多的因素,即使他们合谋决定合作,他们商量好都抵赖,但是真正面对警察的审讯时,他们又会考虑对放是否会出卖自己,他们有可能会继续出卖对方。
但是人都有报复心理的,如果一方违背了约定,虽然能很快出狱,但是若干年后呢,那位囚徒刑满释放后会放过他吗?
考虑到若干年后的情况,两个囚徒也许会都选择抵赖。
如果惩罚和奖赏的度发生改变:
两人都坦白的话,则均判刑1年;A坦白B抵赖,则A无罪释放,B判刑5年;两人都抵赖的话,则均判刑3个月,这样的情况下,两个囚徒会做怎样的选择呢?
这样两个囚徒都选择坦白的可能性比较大,毕竟一年的时间比较短,不必为了3个月的刑而冒坐牢5年的风险。
这里涉及到了风险收益不对称问题,湖北省的一些官员,明明知道某些问题存在,却坐视不理,很大的原因就是风险收益不对称,不治理问题不会太大,治理好了奖励表彰也不怎么样,治理差了要受到责怪,于是湖北就有些落后,原因就是湖北的官太聪明了。
总之,囚徒的困境涉及到的问题众多,不仅仅是心理与智力的较量,游戏规则的指定对结果产生的影响是比较明显的。
而现实中我们要考虑的相关因素会更多,博弈论只有与我们已经掌握的情况充分的结合才能得出比较满意的策略。
博弈价格战
现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。
每当看到一种家电产品的价格大战,百姓都会
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 经典 例子 课件