浙大博弈论考试题目.docx
- 文档编号:11831534
- 上传时间:2023-04-03
- 格式:DOCX
- 页数:12
- 大小:28.83KB
浙大博弈论考试题目.docx
《浙大博弈论考试题目.docx》由会员分享,可在线阅读,更多相关《浙大博弈论考试题目.docx(12页珍藏版)》请在冰豆网上搜索。
浙大博弈论考试题目
博弈论考试
1、完全信息静态博弈
1“老师点名和学生逃课”的案例
构建如下模型:
老师
点名不点名
学生逃课a1,b1a2,b2
不逃课a3,b3a4,b4
结果:
(1)老师每次点名,学生每次不逃课
a3>a1,b3>b4,a2 (2)老师每次不点名,学生每次不逃课 a4>a2,b4>b3,a1 (3)老师有时候点名,学生有时候逃课 a1 (4)老师每次不点名,学生每次逃课 a2>a4,b2>b1,a3 2市场占有者和想进入市场者 构建模型: 占有者 默认斗争 进入者进入(40,50)(-10,0) 不进入(0,300)(0,300) 没有占优战略均衡,也没有重复剔除的占优均衡。 结果: (1)占有者默认,进入者进入时,占有者会损失部分利益 (2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。 (3)占优者默认,进入者不进入,则占有者获得全部市场 (4)(斗争,不进入时,占有者仍获得全部市场。 综上存在两个纳什均衡,(进入,默认)和(不进入,斗争) 3应试教育和素质教育学生 应试教育素质教育 学校应试教育(0,0)(0,-1) 素质教育(-1,0)(1,1) (1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1), (2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1(3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1. 此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险: 另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。 4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为0,偷懒者的机会成本为1 参与人2 努力偷懒 参与人1努力9/163/8 偷懒3/81/4 (1)双方都努力的期望收益W=9/16*4-1= (2)自己偷懒对方努力: W=3/8*4= (3)自己努力,对方偷懒: 3/8*4-1= (4)双方偷懒: W=1/4*4=1 所以此博弈的收益矩阵分布为: 努力偷懒 努力 偷懒1/1 由此可见,偷懒成了最优策略 5公共物品的供给问题(基础设施的建设) B 建设不建设 A建设3,32,4 不建设4,21,1 当两者都建设时,是(3,3) 当A建设,B不建设时,(2,4),B的利益大,A损失了部分利益 当两者都不建设时,(1,1),是弱劣战略 当A不建设,B建设时,(4,2)B损失了部分利益 但是人们都是为了追求人类利益最大化的,最终会造成(不建设,不建设)的困境,也是典型的多劳不多得。 6中国政府于电信企业的博弈 政府采用的策略 不激励激励 电信企业维持原状6,67,5 技术改进5,98,7 无论电信企业采取何种战略,“不激励”都是政府的占优策略。 (1)有纳什均衡(维持原状,不激励)是非合作博弈 (2)电信维持原状,政府激励时,(7,5)政府损失部分利益 (3)电信改进,政府不采取时,(5,9)电信有损失 我们可以看出实际上(8,7)是最优战略,但他们都从“个体理性”出发,追求个人利益最大化,而得到了不好的结果。 2、过犹不及 (1)竞技体育运动员Bc指损失,a指收益 激进(概率为q)平和 运动员A激进a-c,a-c2a,0 平和0,2aa,a 当a>c,采用激进—激进纯战略纳什均衡 当a 同时出招,a-c<0时,W(A激进)=(a-c)*q+2a(1-q)为期望收益 W(A平和)=0*q+a(1-q) 当两者相等时,得出q=a/c当a增加时,q增加;c增加时,q下降 W(A平和)=a(1-q)=a(1-a/c) 画图,当a增加时,可得出c/2是一个临界点,当>c/2时,太过于激进,收益反而下降,所以运动员在竞争时,尽力是好的,但过度激进,比如服用兴奋剂,反而会使运动生涯过早的结束。 (2)卖假烟卖假烟者A 限量过量 卖假烟者B限量a,a0,2a 过量2a,0a-c,a-c C指损失,a指卖假烟的收益,分析照上面,当P=a/c时为均衡点 现在山寨是很流行的,卖假烟在一定程度上不能认为是违法行为的,有时可以缓解经济压力、充面子等,当然这只限于假烟的销量控制在一定范围内,如果过量造成假烟泛滥,则会使市场变得混乱,收益反而会下降,而贩卖假烟本身也可能因此坐牢,这是危害社会和个人的事情。 (3)腾讯QQ和360之间的竞争 QQ (退)和平相处过度竞争(进)PA 360和平相处PB0,02,0 过度竞争2,0-3,-3 E(B退)=P(A进)*0+P(A退)*0E(B进)=P(A进)*-3+P(A退)*-2 当两者相等时,得出P(A进)=P(A退)= P(B进)=P(B退)= 两者都选择和平共处时是(0,0),然而当它们都为自己的利益而过度竞争,相互斗争时,收益反而下降,它们的用户大量减少,这是双方都受损的情况,因而过度反而是不对的。 (4)对美国“”事件的态度 官员A 鹰鸽 官员B鹰2,210,0 鸽0,105,5 最好的是自己选择鹰战略,对方选择鸽战略 鸽派立足美国自身做出反思,主张从自身寻找消除恐怖主义的途径,在国际关系中奉行多边合作,促进美国发展;但鹰派相反,更加强硬,主张先发制人消除威胁,如伊拉克战争等。 可鹰派的行为并未使自身安全,他们的盟友如英国、埃及惨遭打击,他们的过激行为反而阻碍了美国前进。 “租值消散”理论指无主的、没有归属的收入,在竞争下会消散,在边际上会下降为0,如公海没有业主,钓鱼不收费,他的边际租值为0. 中国巨额的土地红利往往会带来巨大的竞争 竞争人Aa指土地红利 合作竞争c指过度竞争带来的损失 竞争人B合作a,a0,2a分析可照上面 竞争2a,0a-c,a-c 他们都是对自身利益最大化的追求,因而选择(竞争,竞争)概率很大,当过度竞争时,往往会造成贪污腐败,土地减产,价值下跌,暗箱操作等不良问题,反而使自己的投入得不到回报 对于中国土地红利,我个人认为中国国民消费过于保守,投资理念始终停留在对国有银行的存款利息,从根本上让房产投资者土地升值。 我想正是因为它的巨大红利才会造成对土地竞争者的泛滥,供小于求,使得总收益下降,只有少部分获利,贫富差距拉大,妨碍了土地的整合和规模经济,而同时土地红利会造成资源的过度使用甚至是浪费。 3、石头、剪子、布 假设A、B两人玩“石头、剪子、布”的游戏,A是说准备出石头的人,但是这并不可信。 因此两个人所出的仍然是随机的,可作如下标准式收益矩阵。 B 石头 剪刀 布 A 石头 0,0 1,-1 -1,1 剪刀 -1,1 0,0 1,-1 布 1,-1 -1,1 0,0 既然A说会出石头,他认为B受其影响极可能出“布”,则自己最好出“剪刀”,理性个人B预料到A会这么想,因此出“石头”最有利,并且A出布的可能性很小;况且如果他真的出石头,而自己再出剪刀岂不是自投罗网,显得“很没面子”,所以出剪刀的可能性最小。 如果我是A,实际上我会出“布”,因为根据以上分析,B最可能出石头,而我出“布”的胜算最大,我认为言语在利益对立的博弈中能起作用。 例子: 抛硬币。 甲乙可自行绝对所抛出的硬币为正面还是反面,若方向相同,则甲胜;若方向相反,则乙胜。 收益矩阵如图所示: 乙 正 反 甲 正 1,-1 -1,1 反 -1,1 1,-1 如果甲说他准备出“正”,理论上乙的最优仅在是出“反”,“正”的概率各位1/2,与甲不说时相同。 但实际上,言语对参与者而言打了一场心理战,甲认为乙会受影响而出“反”,他实际上很可能出“反”,乙也会意识到这点,因此他出“正”的概率反而会比“反”大。 所以我认为言语能在利益对立的博弈中起作用。 同样正如“石头、剪子、布”的游戏,A说会出石头,同样A、B两人因为这句话而打起了心理战。 4、“万元陷阱” “万元陷阱”是竞拍者利用人们对巨大利益追求的心理而从中获利的手段,(参与者都是自愿的),一旦参与者选择参与,多人竞争会使他们的喊价不断工作,组后则是鹬蚌相争,渔人得利。 参与者如果想要赢利,应该把握以下准则: 1确定投入的极限及预先的约定,譬如投资多少钱或是多少时间? 2要坚持到底(止损原则)3自己打定注意,不必看别人4保持良好的心态5别指望能以很低的价格买入6不要随波逐流,有自己的主见和底线。 7尽快传递“势在必得”的信号8合作,与他人共享,打倒其余的竞拍者。 具体事例: 1如现实生活中购买彩票,抽奖活动,赌马,赌球,股票等,这些都是所谓的“万元陷阱”。 这些活动利用了人们追求巨大利益的心理,他们为此都不断投入精力去做,但最终不一定会有等价的回报,他们通常有两种动机: 经济上和人际关系上。 想赢回自己的损失,有时却会导致更大的损失,而另一方面为了挽回失败的面子,证明自己。 2学校设立的期末奖项评比,也可看作是“万元陷阱”,为此学生想得奖来证明自己的能力,要付出很大的精力来学习,但是奖项是有限的、困难的,最终不一定会有所收获。 3企业的年终奖金评比,企业为了调动员工们的工作积极性,以年终奖来诱惑他们,员工们就陷入一种“万元陷阱”中,将不断投入精力去争取。 因此止损策略是十分重要的,它既要求我们不要无止境地把精力投放在某件事上,反而会得不偿失;又同时要求我们学会坚持到底,在确定极限后,不轻易更改,这样你就能获得最后的胜利,因此它教会我们有张有弛。 同时跟谁博弈比“怎么博弈”更加重要,“万元陷阱”中更理性的一方恰恰是损失更大的一方,虽然自己理性地选择,但是对象是属于“不理性”的,那么你最终反而会失利。 在选择竞争对手时,也要兼顾他与自己的比较,同样不能过于理性,有时要打定注意,坚持到底。 5、征税博弈 理解: 首先做一个关于征税博弈的收益树状图 A百姓 养鱼不养鱼 重税BB政府 (-2,10)(4,4)(0,0)(0,0)轻税 若政府事后违约,百姓即使养鱼仍收重税,那么百姓的实际收益反而下降,这是因为政府是强势的一方,没有关在笼子里,所以认为能建立有效的机制,把他们关在笼子里,才能增加百姓收入,建立和谐社会。 建一个收益矩阵甲 养鱼不养鱼 乙养鱼2,20,1 不养鱼1,05,5 此时有两个均衡点,但在都不养鱼的时候,是革命胜利的收益,但如果(不养鱼,不养鱼),可能会有损失的风险,往往会达成(养鱼,养鱼)的均衡,这样就革命失败了,没有完成把统治者关进笼子里的想法。 囚徒困境A 认罪不认罪 B认罪10年,10年0,20 不认罪20,01,1 他们都是从自我利益出发,A会想假定B认罪,他不认罪要判20年,B不认罪,他不认罪要判1年,综上认罪比不认罪要好,他们两人都这么想,结果得到一个相对较劣的结果。 在希望把统治者关进笼子里时,不同的人都从自己的利益出发,不愿直接和统治者相抗衡,想等其他人革命而暗中得利,但每个人都是这么想的,因而无法实现把统治者关进笼子里的愿望。 同时要注意是否可行,比如给猫挂铃铛的故事,老鼠们为了反抗统治者相出这么个自认为可行的方法,但这是个人利益最大化和集体利益最大化的矛盾。 如何做: 1统治者获胜的关键在于他能离间所有人之间的关系,也就是如果想推翻他,就要学会团结,认识到统治者在损害自身利益,全体集中反抗。 2猫本身是一个暴者,统治者在危害人民利益,因而可从笼子方面着手,建立有效的法律机制,人质机制,让政府守信。 3人民掌握监督权,统治者只享受有限的权力,减少腐败的可能迫使统治者关注人民的利益,对人民负责。 4关注贫富差距,统治者在征税时要区别富人和穷人的征税额度。 5健全福利保障。 6雇主与雇员的监督博弈 (1)记雇主检查的概率为P,雇员偷懒的概率为q Y主检查=(-C+F)*q+(V-W-C)*(1-q) Y主不检查=-W*q+(V-W)*(1-q) 当Y主检查=Y主不检查时,得出q=C/(W+F) Y员偷=-F*P+W*(1-P),Y员不偷=(W-H)*P+(W-H)*(1-P) 当Y员偷=Y员不偷时,P=H/(W+F) (2)由上可知,在混合战略纳什均衡时,雇主Y检查=Y不检查 所以Y主=P*Y检查+(1-P)*Y不检查=Y不检查=V-W-q*V=V-W-CV/(W+F) (Y主),=-1+CV/(W+F)2 当Y主,=0时,W=(VC)1/2-F 所以综上,W=(VC)1/2-F时,雇主的期望收益是最大的。 (3)与不能没收雇员的抵押金F相比,雇主检查的概率与雇员偷懒的概率q都下降了,因为当没收抵押金时,雇员偷懒所造成的经济损失增加,就不敢偷懒,而雇主也知道雇员不敢偷懒,自然检查也就松懈了。 (4)怎样建立信任机制: 他们可以通过增加工资,改善工作环境,完善员工的福利保障制度,增加年终奖金,多与下属员工进行良好的平等沟通,密切关系等。 (5)是,应禁止收取抵押金。 因为收取抵押金不利于创造和谐的工作环境,甚至影响雇主和员工之间的关系,会在一定程度上带给员工内心的恐惧与不安全感,这是不符合社会福利最大化标准的。 并且根据计算,雇主得到最大利益时,收取抵押金Y员=(VC)1/2-F-H,不收取时为Y员=(VC)1/2-H,可见雇员的工资收益也有所降低。 7合法伤害权的价值 具有合法伤害权的是处于博弈的优势方,不具有合法伤害权的处于博弈的劣势方。 权力越大,越能带来巨大的经济利益,对自己越有利。 以上述例子作一个收益矩阵: 设贪污的钱为A,检查成本为B,C为贪污后的处罚成本,设贪污的概率为P,检查的概率为Q。 贪污P不贪污1-P Q检查(C+A-B,-C)(-B,0) 1-Q不检查(-A,A)(0,0) Y查=(C+A-B)*P+(-P)*(-B)=-A*P 即P=B/(2A+C) -C*Q+(1-Q)*A=0,P=A/(A+C) 当贪污的P大于B/2A时,检查时最优选择。 上述例子中,得益的都是贪污的人,打1拳代表的是官权,只要有权,不行使也能得利,如新闻中局长付德武要求他的弟弟将罪名全部承担,而弟弟迫于贪官的权力而被迫承担下来。 贪官可以利用自己的权力采用“双规”手段对付别人,使自己得利,博弈双方是权力者和无权力者,而这个权力就是迫使别人低头用的,有能力压迫别人做某事,但不一定真的耍手段,他要压迫别人,只要有这个权力即可,这就是均衡。 在这里博弈是多重的,各种利益的博弈,规则与人性的博弈,个体与规则的博弈,贪官为了追求更大的利益而运用合法伤害权,同时摒弃了规则与人性,在一种潜规则下与人达成了均衡,它的本质是为了谋利,当一方具有合法伤害别人的权力时,他会充分利用来达到使自己收益最大化的目的,而他们贿赂贪官,除了想得利,也是希望他们不迫害自己。 8ForWhomtheBellTolls 枪打出头鸟的收益矩阵,分为甲乙造反、不造反 甲 造反不造反 乙造反(-1,-1)或(1,1)(-1,-1) 不造反(1,1)(-2,-2) 从收益矩阵中可以看出(不造反,不造反)是均衡点,可造反的人若是失败,则收益为负;若是成功,躲在后面的人也会跟着得利,造反的人不论是哪种情况,都是没有好处的。 因为理性群体哦都市向往自身利益最大化,他们绝不愿未出力的人跟着得益,因而最终得到均衡点(不造反,不造反),所以说“枪打出头鸟”,哪些率先造反的人往往要做出很大牺牲。 也可以做一个猎人和鸟的收益矩阵,更清晰地表示“枪打出头鸟”。 鸟鸟 出头不出头 猎人打(0,0)(-10,-10) 不打(0,10)(5,5) 所以猎人在鸟出头的时候最好的决策就是打,猎人指的是“暴政者”,出头的鸟指“造反的人”。 躲在后面的鸟仍然要付出代价。 出头鸟为前瞻者,追随者为前瞻者,前者没有积累足够的经验,损失很大;而后者为了前者的铺垫,懂得如何规避,所以他们得到很大的利益,但不能说他们就没有损失。 躲在后面的鸟就是不造反的人,在反对压迫者时只要大多数人同时行动,很容易成功,但有人躲在后面,意味着造反的人要付出很大的代价,同时意味着造反很可能失败,那么躲在后面的人仍然要受剥削者的压迫,集体的利益受到损害,个人利益也会受到牵连。 枪打出头鸟的经典案例: 智猪博弈,是多劳不多得 小猪 行动等待 大猪行动5,14,4 等待9,-10,0 从矩阵中可以看出小猪的占优策略是等待,而大猪是行动,却分了部分利益给小猪,这是一种“搭便车”的行为。 而躲在后面的鸟会有两种情况,一种出头鸟成功,后人得益;另一种出头鸟失败了,后面的人不得不再次面对出不出头的困境,并继续深受暴政者的压迫。 9皇帝与功臣 第一种情况有纯战略纳什均衡(杀,造反),皇帝损益为0,功臣损益为0 第二种情况纯战略纳什均衡不存在谢林点,因此分析混合战略均衡,得到皇帝杀的概率为1/2,功臣造反的概率为1/2,皇帝损益-1/2,功臣损益1/2 第三种情况有纯战略的纳什均衡(不杀,不造反),皇帝损益为1,功臣损益为1. 当功臣实力越强,就越可能造反;当功臣实力为中时,皇帝与功臣期望损益最少。 明末安史之乱为第一种情况,宋朝赵匡胤“杯酒释兵权”为第三种情况,而林彪造反为第二种情况。 能传递。 因为功臣实力越弱,皇帝不杀的可能性越高。 历史上这样的例子很多,如安禄山、范蠡等,功臣可以通过告老还乡、交出自己的大权;或者“装傻充愣”,不要显得比皇帝聪明,多多巴结讨好皇帝,有时候学会犯些小错误。 皇帝传递自己是强的,可以这样做: 政治上,励精图治,开明,获取民心,得到百姓的拥戴: 严惩贪官污吏,以达到杀一儆百的目的;在军事上,集中兵权,相对削弱功臣的兵权,只给其一定的指挥权,并严格选拔优秀的军事将领,加强巩固边防,训练士兵,开发新式武器。 经济上,减免苛捐杂税,鼓励耕织,放松从商限制,鼓励通商,并可利用此建立良好的外交,并培养大批人才为己用。 这样皇帝强了,功臣就弱了,功臣认为自己造反成功的概率减小,就不敢造反了。 采取哪些有效的机制: 1民主与法制的完美结合,皇帝不能单靠暴力手段统治天下。 要有一定的机构制约皇帝的权力,皇帝应懂得“取信于民”的重要性,依法治民。 2健全福利保障制度,充分改善百姓生活,获得民心,巩固自己的地位,从制度上保证执政党的利益与人民一致。 3通过民主选举,轮流选出百姓心目中真正能力强的人当领袖,民主领导大众,人民当家作主,人人平等,建立社会主义。 10印象最深或收获最大的内容。 刚走进课堂,老师您幽默风趣的讲解深深吸引了我,我对博弈论有了初步的了解,在这门课上,我接触了一个全新的领域,从许多真实而鲜活的例子中,我感觉到博弈论与我们的生活息息相关,学会了一种新的思考方式——博弈思考,如强盗分金币、万元陷阱等,非常有趣,反常规思考,采用了逆向思考的方法,也让我在以后的社会竞争中记住要反常规出牌,要能学会预测趋势,做到知己知彼。 我从博弈论这门课中得到许多启迪: 第一点: 说真话骗人。 这是一个有趣而又发人深省的现象。 一方面揭示了信任缺失的可悲现状,一方面也提供了一种极为巧妙地方法。 在我知道你不会相信我,于是我故意说出真实的情况,你不信我,因而就达成了欺骗的目的,也就取胜了。 如老师上课所举的“曹操败走华容道”的例子,事实上在当代经济、政治等方方面面领域都是受用的。 第二点: 在博弈中,若希望得到对方的信任,关键是让其相信双方利益时一致的,就像老师上课时所讲的“公主与侍卫的选择”这个例子,只有当他们两人目标一致时,才能得到自己想要的结果。 现实社会中亦是如此,每个人首先都要为自己的利益考虑,从自身出发,若两人的利益产生冲突,则合作也就破产了,沟通的有效性往往来自于利益的一致性,就比如国家外交,公司之间的合作经营等,都是如此。 有句话曾这样说过: “没有永远的朋友,只有永远的利益。 ”这固然有些势利,但也确实如此,利益或许可以成为合作的前提,同时在合作后建立真正的信任,这对我的启发很大,在现代竞争型社会中,利益的冲突不可避免,你不能一味排斥,尽可以从善如流。 第三点: 博弈论在生活中的应用。 以前一直觉得博弈论离我的生活很远,但上了蒋老师的课后,发现生活中处处都在博弈。 就比如价格战博弈,通常我们买衣服时都会讲价,而一开始我们最好把价格压得低一些,老板觉得不合理就讨价还价,最终找到一个我们都能接受的均衡点,还譬如我的收入与支出,自己和朋友、同学之间的交往等等,我们应该从中找到最理想的方式使收益达到最高。 而在现代社会中做生意想要成功同样需要博弈,因而博弈论在生活中的应用是很广泛的。 感谢博弈论这门课为我开拓了一个全新的领域,也谢谢蒋老师您生动有趣的上课方式! ! 40 社科1008班 黄露 周二晚的课
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浙大 博弈论 考试 题目