对策论_精品文档PPT文件格式下载.ppt
- 文档编号:15491914
- 上传时间:2022-11-02
- 格式:PPT
- 页数:70
- 大小:1.02MB
对策论_精品文档PPT文件格式下载.ppt
《对策论_精品文档PPT文件格式下载.ppt》由会员分享,可在线阅读,更多相关《对策论_精品文档PPT文件格式下载.ppt(70页珍藏版)》请在冰豆网上搜索。
比赛即将开始,孙膑说:
“现在用您的下等马对付他们的上等马,拿您的上等马对付他们的中等马,拿您的中等马对付他们的下等马。
”三场比赛完后,田忌一场不胜而两场胜,最终赢得齐王的千金赌注。
对策论,引言对策现象的三要素对策问题分类对策问题举例,对策问题三要素,对策问题进行数学分析,需要建立对策问题的数学模型,简称对策模型。
对策模型都包括三个要素局中人策略集赢得函数,局中人(Players)在一个对策行为中,有权决定自己行动方案的对策参加者。
“田忌赛马”中局中人是齐王和田忌通常用I表示局中人的集合,如果有n个局中人,则I=1,2,n一般要求一个对策中至少有两个局中人局中人具有广泛性,除了可以理解为个人外,还可以理解为集体,如球队,交战方,企业等。
在对策中利益完全一致的参加者只能看出一个局中人,如拖拉机中虽然四人参加,但2个局中人对策论中对局中人的一个重要假设是:
每个局中人都是理智的,不存在侥幸心理。
策略集(Strategies)一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。
一个局中人全体策略构成的集合,称为此局中人的策略集。
参加对策的每一个局中人i的策略集记为Si,一般每一个局中人的策略集中至少有两个策略。
在田忌赛马中,(上,中,下)表示参赛顺序,即为一个策略。
田忌和齐王各自都有六个策略:
(上,中,下),(上,下,中)(中,上,下),(中,下,上),赢得(支付)函数(payofffunction)各局中人分别选定自己的策略构成的策略组称为一个局势。
假设si是第i个局中人的一个策略,则n个局中人的策略形成的策略组s=(s1,s2,sn)就是一个局势。
当局势出现后,对策的结果也就确定了。
对于局势s,局中人i可以得到一个赢得值(损失值)Hi(s),它是局势s的函数,称为局中人i的赢得函数,在田忌赛马中局中人集合I=1,2齐王和田忌的策略集合可分别用S1=1,6,S2=1,6齐王的任一策略i和田忌的任一策略j就构成了一个局势sij如果1=(上,中,下),1=(上,中,下),则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢得为H2(s11)=-3,对策问题举例:
市场购买力争夺问题,据预测,某乡镇下一年的饮食品购买力将有4000万元。
乡镇企业和中心城市企业饮食品的生产情况是:
乡镇企业有特色饮食品和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两类产品。
他们购买这一部分购买力的结局表如下。
乡镇企业和中心城市企业应如何选择对自己最有利的产品策略。
对策问题举例:
费用分摊问题,假设沿某一河流有相邻的3个城市A,B,C,各城市可单独建立水厂,也可合作兴建一个大水厂。
经估算,合建一个大水厂,假设铺设管道费用要比单独见3个小水厂的总费用少。
但合建大厂的方案能否实施,显然要看总的建设费用分摊得是否合理。
如果某城市分摊到的费用比它单独建设水厂的费用还多的话,它显然不会接收合作的方案。
问题是如何合理地分摊费用,使合作兴建大水厂的方案得以实现。
拍卖问题,最常见的一种拍卖形式是先由拍卖商把拍卖品描述一番,然后提出第一个报价。
接下来由买者报价,每一次报价都要比前一次高,最后谁出的价最高拍卖品即归谁所有。
假设有n个买主给出的报价分别为p1,p2,pn且不妨设pnpn-1p1,则买主n只要报价略高于pn-1,就能买到拍卖品,即拍卖品实际上是在次高价格上卖出的。
现在的问题是,各买主之间可能知道他人的价格,也可能不知道他人的估价,每人应如何报价对自己能以较低价格得到拍卖品最为有利?
最后的结果又会怎样?
囚犯难题,设有两个嫌疑犯因涉嫌某一大案被警官拘留,警官分别对两人进行审讯。
根据法律,如果两个人都承认此案是他们干的,则每个人各判刑7年;
如果两人都不承认,则由于证据不足,两人各判刑1年;
如果只有一人承认,则承认者予以宽大释放,而不承认者将判刑9年。
因此,对两个囚犯来说,面临一个在“承认”和“不承认”这两个策略间进行选择的难题。
对策的分类,对策的分类:
1)按局中人的多少分为二人对策和多人对策。
2)按策略集中策略的有限或无限,分为有限对策和无限对策。
3)按各局中人赢得函数的代数和是否为零,分为零和对策和非零和对策。
我们主要学习的矩阵对策是指二人、有限、零和对策。
对策论,矩阵对策的基本定理矩阵对策的纯策略矩阵对策的混合策略矩阵对策的基本定理,矩阵对策的纯策略,矩阵对策是指二人有限零和对策。
只有两个参加对策的局中人每个局中人都有有限个对策可供选择在任一局势之下,两个局中人的赢得之和总是等于0,双方的利益总是激励对抗的。
“田忌赛马”就是一个矩阵对策的例子用、分别表示两个局中人,并设局中人有m个纯策略1,2,m可供选择,局中人有n个纯策略1,2,n可供选择。
即局中人、的策略集分别为S1=1,2,mS2=1,2,n当剧中人选定纯策略i和局中人选定纯策略j后,就形成了一个纯局势(i,j)。
显然,这样的纯局势共有mn个。
对任一纯局势(i,j),记局中人的赢得值为aij,,称A为局中人的赢得矩阵(或局中人的支付矩阵)由于假定对策为零和,故局中人的赢得矩阵为-A。
当局中人,、策略集S1,S2及局中人的赢得矩阵A确定后,一个矩阵策略就给定了。
通常,记为G=,;
S1,S2;
A或G=S1,S2;
A,在田忌赛马中,齐王的赢得表为,赢得矩阵为当矩阵对策模型给定后,各局中人面临的问题便是:
如何选择对自己最有利的纯策略以取得最大的赢得(或最少损失?
),例:
设有一矩阵对策G=S1,S2;
A,其中由A可以看出,局中人的最大赢得是9,要想得到这个赢得,他就得选择策略3;
由于假定局中人也是理智的竞争者,他考虑到局中人打算出3的心理,便准备以3对付之,使局局中人不但得不到9,反而失掉10.,局中人当然也会猜到局中人的这种心理,转而出4来对付,使局中人得不到10,反而失掉6;
如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方必然会设法使自己所得最少这一点,就应该从各自可能出现的最不利情形中选择一个最有利的情形作为决策一句。
这就是所谓的“理智行为”,也是对策双方实际上可以接收并采取的一种稳妥的方法。
局中人在各纯策略下可能得到的最少赢得分别为-8,2,-10,3,其中最好的结果为2.因此,无论局中人选择什么样的纯策略,局中人只要以2参加对策,就能保证他的收入不会少于2,而出其他任何策略,都有可能使局中人的收入少于2,甚至输给对方。
同理,对局中人来说,各种策略可能带来的最不利结果是:
9,2,6,其中最好的也是2,即局中人只要选择策略2,无论对方采取什么样的纯策略,他所失值都不会超过2,而选择任何其他的纯策略都有可能使自己的所失超过2.,上述分析表明,局中人、的“理智行为”分别是选择纯策略2和2,这时局中人的赢得值和局中人的所失值的绝对值相等,局中人得到了起预期的最少赢得2,而局中人也不会给局中人带来比2更多的赢得。
局中人I按最大最小原则,局中人按最小最大原则。
相互竞争使对策出现了一个平衡局势(2,2),这个局势是双方均可接收的,且对双方来说都是一个最稳妥的结果。
因此,2和2分别是局中人、的最优策略。
定义1:
设G=S1,S2;
A,其中S1=1,m,S2=1,n,A=(aij)mn,若成立,记其值为VG=ai*j*则称VG为对策的值。
上式成立的纯局势(i*,j*)为G在纯策略意义下的解(或平衡局势)称i*,j*分别为局中人、的最优纯策略。
从例中可以看出,矩阵A中的平衡局势(2,2)对应的元素a22即是所在行的最小元素,又是所在列的最大元素,即有ai2a22a2ji=1,2,3,4j=1,2,3将这一事实推广到一般矩阵对策,可得定理1:
矩阵对策G=S1,S2;
A在纯策略下有解的充要条件是:
存在纯局势(i*,j*),使得对任意i和j,有矩阵A的鞍点(对策的鞍点)(saddlepoint,orequilibriumpoint),一个平衡局势(i*,j*)应具有这样的性质:
当局中人I选择了纯策略i*后,局中人II为了使其所失最少,只能选择策略j*,否则他就可能失得更多;
反之,当局中人II选择了纯策略j*后,局中人I为了得到最大的赢得也只能选择纯策略i*,否则就会赢得更少双方竞争在局势(i*,j*)下到了一个平衡状态。
例:
设有矩阵对策G=S1,S2;
A,其中直接在A上计算,有i*=1,3;
j*=2,4故(1,2)(1,4)(3,2)(3,4)都是对策的解,且VG=5.,由此可知,一般对策的解可以是不唯一的,当解不唯一时,解之间的关系具有两条性质:
性质1:
(无差别性)若(i1,j1)和(i2,j2)是对策G的两个解,则性质2:
(可交换性)若(i1,j1)和(i2,j2)是对策G的两个解,则(i1,j2)和(i2,j1)也是对策G的解。
矩阵对策的混合策略(RondomizedorMixedStrategies),在一个矩阵对策G=S1,S2;
A中,局中人I能够保证的至少赢得是局中人II能保证的至多损失为一般,局中人I的赢得不会多于局中人II的损失,故总有v1v2当v1=v2时,矩阵对策在纯策略下有解,且v1=v2=VG,然而,实际中出现的更多情形中是v14=v1,于是,当双方各根据从最不利情形中选择有利的原则时,应分别选择2和1,局中人I的赢得为5,比其预期的至少赢得v1=4还多,原因在于局中人II选择了1,使局中人得到了本不该得到的赢得,故1对局中人II来说并不是最优的,他会考虑选择2局中人I会采取相应的办法,改出1使赢得为6,而局中人II又可能仍出1来对付局中人I的1这样局中人I出12,II出12的可能性都不排除。
对两个局中人来说,不存在一个双方都可以接收的平衡局势,即不存在纯策略意义下的解。
既然局中人没有纯策略意义下的解,没有最优策略可以出,是否可以给出一个选择不同策略的概率分布。
例如,局中人I可以制定这样一个策略:
分别以概率x和1-x选取纯策略12,称这种策略为混合策略。
同样,局中人II也制定一个混合策略:
分别以概率y和1-y选取纯策略12,,定义2:
设有矩阵对策G=S1,S2;
A,其中S1=1,m,S2=1,n,A=(aij)mn,记S1*=xEm|xi0,i=0,1,m;
xi=1S2*=yEn|yj0,j=0,1,n;
yj=1则称S1*,S2*为局中人I和II的混合策略集(或策略集);
对xS1*和yS2*,称x和y为混合策略(或策略);
(x,y)混合局势(或局势)局中人I的赢得函数记为E(x,y)=xTAy=aijxiyj称G*=S1*,S2*;
E为对策G的混合扩充,可以看出,纯策略是混合策略的一种特殊情况。
一个混合策略x=(x1,x2,xm)可以理解为:
如果进行多局对策G的对话,局中人I分别选取纯策略1,2,m的频率;
如果只进行一次对策,则反映局中人I对各纯策略的偏爱程度。
两个局中人如前所述进行理智对策,则当局中人I选择混合策略x时,他的预期所得(最不利的情形)是,因此局中人I应选取xS1*,使得,同理,局中人II可保证的所失期望值至多是显然,v1v2。
定义3:
G*=S1*,S2*;
E为矩阵对策G=S1,S2;
A的混合扩充,如果则称VG为对策G的值,称使上式成立的混合局势(x*,y*
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 策论 精品 文档