运筹学-10、对策论PPT推荐.ppt
- 文档编号:15437461
- 上传时间:2022-10-31
- 格式:PPT
- 页数:81
- 大小:1.22MB
运筹学-10、对策论PPT推荐.ppt
《运筹学-10、对策论PPT推荐.ppt》由会员分享,可在线阅读,更多相关《运筹学-10、对策论PPT推荐.ppt(81页珍藏版)》请在冰豆网上搜索。
两个儿童玩的两个儿童玩的“石头石头剪子剪子布布”游戏游戏和我国古代的和我国古代的“齐王赛马齐王赛马”就是典型的对策论研就是典型的对策论研究的例子。
究的例子。
在这类行为中,参加斗争或竞争的各方各自在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益,为了达到各自的目标和具有不同的目标和利益,为了达到各自的目标和利益各方必须考虑对手的各种可能的行动方案,利益各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案,并力图选取对自己最为有利或最为合理的方案,对策论就是研究对策行为中斗争各方是否存在着对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
动方案的数学理论和方法。
4二、二、对策问题的三个基本要素对策问题的三个基本要素(11)局中人局中人:
在一场竞赛或斗争中,每一个有在一场竞赛或斗争中,每一个有决策权的参与者决策权的参与者(个人或集团个人或集团)称为一个局中人。
只称为一个局中人。
只有两个局中人的对策现象称为有两个局中人的对策现象称为“两人对策两人对策”,而多,而多于两个局中人的对策称为于两个局中人的对策称为“多人对策多人对策”。
(2)策略策略:
一个对策中,每个局中人都有供他:
一个对策中,每个局中人都有供他选择的实际可行的完整的行动方案,我们把一个局选择的实际可行的完整的行动方案,我们把一个局中人一个可行的自始至终通盘筹划的行动方案,称中人一个可行的自始至终通盘筹划的行动方案,称为这个局中人的一个为这个局中人的一个策略策略。
如果在一个对策中,每。
如果在一个对策中,每个局中人都只有有限个策略,则称为个局中人都只有有限个策略,则称为“有限对策问有限对策问题题”,否则称为,否则称为“无限对策问题无限对策问题”。
5(3)赢得函数(支付函数)赢得函数(支付函数):
一局对策结束时:
一局对策结束时的结果(如收入或支出)称为的结果(如收入或支出)称为得失得失。
每个局中人在。
每个局中人在一局对策结束时的得失,不仅与该局中人自身所选一局对策结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全体局中人所取定的一组策择的策略有关,而且与全体局中人所取定的一组策略有关。
所以,一局对策结束时每个局中人的略有关。
所以,一局对策结束时每个局中人的“得得失失”是全体局中人所取定的一组策略的函数,通常是全体局中人所取定的一组策略的函数,通常称作称作赢得函数赢得函数(支付函数)(支付函数)。
把每个局中人各自所。
把每个局中人各自所取的一个策略所组成的策略组称为取的一个策略所组成的策略组称为“局势局势”,于是,于是“得失得失”是是“局势局势”的函数。
的函数。
6第二节第二节矩阵对策的基本定理矩阵对策的基本定理特点特点:
局中人只有局中人只有两人两人,分别用分别用局中人局中人和和局局中人中人表示,表示,双方都只有有限个策略可供选择,双方都只有有限个策略可供选择,局中人的局中人的“得失得失”相加等于零,这种对策称为相加等于零,这种对策称为“零和对策零和对策”。
在两人有限零和对策中,。
在两人有限零和对策中,局中人局中人的的所获等于所获等于局中人局中人的所失。
假定在局势的所失。
假定在局势(i,j)下下(即即局中人局中人取策略取策略i,局中人局中人取策略取策略j时所形成的局时所形成的局势势),局中人局中人的收入或赢得是的收入或赢得是aij(“aij”是负数时,是负数时,表示表示局中人局中人是支出)。
是支出)。
的策略集为:
一、矩阵对策的数学模型一、矩阵对策的数学模型7用矩阵表示为用矩阵表示为(称为称为局中人局中人的的赢得矩阵赢得矩阵或局中人或局中人的的支付矩阵支付矩阵):
我我们们称称两两人人有有限限零零和和对对策策为为矩矩阵阵对对策策,记记为为:
GG,;
SS11,S,S22;
AA或或GGSS11,SS22;
AA。
8例例1:
设有设有矩阵对策矩阵对策,局中人,局中人的支付矩阵如下:
的支付矩阵如下:
如果各局中人都不想冒险,必须考虑对方会如果各局中人都不想冒险,必须考虑对方会选择策略使他得到最差的收入。
因此各局中人都选择策略使他得到最差的收入。
因此各局中人都选择理智的决策行为。
选择理智的决策行为。
解:
331439局中人局中人的各种策略的最差收入是支付阵中各的各种策略的最差收入是支付阵中各种策略所对应行的最小数。
如果不存侥幸心理,他种策略所对应行的最小数。
如果不存侥幸心理,他对每个策略只能期望得到最差的收入。
即:
对每个策略只能期望得到最差的收入。
那么为了得到尽可能好的结局,只能从这些最那么为了得到尽可能好的结局,只能从这些最小数之中的找最大者(小数之中的找最大者(最大的最小者最大的最小者),即选择能),即选择能在最差的可能结果中得到最好结果的策略。
在最差的可能结果中得到最好结果的策略。
8,2,9,3即选择策略即选择策略2。
10同样,局中人同样,局中人的各种策略的最差收入(最的各种策略的最差收入(最大支出)是支付矩阵中各列的最大数,即:
大支出)是支付矩阵中各列的最大数,即:
局中人局中人选择这些最大数中的最小者。
选择这些最大数中的最小者。
16,2,5即选择策略即选择策略2。
的最优策略为的最优策略为2,的最优策略为的最优策略为2。
11定义定义:
设设GGSS11,SS22;
AA为矩阵对策为矩阵对策,其中其中SS1111,22,mm,SS2211,22,nn。
A=A=(aij)mmnn,若满足等式若满足等式:
则称纯局势则称纯局势(i*i*,j*j*)为为GG在纯策略下的解在纯策略下的解(或平衡局势)。
记(或平衡局势)。
记VVGGai*j*i*j*,称,称VVGG为对策为对策GG的值的值,i*i*,j*j*分别称为局中人分别称为局中人II、IIII的最优纯策略。
的最优纯策略。
例例1的对策的对策GG的解为的解为(22,22),),22,22分别是局中人分别是局中人II和和IIII的最优纯策略,的最优纯策略,VVGG=2=2。
从从例例11中中可可以以看看出出,矩矩阵阵的的元元素素a2222既既是是所所在在行行的最小元素,又是所在列的最大元素,即:
的最小元素,又是所在列的最大元素,即:
12定理定理1:
矩阵对策矩阵对策A=(aij)mmnn有解的充分必要有解的充分必要条件是:
条件是:
存在存在纯局势纯局势(i*i*,j*j*),使得对一切使得对一切i=1,2,i=1,2,m,j=1,2,m,j=1,2,n,n均有均有:
i=1,2,3,4;
j=1,2,3将将这一事一事实推广到一般矩推广到一般矩阵对策,可得如下定理:
策,可得如下定理:
证明:
先证充分性,由于对任意先证充分性,由于对任意i,j均有:
均有:
故:
13另一方面,对任意另一方面,对任意i,j均有:
所以:
于是:
14再证必要性,若再证必要性,若G有解。
有解。
而对于所有的而对于所有的i而言,必存在一个而言,必存在一个i*使:
使:
对于所有的对于所有的j而言,必存在一个而言,必存在一个j*使:
因为:
15称满足条件称满足条件的的(i*,j*)为矩阵对策为矩阵对策G的一个的一个鞍点鞍点。
但:
于是有:
故对一切的故对一切的i,j都有:
都有:
意义:
如果如果局中人局中人II选择策略选择策略i*,局中人局中人IIII不不选择策略选择策略j*,而选择策略,而选择策略j,则,则局中人局中人IIII的支付的支付只会增多。
也就是说:
策略只会增多。
策略j*是是IIII的最优策略。
的最优策略。
16注意:
注意:
一个矩阵对策一个矩阵对策G如果存在鞍点,鞍点如果存在鞍点,鞍点可能不止一个。
但是在不同的鞍点处,支付值相可能不止一个。
但是在不同的鞍点处,支付值相等,都等于对策的值。
(等,都等于对策的值。
(无差异性无差异性)如果如果(i,j)以及以及(k,ll)都是对策都是对策G的鞍点,的鞍点,则则(k,j)与与(i,ll)也是该问题的鞍点。
(也是该问题的鞍点。
(可交可交换性换性)同样,如果同样,如果局中人局中人IIII选择策略选择策略j*,局中人局中人II不选择策略不选择策略i*,而选择策略,而选择策略i,则,则局中人局中人II的的所获只会减少。
策略所获只会减少。
策略i*是是局中人局中人II的的最优策略。
最优策略。
17G有四个鞍点:
有四个鞍点:
对策的值为对策的值为VVGG5。
例例2:
给定矩阵对策给定矩阵对策GGSS11,SS22;
AA,其中:
,其中:
18二、二、矩阵对策的混合策略矩阵对策的混合策略矩阵对策矩阵对策G有鞍点时,就存在最优解有鞍点时,就存在最优解(最优纯策最优纯策略略),但是否一切矩阵对策问题中,各局中人都有,但是否一切矩阵对策问题中,各局中人都有上述意义的最优纯策略呢上述意义的最优纯策略呢?
答案是否定的。
例例1:
石头、剪刀、布石头、剪刀、布不存在上述纯策略意义下的解。
不存在上述纯策略意义下的解。
19对于该例而言,直观的看:
双方采用三个纯对于该例而言,直观的看:
双方采用三个纯策略的频率均应为策略的频率均应为13:
13:
13。
由于。
由于每个局中人在一局对策中必取某个纯策略,因此每个局中人在一局对策中必取某个纯策略,因此采取任何一个纯策略的概率都应是采取任何一个纯策略的概率都应是13。
一般地,设局中人一般地,设局中人II以概率以概率x1,x2,,xm来分来分别选取他的纯策略别选取他的纯策略11,22,mm;
而局中人;
而局中人IIII以以概率概率y1,y2,,yn来选用自己的纯策略来选用自己的纯策略11,22,nn。
。
令令x=(x1,x2,,xm)T,y=(y1,y2,,yn)T则称这样的则称这样的x和和y为为局中人局中人II、IIII的的混合策略混合策略。
20记:
记:
此时,当局中人此时,当局中人II以概率以概率xi采用采用i时,局中人时,局中人IIII以概率以概率yj采用采用j时时,支付,支付aij出现的概率为出现的概率为xiyj。
于是局中人于是局中人II收入(赢得)的期望值为:
收入(赢得)的期望值为:
则称则称GGSS11,SS22;
E
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 10 策论
![提示](https://static.bdocx.com/images/bang_tan.gif)