第七章运筹学动态规划PPT文档格式.ppt

文档编号：14125718
上传时间：2022-10-19
格式：PPT
页数：63
大小：612.50KB

《第七章运筹学动态规划PPT文档格式.ppt》由会员分享，可在线阅读，更多相关《第七章运筹学动态规划PPT文档格式.ppt（63页珍藏版）》请在冰豆网上搜索。

第七章运筹学动态规划PPT文档格式.ppt

本章习题.参考资料:

见前言.学时分配:

6学时.,前言:

动态规划是最优化的一个分支,它是解决多阶段决策过程最优化的一种方法.动态规划的创始人是美国数学家贝尔曼（R.Bellman）.它在四十年代后期和五十年代初期在美国兰德公司工作,针对一些多阶段决策问题提出了解决这类问题的最优化原理,并在1957年出版了动态规划的第一本书Dynamicprogramming.在企业管理方面,动态规划可以解决库存问题,资源分配问题,设备更新问题,运输问题,生产过程最优控制问题.它的弱点是,根据最优化原理建立的动态规划基本方程,尚无统一的解法,而要根据其数学结构灵活处理;

此外,变量个数不能太多,否则计算量太大,这称为维数问题.,第一节多阶段决策问题及实例,所谓多阶段决策问题,是指一个大问题可以划分为若干个阶段,每个阶段形成一个子问题,各个阶段是互相联系的,每个阶段都要作出决策,并且一个阶段的决策确定以后会影响下一阶段的决策,从而影响整个过程的活动路线.各个阶段所确定的决策构成一个决策序列,称为一个策略,对于不同的策略其效果不同（效果可以用数量来衡量）.多阶段决策问题就是选择一个最优策略,使在给定的标准下达到最好的效果.,典型例题:

例1多阶段网络的最短路,状态1,状态2,状态3,状态4,终点,例题特点:

阶段:

如图的阶段,分为四段;

状态:

顶点;

决策:

选弧;

转移:

从一个顶点走到另一个顶点;

目标:

路长最短.,例2资源分配问题,设有数量x的某种资源,将它投入两种生产A,B.若以y投入生产A,剩下的x-y投入生产B,则收入函数为g（y）+h（x-y）,如果生产后可以回收再生产,其回收率分别为0a,b1,则在第一阶段生产后回收的总资源为再将投入生产A,B,若以分别投入生产A,B则又可得收入因此两阶段的总收入为,如果上面的过程进行了n个阶段,而且我们希望选择使n个阶段的总收入最大,问题变为,例题特点:

年（月）,状态:

资金数,决策:

分配给A的资金数,转移:

效益:

n个阶段的总收入最大,第二节最优化原理与动态规划基本方程,一.动态规划的基本概念,阶段（stage）:

是指一个问题需要作出决策的步骤,用k表示阶段数,k称为阶段变量.通常以时间作为阶段变量.,状态（state）:

状态表示在任一阶段所处的位置,通常一个阶段有若干个状态,描述过程状态的变量称为状态变量,第k阶段的状态变量用表示.状态变量取值的全体称为状态空间或状态集合.,在例1中各阶段的状态变量集合如下:

注意:

状态变量是动态规划中最关键的一个参数,它既反映前面各阶段决策的结局,又是本阶段作出决策的出发点,状态是动态规划问题各阶段信息的传递点和结合点.,决策（decision）:

决策是指某阶段状态给定后,从该阶段演变到下一阶段某状态的选择.决策变量表示第k阶段状态为时对方案的选择.表示k阶段状态为时决策允许的取值集合.例如:

例1中,策略（policy）和子策略（subpolicy）:

动态规划问题各阶段决策组成的序列总体称为一个策略.,是n个阶段DP的一个策略.,状态转移律:

从的某一状态值出发,当决策变量的取值决定后,下一阶段状态变量的取值也随之确定.这种从上一阶段的某一状态值到下一阶段某一状态值的转移规律称为状态转变移律.可表示为,指标函数（indexfunction）:

指标函数是用来衡量实现过程优劣的一种数量指标.它是从状态出发至过程最终,当采取某种策略时,按预定标准得到的效益值,这个值既与有关,又与以后所选取的策略有关,它是两者的函数,称为过程指标函数,记为特别地,仅第k阶段的指标函数,可记为,最优指标函数:

是指对某一确定状态选取最优策略后得到的指标函数值,也就是对应某一最优子策略的某种效益度量,这个度量值可以是成本,产量,距离等等.对应于从状态出发的最优子策略的效益值记为,其中optimization是最优化的意思,在具体问题中,可以是最小化（min）也可以是最大化（max）.,二.最优化原理与动态规划基本方程,贝尔曼（R.Bellman）最优化原理:

作为整个过程的最优策略具有这样的性质,无论过去的状态和决策如何,对先前决策所形成的状态而言,余下的诸决策必构成最优策略.,根据这一原理,计算动态规划问题的递推关系式（逆序法）称为动态规划基本方程:

其中,称为边界条件.,用动态规划求解例1:

动态规划基本方程为:

2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f5（E）=0,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D1）=5,f5（E）=0,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f4（D1）=5,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C1）=8,f4（D1）=5,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C2）=7,f4（D1）=5,f3（C1）=8,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f3（C1）=8,f3（C2）=7,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f2（B1）=20,f3（C2）=7,f3（C1）=8,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f2（B1）=20,f3（C2）=7,f3（C1）=8,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f2（B3）=19,f3（C2）=7,f3（C1）=8,f2（B1）=21,f2（B2）=14,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f2（B3）=19,f3（C2）=7,f3（C1）=8,f1（A）=19,f2（B2）=14,f2（B1）=21,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f2（B3）=19,f3（C2）=7,f3（C1）=8,f1（A）=19,f2（B2）=14,f2（B1）=21,状态最优决策状态最优决策状态最优决策状态最优决策状态,A（A，B2）B2（B2，C1）C1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f2（B3）=19,f3（C2）=7,f3（C1）=8,f1（A）=19,f2（B2）=14,f2（B1）=21,状态最优决策状态最优决策状态最优决策状态最优决策状态,A（A，B2）B2（B2，C1）C1（C1，D1）D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4（D2）=2,f5（E）=0,f3（C3）=12,f4（D1）=5,f2（B3）=19,f3（C2）=7,f3（C1）=8,f1（A）=19,f2（B2）=14,f2（B1）=21,状态最优决策状态最优决策状态最优决策状态最优决策状态,A（A，B2）B2（B2，C1）C1（C1，D1）D1（D1，E）E从A到E的最短路径为19，路线为AB2C1D1E,第三节离散确定型动态规划模型的求解,例2资源分配问题:

某公司有五套先进设备,需分配给下属的甲,乙,丙三个工厂,各工厂得此设备后每年为公司上缴的利润如下表,问如何分配可使公司获得最大利润?

解:

将问题按三个工厂分为三个阶段,即k=1,2,3.,根据最优化原理得出动态规划基本方程:

动态规划的求解方法通常是采取逆序解法,即从第三阶段向前推导.,最优方案一:

甲厂0台,乙厂2台,丙厂3台;

最优方案二:

甲厂2台,乙厂2台,丙厂1台.最大盈利值为21万元.,第四节连续确定型动态规划模型的求解,例3（p208例5）,解:

阶段变量是以年作为化分单位,k=1,2,3.状态变量为k年初可用于工作的完好机器数.决策变量为第k年用于完成A项任务的机器数,则为用于完成B项任务的机器数.状态转移方程是动态规划基本方程及边界条件为,当k=3时,当k=2时,当k=1时,第五节一般数学规划模型的动态规划解法,用动态规划解数学规划的方法是:

把依次决定各个变量的取值看成是一个多阶段决策问题,因而模型中含有几个变量,就分为几个阶段,用状态变量表示数学规划中约束条件右边常数项,它表示可分配的资源数.,例3某投资者有40万元的固定资本,他可以在三种不同的投资机会中投资（股票,银行,土地）投资额为x,y,z.假定他做过预测,知道每项投资可获得的效益分别为问如何分配投资额,才能获得最大效益.,解:

依题意,列出数学模型,设,为决策变量,阶段变量为k,k=1,2,3.,为状态变量,即投放到第k个项目上的资金数.状态转移律为,效益函数为,.动态规划基本方程为,K=3,这是单增的线性函数,它在区间右端点取得最大值,显然,时,上式有最大值,.,K=2,设,求其极大值,为极小值点,则,当k=1时,若,=,为一常数,不存在极值,舍去.若,设,1600.,例4用动态规划求解非线性规划,解:

把确定的值看作两个阶段的决策,即k=1,2.状态变量为k阶段初约束条件右边项的剩余值,分别用表示,于是,动态规划的递推方程为,当k=2时,第六节背包问题,背包问题的提法:

一个徒步旅行者,有n种物品供他选择后装入背包中,这n种物品的编号为1,2,n.已知第j种物品的重量为公斤,这一物品对他的使用价值为,又知该旅行者所能承受的总重量不超过a公斤,问该旅行者如何选择这n种物品的件数,使得