动态规划法求解生产及存储问题Word格式.docx
- 文档编号:19737426
- 上传时间:2023-01-09
- 格式:DOCX
- 页数:15
- 大小:67.22KB
动态规划法求解生产及存储问题Word格式.docx
《动态规划法求解生产及存储问题Word格式.docx》由会员分享,可在线阅读,更多相关《动态规划法求解生产及存储问题Word格式.docx(15页珍藏版)》请在冰豆网上搜索。
表示x(k)的允许决策集合决策变量简称决策。
。
4.策略
决策组成的系列称为策略(policy)。
由初始状态x1开始的全过程的策略记作
.
由第k阶段的状态x(k)开始到终止状态的后部子过程的策略
;
k=2,…,n-1.
可供选择的策略有一定的范围,称为允许策略集合(setofadmissblepolices),用
等表示。
5.状态转移方程
在确定性过程中,一旦某阶段的状态和决策为已知,下阶段的状态偏完全可以确定。
用状态转移方程(statetransferequations)表示这种演变规律,写作:
6.阶段指标函数
对于k阶段的状态x(k),当执行了决策
时,除带来系统状态的转移之外,还产生第k阶段的局部利益,它是总效益的一部分,称为阶段指标函数(stageeffectivefuction),记作
7.过程指标函数
用来衡量策略或者是子策略执行效果的数量指标称为过程指标函数(processeffectivefuction),它定义在所有k后部子过程上,常用用
表示,即
k=1,2,…,n.
当k=1时,就是全过程指标函数。
如果状态x(k)和子策略
给定,那么
也就被确定了,所以
是x(k)和
的函数,记为:
常见的过程指标函数是连和形式或连积形式:
8.最优指标函数
过程指标函数
的最优值称为最优指标函数(optimumeffectivefuction),记为f(x(k).它表示,采取了最优子策略
之后,后部子过程所获得的总效益,表示为:
式中opt是optimization的缩写,意为最优化,可以根据具体问题去max或min
三·
动态规划法的最优性原理和基本函数方程
在动态规划中起核心作用的是最优性原理:
“作为整个过程的最优策略具有这样的性质,无论过去的状态和决策如何,相对于前面决策所形成的状态而言,余下的决策系列必须构成最优子策略。
”
动态规划解法的关键在于给出一种递推关系,一般把这种关系称为基本函数方程,
注意到无后效性,最优指标函数为
当k=n时,由于x(n+1)是整个决策过程的终止状态,以后不再做出决策,因此,
这样就得到了可以用来递推的基本函数方程:
f(x(n+1))=0.
类似的,可以得到乘法形式的基本函数方程:
f(x(n+1))=1.
四·
建立动态规划模型的基本步骤
1.阶段;
2.状态变量及可能状态集合;
3.决策变量及允许决策集合;
4.状态转移方程;
5.阶段指数函数;
6.基本函数方程;
建立动态规划模型基本上是上面6个步骤,按上述顺序逐步确定1~6的内容。
五·
动态规划法的递推方向及求解形式
1.递推解法
基本方程:
f(x(n+1))=0
状态转移方程为
计算步骤是,利用终端条件从k=n开始由后向前递推基本方程,求得各阶段的最优决策和最优函数,最后算出f(x
(1)时就得到了最优决策系列
再按照状态转移方程
从k=1开始确定
,k=1,2,…,n}为最优轨迹线,
为最优策略。
2.顺推解法
使用顺推解法时,一些概念的含义须做相应调整。
状态变量x(k)表示第k阶段末系统的形态·
状况,最优值函数f(x(k))表示从第一阶段到第k阶段总效益的最优值,状态转移方程为
基本函数方程为
f(x(0))=0或1
3.求解形式
求解动态规划问题,一般有两种形式:
解析形式和表格形式,解析形式是利用函数的解析表达式,在每个阶段用经典求极值的方法得到最优解。
表格形式是指各阶段的计算过程均在表格中进行,这种形式便于分析和比较,操作过程直观且简练,适用于没有解析表达式的离散型问题。
4.动态规划的适用条件
适用动态规划的问题通常应满足如下3点:
最优化原理(最优子结构性质)。
如果问题的最优解所包含的子问题的解也是最优的,就称该问题具有最优子结构性质,即满足最优化原理。
由于对于有些问题的某些递归式来讲并不一定能保证最优化原则,因此在求解问题时有必要对它进行验证。
若不能保持最优原则,则不可以应用动态规划法求解。
在得到最优解的递归式之后,需要执行回溯以构造最优解。
无后效性。
应用动态规划法的一个重要条件就是将各阶段按照一定的次序排好,阶段i的状态只能由阶段i+1的状态来确定,与其他状态没有关系,尤其是于未发生的状态没有关系。
换言之,每个状态都是“过去历史的一个完整总结”。
这就是无后效性。
子问题的重叠性。
子问题的重叠性是指在利用递归算法自顶向下对问题进行求解时,每次产生的问题并不总是新问题,有些子问题可能会被重复计算多次。
动态规划法正是利用子问题的这种重叠性质,对每一个问题只计算一次,然后将其计算结果保持起来,当再次需要计算已经计算过的子问题时,只要简单的查看一下以往的计算结果,从而获得较高的解题效率。
子问题的的重叠性并不是动态规划适用的必要条件,但是如果该性质无法满足,动态规划算法同其他算法相比就无优势可言了。
5.解决问题的步骤
利用动态规划法求解问题的算法通常包含如下几个步骤。
分析。
对原始的问题进行分析,找到问题的最优解的结构特征。
分解。
将所给问题按时间或空间特征分解成相互关联的阶段,并确定出计算局部最优解的递推关系,这是利用动态规划法解决问题的关键和难点所在。
需要注意的是,分解后的各个阶段一定是有序的或者是可以排序的,即无后向性。
否则问题就无法用动态规划求解。
阶段之间相互联系方式是通过状态和状态转移体现的。
每个阶段通常包含若干个状态,可以描述问题发展到这个阶段时所处在的一种客观情况。
每个阶段的状态都由以前阶段的状态以某种方式“变化”来的,这样的“变化”称为状态转移。
状态转移是导出状态的途径,也是联系各阶段的方式。
解决。
对于每个阶段通过自底向上的方法求得局部最优解。
由于这一步骤通常是通过递推实现的,因此,需要递推终止条件或边界条件。
合并。
将各个阶段求出的解合并为原问题的解,即构造一个最优解。
动态规划的主要难点在于理论的设计,特别是递推关系的建立,一旦设计完成,实现部分就会非常简单。
整个求解过程就可以使用一个最优决策表的二维数组来描述,其中行表示决策的阶段,列表示问题状态,表格需要填写的数据一般对应此问题的在某阶段某个状态下的最优值,如最短路径,最长公共子序列,最大价值等。
填表的过程就是根据递推关系从1行1列开始,以行或者列优先的顺序,依次填写表格。
最后根据整个表格的数据通过简单的取舍或者运算求得问题的最优解。
总之,动态规划算法的关键在于解决冗余,是一个以空间换时间的技术,所以它的空间复杂度要大于其他的算法。
六·
动态规划问题在问题中的具体实现
例如:
动态规划规划在生产存储中的运用
生产存储问题是生产活动中经常遇到的问题。
大批量生产可以降低成本,但当产量大于销量时就会造成产品积压而增加库存费用;
单纯按市场要求安排生产也会因为开工不足或加班加点造成生产成本增加。
因此合理利用存贮资源调节产量,满足要求是十分有意义的。
生产与存贮问题是一个生产部门如何在已知生产成本,存贮费用和各阶段市场要求的条件下,决定各个生产阶段的产量,使得计划期内的费用之和最小。
现设有一个生产部门,生产计划周期为n个阶段,已知最初库存量为x1,阶段需求量为dk,单位产品的消耗费用是lk,单位产品的阶段库存费用为hk,仓库容量为mk,阶段生产能力为bk,生产固定成本为
问如何安排现阶段的产量,使计划期内的费用综合为最小?
该问题本身就是一个多阶段决策问题,设状态变量为xk为k阶段初的库存量,由于计划期初的库存量x1已知,计划期末的库存量通常也是给定的,为简单起见,假定x(n+1)=0,于是状态变量xk的约束条件是:
决策变量uk选为阶段k的产量,它满足的约束条件是:
,它满足无后效性的要求。
阶段效用由两阶段组成,一部分为生产费用,另一部分为存贮费用,即:
动态规划基本方程为:
七.设计题目:
某机床厂
根据合同,在一至四月份为客户生产某种机床。
工厂每月的生产能力为10台,机床可以库存,存储费用为每台每月0.2万元,每月需要的数量及每台机床的生产成本如下表。
试确定每月的生产量,要求既能满足每月的需求,又能使生产成本和存储费用之和达到最小。
表需求量及生产成本
月份
1
2
3
4
需求(台)
6
7
12
生产成本(万元/台)
7.2
8
7.6
1.构造动态规划模型
阶段变量k
把每个月作为一个阶段,k=1,2,3,4
状态变量
选择每个阶段的库存量为状态变量
,可满足无后效性,由已知条件可知:
x1=x5=0,单位为台
决策变量
设每个阶段的生产量为决策变量
,由已知条件得0≤
≤10台,
状态转移方程
状态转移方程为:
=
+
-
(
是第k阶段的市场需求量)
阶段指标
第k阶段的指标费用:
)=0.2
+y(i)
>
0)i=1,2,3,4.
或
+0(
=0)
其中y1=7,y2=7.2,y3=8,y4=7.6,单位为万元
2.建立基本方程
设最优值函数
是从第k阶段的
状态出发到过程终结的最小费用,按动态规划方法的逆序解基本方程又:
[
)+
](k=4,3,2,1)
F5(x5)=0
3.逆序逆推计算
k=4时
按照问题的各种约束条件,确定状态变量x4的取值范围。
按穷举法的思路,在量化的精度内,确定状态变量x4的全部可能取值。
状态转移方程x5=x4+u4-d4
又x5=0,d4=6所以有x4+u4=6
又因为每个月的最大生产能力为10台。
第1,2,3月的需求量为6,7,12台,故x4=0,1,2,3,4,4台
对x4的的确定取值,分别求出决策变量u4的取值范围
当x4=0,u4=6;
x4=3,u4=3
x4=1,u4=5;
x4=4,u4=2
x4=2,u4=4;
x4=5,u4=1
由此可知x4与u4是一一对应的,即对于每个确定的状态,只有一种决策,故这唯一决策的结果是最优的。
利用第四阶段的基本方程进行计算:
F4(x4)=min[v4(x4,u4)+f5(x5)]
=min[v4(x4,u4)]
=v4(x4,u4)
=0.2x4+7.6u4(u4>
0)或=0.2x4(u4=0)计算结果列表1
表1k=4时
45.6
5
38.2
30.8
23.4
16
8.6
k=3时
因为d3=12,d4=6,x1=x5=0,d1=7.每月的最大生产能力为10台,故2≦x3≦7
当x3=2,u3=10
x3=3,u3=10,9
x3=4,u3=10,9,8
x3=5,u3=10,9,8,7
x3=6,u3=10,9,8,7,6
x3=7,u3=10,9,8,7,6,5
状态变量x3的一个取值,对应决策变量u3的六个可能取值,要求分别计算出各个u3取值相应的指标函数值,再挑选其中的最小值为这个状态的最优指标函数值,f3(0).
下面利用第三阶段的基本方程进行计算。
F3(x3)=min【v3(x3,u3)+f4(x4)】
其中v3(x3,u3)=0.2x3+8u3(u3>
0)或v3(x3,u3)=0.2x3(u3=0)
状态转移方程x4=x3+u3-12计算结果位于表2
表2表2k=3时
10
80.4
126
80.6
118.8
9
72.6
118.2
80.8
111.6
72.8
111
64.8
110.4
81
104.4
73
103.8
65
103.2
57
102.6
81.2
97.2
73.2
96.6
65.2
96
57.2
95.4
49.2
94.8
81.4
90
73.4
89.4
65.4
88.8
57.4
88.2
49.4
87.6
41.4
87
k=2时
确定x2的取值范围
因为x1=0,0≦u1≦10,且d1=6,且x3≧2
因此0≦x2≦4即x2=0,1,2,3,4.
对于x2的每个确定值,分别求出u2的可能取值
X2=0时,u2=10,9
X2=1时,u2=10,9,8
X2=2时,u2=10,9,8,7
X2=3时,u2=10,9,8,7,6
X2=4时,u2=10,9,8,7,6,5
基本方程f2(x2)=min[v2(x2,u2)+f3(x3)]
其中v2(x2,u2)=0.2x2+7.2u2(u2>
0)或v2(x2,u2)=0.2x2(u2=0)
状态方程x3=x2+u2-3
注:
对上面的u2取值解释。
本来x2=0时,u2可取值为10,9,8,7.
但由于每个月的最大生产能力为10台且d3=12,所以x3必须大于2台,因此u2取值只能为10,9.
同理对于x3取其他可能值,也应考虑到x3必须大于2台,计算结果如下表3.
表3k=2
72
190.2
190.8
72.2
182.6
183.2
57.8
183.6
72.4
175
175.6
58
176.2
50.8
176.8
167.4
168
58.2
168.6
51
169.2
43.8
169.8
159.8
65.6
160.4
58.4
161
51.2
161.6
44
162.2
36.8
162.8
k=1时
确定x1的取值范围
X1=0
确定u1的取值范围
因为d1=6,x1=0。
故6≦u1≦10
所以u1=10,9,8,7,6
基本方程f1(x1)=min[v1(x1,u1)+f2(x2)]
其中v1(x1,u1)=x1+7u1(u1>
0)或v1(x1,u1)=x1(u1=0)
状态转移方程:
x2=x1+u1-6
计算结果列于下表4中:
表4k=1
70
229.8
63
230.4
56
231
49
231.6
42
232.2
求全过程最优指标函数与最优化策略
由k=1.可以求出其全过程最优指标函数f1(x1);
由k=1至k=4各表,可以依次求出第1,2,3,4各阶段的最优策略,进而得到最优策略。
由表1可知。
在年初无库存的情况下,四个月的最小费用f1(0)为229.8万元。
且第一阶段的最优决策u1=10台,第一阶段末即第二阶段初的最优库存x2=4台。
根据x2=4台查表3可知,第二阶段的最优决策u2=10台,因此库存x3=7台。
根据x3=7台,查表2得,第三阶段的最优决策u3=5台,因此x4=0台,查表1得u4=6台。
这样到最后一个月恰好无库存,即x5=0。
综上所述,该生产与存储问题的最优化安排是:
第1个月生产10台,费用为70万元;
第2个月生产10台,费用为72.8万元;
第3个月生产5台,费用为41.4万元;
第4个月生产6台,费用为45.6万元。
一至四月的生产与存储费用最小为229.8万元。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 求解 生产 存储 问题