动态规划总结Word格式文档下载.docx
- 文档编号:14258255
- 上传时间:2022-10-21
- 格式:DOCX
- 页数:8
- 大小:25.81KB
动态规划总结Word格式文档下载.docx
《动态规划总结Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《动态规划总结Word格式文档下载.docx(8页珍藏版)》请在冰豆网上搜索。
从1949年开头,Bellman在兰德公司(RANDCorporation)开头了他对动态规划的讨论,当时髦没有动态规划这一名词,此称呼是后来Bellman命名的。
Bellman最为核心的工作就是给出了动态规划的最优性原理。
此处有重要的文献,即1953,1954年发表在Bull.Amer.Math.Soc.和OperationsResearch上的几篇重要论文,包括像Thetheoryofdynamicprogramming,SomeApplicationsoftheTheoryofDynamicProgramming-AReview。
具有标志性意义的是1957年PrincetonUniversityPress出版的DynamicProgramming,这标志着动态规划理论的正式建立。
之后,Bellman的讨论始终活跃到20世界60年月,其间对于动态规划应用范围的扩展做了一系列的讨论工作,也有不少重要论文,此处不再排列。
3.后Bellman时代
在基本的理论体系建立之后,动态规划进入了一个全面进展的时期,讨论工作也有多个方向,总结来看,一是理论体系的一般化,二是修正原有理论的某些条件,包括像最优性原理来顺应某些特别的新问题。
这一阶段的讨论工作相当庞杂,此处很难逐个排列,简洁举几个分支。
一是对于所谓维数灾的讨论,二是在大规模可分非线性整数规划问题中的应用,三是模糊动态规划,四是与其他数学领域像偏微分方程的交叉讨论等等。
此种划分纯粹是在下出于历史先后上的考虑而作出的,从学科内容上来说,可能不太合理。
但是对于初级讨论者理清基本脉络我想是有关心的。
2.动态规划的概念意义
动态规划问世以来,在经济管理、生产调度、工程技术和最优掌握等方面得到了广泛的应用。
例如最短路线、库存管理、资源安排、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为便利。
虽然动态规划次要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只需人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法便利地求解。
动态规划程序设计是对解最优化问题的一种途径、一种方法,而不是一种特别算法。
不像搜寻或数值计算那样,具有一个标准的数学表达式和明确清楚的解题方法。
动态规划程序设计往往是针对一种最优化问题,由于各种问题的性质不同,确定最优解的条件也互不相同,因而动态规划的设计方法对不同的问题,有各具特色的解题方法,而不存在一种万能的动态规划算法,可以处理各类最优化问题。
因而读者在学习时,除了要对基本概念和方法正确理解外,必需详细问题详细分析处理,以丰富的想象力去建立模型,用制造性的技巧去求解。
我们也可以通过对若干有代表性的问题的动态规划算法进行分析、争论,渐渐学会并把握这一设计方法。
多阶段决策过程的最优化问题。
含有递推的思想以及各种数学原理(加法原理,乘法原理等等)。
在现实生活中,有一类活动的过程,由于它的特别性,可将过程分成若干个相互联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到最好的活动效果。
当然,各个阶段决策的选取不是任意确定的,它依靠于当前面临的形态,又影响以后的进展,当各个阶段决策确定后,就组成一个决策序列,因而也就确定了整个过程的一条活动路线,如图所示:
(看词条图)这种把一个问题看作是一个前后关联具有链状结构的多阶段过程就称为多阶段决策过程,这种问题就称为多阶段决策问题。
1.多阶段决策问题假如一类活动过程可以分为若干个相互联系的阶段,在每一个阶段都需作出决策(实行措施),一个阶段的决策确定以后,经常影响到下一个阶段的决策,从而就完全确定了一个过程的活动路线,则称它为多阶段决策问题。
各个阶段的决策构成一个决策序列,称为一个策略。
每一个阶段都有若干个决策可供选择,因而就有很多策略供我们选取,对应于一个策略可以确定活动的效果,这个效果可以用数量来确定。
策略不同,效果也不同,多阶段决策问题,就是要在可以选择的那些策略两头,选取一个最优策略,使在预定的标准下达到最好的效果.2.动态规划问题中的术语阶段:
把所给求解问题的过程恰当地分成若干个相互联系的阶段,以便于求解,过程不同,阶段数就可能不同.描述阶段的变量称为阶段变量。
在多数状况下,阶段变量是离散的,用k表示。
此外,也有阶段变量是连续的情形。
假如过程可以在任何时辰作出决策,且在任意两个不同的时辰之间允许有无穷多个决策时,阶段变量就是连续的。
在前面的例子中,第一个阶段就是点A,而其次个阶段就是点A到点B,第三个阶段是点B到点C,而第四个阶段是点C到点D。
形态:
形态表示每个阶段开头面临的自然情况或客观条件,它不以人们的客观意志为转移,也称为不行控因素。
在上面的例子中形态就是某阶段的动身位置,它既是该阶段某路的起点,同时又是前一阶段某支路的起点。
在前面的例子中,第一个阶段有一个形态即A,而其次个阶段有两个形态B1和B2,第三个阶段是三个形态C1,C2和C3,而第四个阶段又是一个形态D。
过程的形态通常可以用一个或一组数来描述,称为形态变量。
一般,形态是离散的,但有时为了便利也将形态取成连续的。
当然,在现实生活中,由于变量形式的限制,全部的形态都是离散的,但从分析的观点,有时将形态作为连续的处理将会有很大的好处。
此外,形态可以有多个重量(多维情形),因而用向量来代表;
而且在每个阶段的形态维数可以不同。
当过程按全部可能不同的方式进展时,过程各段的形态变量将在某一确定的范围内取值。
形态变量取值的集合称为形态集合。
无后效性:
我们要求形态具有下面的性质:
假如给定某一阶段的形态,则在这一阶段以后过程的进展不受这阶段以前各段形态的影响,全部各阶段都确定时,整个过程也就确定了。
换句话说,过程的每一次实现可以用一个形态序列表示,在前面的例子中每阶段的形态是该线路的始点,确定了这些点的序列,整个线路也就完全确定。
从某一阶段以后的线路开头,当这段的始点给定时,不受以前线路(所通过的点)的影响。
形态的这共性质意味着过程的历史只能通过当前的形态去影响它的将来的进展,这共性质称为无后效性。
决策:
一个阶段的形态给定以后,从该形态演化到下一阶段某个形态的一种选择(行动)称为决策。
在最优掌握中,也称为掌握。
在很多问题中,决策可以自然而然地表示为一个数或一组数。
不同的决策对应着不同的数值。
描述决策的变量称决策变量,因形态满意无后效性,故在每个阶段选择决策时只需考虑当前的形态而无须考虑过程的历史。
决策变量的范围称为允许决策集合。
策略:
由每个阶段的决策组成的序列称为策略。
3.@求动态规划的经典例子及分析
动态规划有许多种,但基本思想是一样的。
就是对于一个问题,假如它的解包含了它的子问题的解。
(即要解出这个问题就必需解出它的子问题)。
那么就可以依据它与子问题的关系得到一个形态转移方程。
但动态规划的意义在于,假如多个子问题都包含相同的“子子问题”,那么这个“子子问题”就会被重新计算许多次,用动态规划,我们把这个“子子问题”的解求出并储存下来,再次遇到的时候就不必再次计算。
所以可以省下很多时间。
经典的动态规划题目有:
0-1背包、装箱问题等。
这些问题的具体解答分析我就不赘述了,网上有很多材料,LZ可以搜寻一下。
4.关于动态规划算法,哪位可以讲一下本人心得体会
动态规划的特点及其应用安徽张辰动态规划阶段动态规划是信息学竞赛中的常见算法,本文的次要内容就是分析它的特点。
文章的第一部分首先探究了动态规划的本质,由于动态规划的特点是由它的本质所打算的。
其次部分从动态规划的设计和实现这两个角度分析了动态规划的多样性、模式性、技巧性这三个特点。
第三部分将动态规划和递推、搜寻、网络流这三个相关算法作了比较,从中探寻动态规划的一些更深层次的特点。
文章在分析动态规划的特点的同时,还依据这些特点分析了我们在解题中应当怎样利用这些特点,怎样运用动态规划。
这对我们的解题实践有肯定的指点意义。
动态规划是编程解题的一种重要的手段,在如今的信息学竞赛中被应用得越来越普遍。
最近几年的信息学竞赛,不分大小,几乎每次都要调查到这方面的内容。
因而,如何更深化地了解动态规划,从而更为有效地运用这个解题的有力武器,是一个值得深化讨论的问题。
要把握动态规划的应用技巧,就要了解它的各方面的特点。
首要的,是要深化洞悉动态规划的本质。
§
1动态规划的本质动态规划是在本世纪50年月初,为了处理一类多阶段决策问题而诞生的。
那么,什么样的问题被称作多阶段决策问题呢?
1.1多阶段决策问题说到多阶段决策问题,人们很简单举出下面这个例子。
[例1]多段图中的最短路径问题:
在下图中找出从A1到D1的最短路径。
认真观看这个图不难发觉,它有一个特点。
我们将图中的点分为四类(图中的A、B、C、D),那么图中全部的边都处于相邻的两类点之间,并且都从前一类点指向后一类点。
这样,图中的边就被分成了三类(Aà
B、Bà
C、Cà
D)。
我们需要从每一类中选出一条边来,组成从A1到D1的一条路径,并且这条路径是全部这样的路径中的最短者。
从上面的这个例子中,我们可以也许地了解到什么是多阶段决策问题。
更精确的定义如下:
多阶段决策过程,是指这样的一类特别的活动过程,问题可以按时间挨次分解成若干相互联系的阶段,在每一个阶段都要做出决策,全部过程的决策是一个决策序列[1]。
要使整个活动的总体效果达到最优的问题,称为多阶段决策问题。
从上述的定义中,我们可以明显地看出,这类问题有两个要素。
一个是阶段,一个是决策。
1.2阶段与形态阶段:
将所给问题的过程,按时间或空间特征分解成若干相互联系的阶段,以便按次序去求每阶段的解。
常用字母k表示阶段变量。
[1]阶段是问题的属性。
多阶段决策问题中通常存在着若干个阶段,如上面的例子,就有A、B、C、D这四个阶段。
在一般状况下,阶段是和时间有关的;
但是在许多问题(我的感觉,特殊是信息学问题)中,阶段和时间是无关的。
从阶段的定义中,可以看出阶段的两个特点,一是“相互联系”,二是“次序”。
阶段之间是怎样相互联系的?
就是通过形态和形态转移。
形态:
各阶段
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 总结