第8章动态规划第1,2节.ppt
《第8章动态规划第1,2节.ppt》由会员分享,可在线阅读,更多相关《第8章动态规划第1,2节.ppt(77页珍藏版)》请在优知文库上搜索。
1、1第1节 多阶段决策过程及实例第2节 动态规划的基本概念和基本方程运筹学(第三版)运筹学教材编写 组第8章 动态规划的基本方法清华大学出版社2第8章 动态规划的基本方法 第1节 多阶段决策过程及实例 第2节 动态规划的基本概念和基本方程 第3节 动态规划的最优性原理和最优性定理 第4节 动态规划和静态规划的关系3 动态规划(Dynamic Programming)是运筹学的一个重要分支,它是解决多阶段决策过程最优化的一种方法。美国数学家贝尔曼(R.E.Bellman)等人在50年代初提出了解决多阶段决策问题的“最优性原理”(Principle of Optimality)。1957年贝尔曼出版
2、了专著“动态规划”,该书是动态规划的第一本著作。目前动态规划已经用于解决最优路径问题、资源分配问题、生产调度问题、设备更新问题、复合系统可靠性问题及生产过程最优控制等,并且取得了显著的效果。4 动态规划是用来解决多阶段决策过程最优动态规划是用来解决多阶段决策过程最优化的一种数量方法。其特点在于,它可以把一化的一种数量方法。其特点在于,它可以把一个个n 维决策问题变换为几个一维最优化问题,从维决策问题变换为几个一维最优化问题,从而一个一个地去解决。而一个一个地去解决。需指出:动态规划是求解某类问题的一种需指出:动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种算方法,是考察问题的
3、一种途径,而不是一种算法。必须对具体问题进行具体分析,运用动态法。必须对具体问题进行具体分析,运用动态规划的原理和方法,建立相应的模型,然后再规划的原理和方法,建立相应的模型,然后再用动态规划方法去求解。用动态规划方法去求解。5第1节 多阶段决策过程及实例 在生产经营活动中,某些问题决策过程可以划分为若干相互联系的阶段,每个阶段需要做出决策,从而使整个过程取得最优。12n状态状态决策决策状态状态决策决策状态状态状态状态决策决策6 各个阶段不是孤立的,而是有机联系的,也就是说,本阶段的决策将影响过程下一阶段的发展,从而影响整个过程效果,所以决策者在进行决策时不能够仅考虑选择的决策方案使本阶段最优
4、,还应该考虑本阶段决策对最终目标产生的影响,从而做出对全局来讲是最优的决策。多阶段决策问题中,各个阶段一般是按照时间来划分的,随着时间的发展而产生各个阶段的决策,从而形成决策序列,这就是动态的含义。7 在一些与时间无关的静态问题中(如非线性规划等),可以人为地赋予时间的概念,使其成为一个多阶段决策问题,再用动态规划方法处理。当每个阶段的决策确定以后,全部过程的决策就是这些阶段决策所组成的一个决策序列,所以多阶段决策问题也称为序贯决策问题。8例例1 最短路线问题 给定一个线路网络,两点之间连线上的数字表示两点之间的距离(或费用),试求一条由A到G的铺管线路,使总距离为最短(或总费用最小)。C4A
5、B2B1C3C2C1D3D2D1E3E2E1F1F2G5313638766852255223333366344189例2.机器负荷分配问题 某种机器可以在高低两种不同的负荷下进行生产。某种机器可以在高低两种不同的负荷下进行生产。在高负荷下进行生产时,产品的年产量在高负荷下进行生产时,产品的年产量g和投入生产和投入生产的机器数量的机器数量u1的关系为的关系为g=g(u1),这时,机器的年完这时,机器的年完好率为好率为a,即如果年初完好机器的数量为,即如果年初完好机器的数量为u,到年终,到年终完好的机器就为完好的机器就为au,0a1。在低负荷下生产时,产品的年产量在低负荷下生产时,产品的年产量h和
6、投入生产的机和投入生产的机器数量器数量u2的关系为的关系为 h=h(u2),相应的机器年完好率,相应的机器年完好率b,0 b0)xi0 i=1,2,30 i=1,2,34433123122334s1|2|3|4 ss ss ss xcxxx 阶段 223112ss xsxsc 按问题的变量个数划分阶段,把它看作一个按问题的变量个数划分阶段,把它看作一个三阶段决策问题,三阶段决策问题,k=1,2,345 设状态变量为设状态变量为s1,s2,s3,s4并记并记s1=c 取问题中的变量取问题中的变量x1,x2,x3为决策变量为决策变量 状态转移方程为:状态转移方程为:s3=x3s3+x2=s2s2+
7、x1=s1=c 允许决策集合为:允许决策集合为:x3=s30 x2s20 x1s1 各阶段指标函数为:各阶段指标函数为:v1(x1)=x1v2(x2)=x22v3(x3)=x3,各指标函数以乘,各指标函数以乘积方式结合积方式结合 46 最优指标函数fk(sk)表示从第k阶段初始状态sk出发到第3阶段所得到的最大值,则动态规划基本方程为:1)(1,2,3 )()(max)(4411)(sfksfxvsfkkkksDxkkkkk47 状态转移方程状态转移方程为:为:s3=x3 s3+x2=s2 s2+x1=s1=c 指标函数为:指标函数为:v1(x1)=x1 v2(x2)=x22 v3(x3)=x
8、322222222223302232202222032*22(2)f()m ax()()=m ax()=m ax()=4/27 x2/3xsxsxssvxfsxfsxxsxss333333334433*33(1)f()max()()=max(1)xxsxssvxfsxss11111111220121031104*1(3)f()m ax()()=m ax()=m ax(4()/27)=/64 x/4xscxcxcsvxfsxfcxxcxcc2223222222222222223232(032620 xsxsxxsxxsxsxs222222222令 hd h由d x得 舍 去)dh又d xdh而
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章动 规划