当前位置:首页 >> 工学 >>

运筹学动态规划


动态规划(Dynamic Programming)
动态规划是美国数学家Bellman创立的。Bellman50年代执教于普林 斯顿和斯坦福大学,后进入兰德(Rand)研究所。1957年发表 “Dynamic Programming”一书,标识动态规划的正式诞生。 动态规划是解决复杂系统优化问题的一种方法。是解决动态系统多 阶段决策过程的基本方法之一。

第八章 动态规划的基本方法 第一节:动态规划的研究对象和引例
动态系统:包含随时间变化的因素和变量的系统。线性系统、非线性系统。 (系统在某个时刻的状态,往往要依某种形式、受过去某些决策的 影响,而系统的当前状态和决策又会影响系统过程今后的发展。) 动态决策问题:将时间作为决策变量之一的决策问题称为动态决策问题。 动态决策问题的特点:在动态决策问题中,系统所处的状态和时刻是进行 决策的重要因素,即在系统发展的不同时刻(或阶段)根据系统所处 的状态,不断地做出决策,找到不同时刻的的最优决策以及整个过程 的最优策略。

多阶段决策问题:是动态决策问题的一种特殊形式。在多阶段决策过 程中,系统的动态过程可以按照时间进程分为相互联系而又相互 区别的各个阶段,而且在每个阶段都要进行决策。目的是使整个 过程的决策达到最优效果。 决策
状态 状态

决策 状态

1
多阶段决策问题的典型例子:

2

?

状态

决策

n

1 生产决策问题:企业在生产过程中,由于需求是随时间变化的, 因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月 或逐季度地根据库存和需求决定生产计划。 2 机器负荷分配问题:某种机器可以在高低两种不同的负荷下进行 生产。在高负荷下进行生产时,产品的年产量g和投入生产的机器数量 u1的关系为 g=g(u1) 这时,机器的年完好率为a,即如果年初完好机器的数量为u,到年终完 好的机器就为au, 0<a<1。

在低负荷下生产时,产品的年产量h和投入生产的机器数量u2的关系为 h=h(u2) 相应的机器年完好率b, 0< b<1。 假定开始生产时完好的机器数量为s1。要求制定一个五年计划,在 每年开始时,决定如何重新分配完好的机器在两种不同的负荷下生产的 数量,使在五年内产品的总产量达到最高。 3 航天飞机飞行控制问题:由于航天飞机的运动的环境是不断变 化的,因此就要根据航天飞机飞行在不同环境中的情况,不断地决 定航天飞机的飞行方向(姿态)和速度,使之能最省燃料和实现目 的(如软着落问题)。 不包含时间因素的静态决策问题(本质上是一次决策问题)也可以 适当地引入阶段的概念,作为多阶段的决策问题用动态规划方法来解决。 4 线性规划、非线性规划等静态的规划问题也可以通过适当地引入 阶段的概念,应用动态规划方法加以解决,后面将详细介绍。

5 最短路问题:给定一个交通网络图如下,其中两点之间的数字表 示距离(或花费),试求从A点到G点的最短距离(总费用最小)。

1
5 A B1 3 6 B2 8 7 6

C1 8 C2

6 D1 3

2
2 1

3

5 C3 3 3 8 C4 4 3

D2

2 3 D3 3

E1 3 5 F1 4 5 E2 2 6 F2 3 E3 6

G

1

2

4

5

6

我们将用此例来说明所有动态规划问题的理论和方法。

第二节: 动态规划的基本概念和定义
1 阶段、阶段变量:把所给问题的过程,适当地分为若干个相互联 系的阶段,目的是能按一定的次序去求解。描述阶段的变量称为阶段 变量,常用k表示。阶段的划分,一般是分为时间和空间的自然特征来 划分,但要便于把问题的过程能转化为多阶段决策的过程。(逆序模型、 顺序模型) 2 状态、状态变量:状态表示每个阶段开始所处的自然状况或客观 条件,它描述了研究问题过程的状况。通常一个阶段有若干个状态。 描述过程状态的变量称为状态变量。常用sk来表示第k阶段的状态变量。 一般来说,状态变量的取值有一定的允许集合或范围,此集合称为是 状态允许集合。 3 决策、决策变量:决策表示当过程处于某一阶段的某个状态时, 可以做出不同的决定(或选择),从而决定下一阶段的状态,这种决定 称为决策。在最优控制中也称为控制。描述决策的变量,称为决策变量。 常用uk(sk) 表示第k阶段当状态为 sk时的决策变量。在实际问题中决策 变量的取值往往在某一范围之内,此范围称为允许决策集合。常用 Dk(sk)表示第k阶段从状态sk出发的允许决策集合,显然有uk(sk) ? Dk(sk) Dk表示第k阶段的允许决策集合。

4 多阶段决策过程:就是可以在各个阶段进行决策,去控制过程 发展的多段过程。多阶段决策过程的发展是通过一系列的状态转移来 实现的,一般来说,系统在某一阶段的状态转移不但于系统的当前 (或本阶段)的状态和决策有关,而且还于系统过去的历史状态和决 策有关。其状态转移方程如下(一般形式)

s2 ? T1 ( s1 , u1 ) s3 ? T2 ( s1 , u1 , s2 , u 2 )

?? sk ?1 ? Tk ( s1 , u1 , s2 , u 2 ,?, sk , u k )
图示如下:
s1 u1 s2 u2 s3

状态转移方程是确定过程由一个 状态到另一个状态的演变过程。 如果第k阶段状态变量sk的值、该 阶段的决策变量一经确定,第k+1 阶段状态变量sk+1的值也就确定。

1

2

?

sk

uk

k

sk+1

能用动态规划方法求解的多阶段决策过程是一类特殊的多阶段决 策过程,即具有无后效性的多阶段决策过程。
无后效性或马尔可夫性:如果某阶段状态给定后,则在这个阶段 以后过程的发展不受这个阶段以前各段状态的影响。换句话说,过程 的过去历史只能通过当前的状态去影响它未来的发展,这个性质称为 无后效性。在构造决策过程的动态规划模型时,要充分注意是否满足 无后效性的要求。如果状态不能满足无后效性的要求,应适当地改变 状态的定义或规定方法,以使状态变量能满足无后效性的要求。

状态具有无后效性的多阶段决策过程的状态转移方程如下

s2 ? T1 ( s1 , u1 ) s3 ? T2 ( s2 , u 2 ) ?? sk ?1 ? Tk ( sk , u k )

动态规划中能 处理的状态转移 方程的形式。

5 策略:策略是一个按顺序排列的决策组成的集合。由过程的 第k阶段开始到终止状态为止的过程,称为问题的后部子过程(或 称为k子过程)。由每段的决策按顺序排列组成的决策函数序列称 为k子过程策略,简称子策略,记为pk,n(sk),即

pk ,n ( sk ) ? ?u k ( sk ), u k ?1 ( sk ?1 ), ?, u n ( sn )? p1,n ( s1 ) ? ?u1 ( s1 ), u 2 ( s2 ), ?, u n ( sn )?

当k=1时,此决策函数序列成为全过程的一个策略,简称策略, 记为p1,n (s1).即

在实际问题中,可供选择的策略有一定范围,此范围称为允许策 略集合,用p表示。从允许策略集合中找出达到最优效果的策略称 为最优策略。 6 指标函数和最优值函数:用来衡量所实现过程优劣的一种 数量指标,称为指标函数,它是定义在全过程或所有后部子过程 上确定的数量函数。Vk, n表示之。即

Vk ,n ? Vk ,n ( sk , u k , sk ?1 , u k ?1 ,?, sn ?1 ), k ? 1,2,?, n
动态规划模型的指标函数,应具有可分离性,并满足递推关系。 即Vk,n可以表示为sk,uk,Vk+1,n的函数。

Vk ,n ( sk , uk , sk ?1 , uk ?1 ,?, sn?1 )

无后效性的结果。

? ? k [ sk , uk ,Vk ?1,n ( sk ?1 , uk ?1 ,?, sn?1 )]
常见的指标函数的形式是: ? 过程和它的任一子过程的指标是它所包含的各阶段的指标和。即

V k ,n ?sk , u k ,?, sn?1? ? ? v j ?s j , u j ?
n j ?k

其中vj(sj,uj)表示第j阶段的阶段指标。这时上式可写成

V k ,n (sk , u k ,?, sn?1) ? vk (sk , u k ) ? V k ?1,n (sk ?1, u k ?1,? sn?1)

? 过程和它的任意子过程的指标是它所包含的各阶段的指标的乘积。即

V k ,n ( s k , u k ,?, sn?1) ?
则可改写成

j ?k

? v j (s j , u j)

n

V k ,n (sk , u k ?, sn?1) ? vk (sk , u k )V k ?1,n (sk ?1, u k ?1,? sn?1)
最优值函数:表示从第k阶段的状态sk开始到第n阶段的终止状态的 过程,采取最优策略所得到的指标函数值。即

f k ( sk ) ? opt V k ,n ( sk , u k ,?, sn?1)
?u k ,?,u n?

多阶段决策过程的数学模型:(具有无后效性的多阶段决策过程)
opt V1,n ( s1 , u1 , ?, sn ?1 ) ?

opt

{u1 ,u 2 ,?,u n }

{u1 ,u 2 ,?,u n } j ?1

? v (s , u
j j

n

j

)

?sk ?1 ? Tk ( sk , uk ) ?s ? S ? k s.t. ? k ?uk ? U k ? ?k ? 1,2, ?, n

所谓求解多阶段决策过程问题,就是要求出 (1) 最优策略,即最优决策序列
* * * {u1 , u2 , ?, u n }

(2) 最优轨线,即执行最优策略时的状态序列

* * * {s1 , s2 ,?, sn }

(3)最优目标函数值

f1(s1)

* * * * * V1* ? V ( s , u , ? , s , u ,n 1, n 1 1 n n)

f k ?sk ? ? opt vk ,n ?sk , u k ,?, sn?1?
?u k ,?,u n?
从k到终点最优 子策略的最优目标函数值

第三节:动态规划的基本思想和基本方程
以最短路问题的解法为例来说明。(穷举法48条路线)

1 5 A 3 B2 B1 6 8 7 6 3

C1 8

6 D1

2 2

C2

3

E1 3 5 5

F1

4 G 3

5 C3 3 3 8 C4 4

1 D2 2 3 D3 3

E2 2 6 F2 E3 6

1

2

3

4

5

6

最短路的特性:如果已有从起点到终点的一条最短路,那么从最短路 线上中间任何一点出发到终点的路线仍然是最短路。(证明:用反证法)
当k=6时,由F1到终点G只有一条路线,故f6(F1)=4.同理,f6(F2)=3. 当k=5时,出发点有E1,E2,E3三个。

? d5 ?E1 , F1 ? ? f 6 ?F1 ? f 5 ?E1 ? ? min ? ?d5 ?E1 , F2 ? ? f 6 ?F2 ?

3? 4 ? }? 7 ? ? min{ 5?3 ?

u5(E1)=F1 E1 F1 G u5(E2)=F2 E2 F2 G u5(E3)=F2 E3 F3 G

? d5 ?E2 , F1 ? ? f 6 ?F1 ? f5 ?E 2? ? min ? ?d5 ?E2 , F2 ? ? f 6 ?F2 ?
? d5 ?E3 , F1 ? ? f 6 ?F1 ? f 5 ?E3? ? min ? ?d5 ?E3 , F2 ? ? f 6 ?F2 ?

5? 4 ? }?5 ? ? min{ 2?3 ?
6?4 ? }?9 ? ? min{ 6?3 ?

当k=4时,有

f 4 ?D2 ? ? 6 u 4 ?D2 ? ? E2 f 4 ?D3 ? ? 8 u 4 ?D3 ? ? E2
当k=3时,有

f 4 ?D1 ? ? 7

u 4 ?D1 ? ? E2

f 3 ?C1 ? ? 13 u3 ?C1 ? ? D1 f 3 ?C2 ? ? 10 u3 ?C2 ? ? D1 f 3 ?C3 ? ? 9 u3 ?C3 ? ? D2 f 3 ?C4 ? ? 12

u3 ?c4 ? ? D3

当k=2时,有

f 2 ?B2 ? ? 16 u2 ?B2 ? ? C3

f 2 ?B1 ? ? 13

u2 ?B1 ? ? C2

当k=1时,有

?d1 ? A, B1 ? ? f 2 ?B1 ? ? ?5 ? 13? f1 ? A? ? min ? ? ? min ? ? ? 18 ?3 ? 16 ? ?d1 ? A, B2 ? ? f 2 ?B2 ??

且u1(A)=B1,于是得到从起点A到终点G的最短距离为18。

为了找到最短路线,再按计算的顺序反推之,可求出最优决策函数序 列{uk}:u1(A)=B1,u2(B1)=C2,u3=(C2)=D1,u4(D1)=E2,u5(E2)=F2,u6(F2)=G,
即最优策略。

最短路线为A?B1?C2?D1?E2?F2?G。

13 1 B1 3 18 5 6 A 3 16 8 B2 7 6

13 C1 6 10 8 C2 3 9 5 C3 3 12 83 C4 4

7 D1 2 6 2 D2 1 8 2 3 D3 3

7 E1 3 4 5 F1 4 5 E2 52 3 9 6 F2 3 E3 6

0 G

用动态规划(逆序法求解的)基本特性: (1)将多阶段决策过程划分阶段,恰当地选取状态变量、决策变量、及 定义最优指标函数,正确写出基本的递推关系式和恰当的边界条件(简言 之为基本方程)。从而把问题化成一族同类的子问题, (2)求解时从边界条件开始,逆(或顺)过程行进方向,逐段递推寻优。 在每个问题求解时,都要使用它前面已求出的子问题的最优结果,最后问 题的最优解,就是整个问题的最优解。

(3)动态规划方法是既把当前一段和未来各段分开,又把当前效益和未 来效益结合起来考虑的一种最优化方法。每段决策的选取都是从全局考虑 的,与该段的最优选择答案一般是不同的。
(4)在求整个问题的最优策略时,由于初始状态是已知的,每段的决策 是该段状态的函数,故沿最优化策略所经过的各段状态便可确定了最优路 线。

(5)求解的各个阶段,我们利用了k阶段与k+1阶段之间的递推关系:

? f k ?sk ? ? min ?d k ?sk , uk ?sk ?? ? f k ?1 ?uk ?sk ???? ? ? uk ?Dk ? sk ? ? ?k ? 6,5,4,3,2,1 ? ? ? f 7 ? s7 ? ? 0 ?
一般情况,k阶段与k+1阶段的递推关系式(动态规划基本方程)

f k ?sk ? ?

uk ?Dk ? sk ?

opt ?vk ?sk , uk ?sk ?? ? f k ?1?uk ?sk ???
f n?1 ?sn?1 ? ? 0

边界条件为

练习:写出乘积形式指标函数的动态规划基本方程。

用动态规划求解时的几点注意:
(1)将问题的过程划分成恰当的阶段; (2)正确选择状态变量sk,使它既能描述过程的变量,又要满足 无后效应; (3)确定决策变量uk及每一阶段的允许决策集合Dk(sk); (4)正确写出状态转移方程; (5)正确写出指标函数Vk,n,它应满足下面三个性质: a)是定义在全过程和所有后部子过程上的数量函数; b)要具有可分离性,并满足递推关系。即

V k ,n (sk ,uk ?, sn?1 ) ? ?k [sk , uk ,Vk ?1,n ?sk ?1 , uk ?1 ,?, sn?1 ?]
c)函数?k(sk,uk,Vk+1,n)对于变量Vk+1,n要严格单调。

顺序解法
顺序解法的阶段变量k,决策变量xk,以及决策变量允许集合Qk的含义 和逆序解法模型中相应变量的含义相同,而状态变量sk表示第k阶段结束 时的状态,其中k=0,1,2,┅,n。记状态转移方程为 sk=g(sk-1,xk) k=1,2,┅,n 则 s k-1=g-1(sk,xk) 记第k阶段末状态为sk,第k阶段决策为xk的直接指标(或称阶段指标) 为 dk(sk,xk) ,并记从第 1 阶段到第 k 阶段末状态为 sk 所得到的最大效益为 fk(sk),则顺序解法的基本方程(或称指标递推方程及边界条件)为
? f k ( s k ) ? opt ?d k ( s k , x k ) ? f k ?1 ( s k ?1 )? xk ?Qk ? ? ? opt d k ( s k , x k ) ? f k ?1 ( g ?1 ( s k , x k )) ? xk ?Qk ? ? ? ? ? f 0 ( s 0 ) ? 0 or 1

?

?

k ? 1,2,??, n

?0 f 0 (s0 ) ? ? ?1

当? 为?时 当 ? 为 ?时

其中 opt=Max or Min

最短路问题:给定一个交通网络图如下,其中两点之间的数字表示距 离(或花费),试求从A点到G点的最短距离(总费用最小)。

1 5 B1 3 B2

C1 8 C2

6
D1 3

2 2

A

3 6 8 7

E1 3 5 E2 2 6 E3

6

5 C3 3 3 8 C4 4 3

1 D2 2 3 D3 3

5

F1 4 G F2

6

3

1

2

4

5

6

按照顺序动态规划求解方法,从第1阶段开始计算,由前向后逐步推移至G点,

计算过程为
当k=0时,S0={A},f0(A)=0 当k=1时,S1={B1,B2},由A到B1只有一条路线,故f1(B1)=5

同理得: f1(B2)=3
当k=2时,S2={C1,C2,C3,C4} f2(C 1)=Min {d2(B1,C1)+ f1(B1)}=Min {1+5}=6 其相应决策为x2:B1→ C1 f2(C 2)=Min {d2(B1,C2)+ f1(B1),d2(B2,C2)+ f1(B2)} =Min {3+5,8+3}=8 其相应决策为x2:B1→ C2

f2(C 3)=Min {d2(B1,C3)+ f1(B1),d2(B2,C3)+ f1(B2)}
= Min {6+5,7+3}=10 其相应决策为x2:B2→ C3 f2(C 4)=Min { d2(B2,C4)+ f1(B2)}=Min {6+3}=9 其相应决策为x2:B2→ C4

类似地,可计算得

当k=3时,S3={D1,D 2,D 3 },有
f3(D 1)=11 f3(D 2)=13 f3(D 3)=13 f4(E 1)=13 f4(E 2)=13 f4(E 3)=15 f5(F 1)=16 x3:C 2→ D1 x3:C 2→ D2 or C 3→ D2 x3:C 3→ D3 or C 4→ D3 x4:D1→ E 1 x4:D 1→ E 2 x4:D 2→ E 3 x5:E 1→ F 1

当k=4时,S4={E1,E 2,E 3 },有

当k=5时,S5={F1,F 2 },有

f5(F 2)=15
当k=6时,S5={G },有 f6(G)=18

x5:E 2→ F 2
x6:F 2→ G

再按计算的顺序反推,可得相应的最短线路为:A→ B1→ C2→ D1→ E 2→ F 2→ G

第四节:动态规划的理论基础
多阶段决策过程的特点:每个阶段都要进行决策,策略是由n个相继 进行的决策构成的决策序列。前一阶段的终止状态又是下一阶段的初始状 态,因此,确定阶段最优决策不能只从本阶段的效应来考虑,必须是整个 过程通盘考虑,整体规划。即阶段k的最优决策不应该只是本阶段效应的 最优,而必须是本阶段及其所有后续阶段的总体最优。 适应于用动态规划方法求解的是具有无后效性的多阶段决策过程。

动态规划方法的理论基础是基于R. Bellman提出的最优性原理: “一个过程的最优策略具有这样的性质:即无论其初始状态及初始决策 如何,对于先前决策所形成的状态而言,余下的诸决策仍构成最优策 略。”最优性原理的含义是:最优策略的任何一部分子策略,都是最优 策略。每个最优策略只能由最优子策略构成。

动态规划的最优性定理:设阶段数为 n 的多阶段决策过程,其阶段编 号为k=0,1,...,n-1。允许策略
* * * * p0 ? ( u , u , ? , u ,n ?1 0 1 n ?1 )

是最优策略的充要条件是对任意一个k, 0<k<n-1和s0?S0,有

V 0,n?1 (s0 , p0,n?1) ?
?

*

p0,k ?1?P0,k ?1( s 0)

opt

{V 0,k ?1 ( s0 , p0,k ?1)

p k ,n ?1`?P k ,n ?1( ~ s k)

opt

V k ,n?1 (~ s k , pk ,n?1)}

p0,n?1 ? ( p0,k ?1 , pk ,n ?1 ), ~ sk ? Tk ?1 ( sk ?1 , uk ?1 ),
它是由给定的初始状态 s0 和子策略p0,k-1 所确定的k 段状态。当V 是效益函 数时,opt取max;当V是损失函数时,opt取min.

证明:必要性(
*



V 0,n?1 (s0 , p0,n?1) ? p
? p0,k ?1 ? ?

0 , n ?1?P0 , n ?1 ( s0 )

opt

V0,n ?1 ( s0 , p0,n ?1 ) opt [V0,k ?1 ( s0 , p0,k ?1)

opt

~ ?P 0 , k ?1( s 0 ) pk , n ?1?Pk , n ?1 ( sk )

{

? Vk ,n ?1 (~ sk , pk ,n ?1 )]}
p0 , k ?1?P0 , k ?1 ( s0 )

opt

{V0,k ?1 ( s0 , p0,k ?1 )

p k ,n ?1`?P k , n ?1( ~ s k)

opt

V k ,n?1 (~ s k , pk ,n?1)}

充分性( )设p0,n-1=(p0,k-1,pk,n-1)为任一策略,sk为由(s0,p0,k-1)所 确定的k阶段的起始状态,则有(以最大化为例)

Vk ,n?1 (~ sk , pk ,n?1 ) ?

pk , n ?1?Pk , n ?1 ( sk )

opt

Vk ,n?1 (~ sk , pk ,n?1 )

sk , pk ,n ?1 ) V 0,n?1 ( s0 , p 0,n?1) ? V0,k ?1 ( s0 , p0,k ?1) ? Vk ,n?1 (~ ? V0,k ?1 ( s0 , p0,k ?1 ) ? ? ? p k , n ?1`?P k , n ?1( ~ s k)

opt

V k ,n?1 (~ s k , pk ,n?1)
{V0,k ?1 ( s0 , p0,k ?1 )

p 0, k ?1`?P 0, k ?1( ~ s 0) p k , n ?1`?P k , n ?1( ~ s k)

opt

opt

V k ,n?1 (~ s k , pk ,n?1)}

* ? V0,n ?1 ( s0 , p0 , n ?1 )

推论:若允许策略p*0,n-1是最优策略,则对任意的k,0<k<n-1,它的
子策略p*k,n-1对于以s*k=Tk-1(s*k-1,u*k-1)为起点的k到n-1子过程来说,必 是最优决策。(注意: k阶段状态s*k是由s0和p*0,k-1所决定的)


相关文章:
运筹学动态规划_图文.ppt
运筹学动态规划 - 动态规划(Dynamic Programming) 动态规划
运筹学7动态规划.ppt
运筹学7动态规划_数学_自然科学_专业资料。运筹学7动态规划 第七 章动态规划 主要内容: §7.1 多阶段决策过程的最优化 §7.2 动态规划的基本概念和基本原理 ...
运筹学5(动态规划)_图文.ppt
运筹学5(动态规划) - 第七章 动态规划 7.1 动态规划问题和基本概念 7.2 动态规划的基本原理 7.3 动态规划的应用 引言 动态规划与多阶段决策: 多阶段决策是...
运筹学动态规划_图文.ppt
运筹学动态规划 - 动态规划 (Dynamic programming) 动态规
运筹学动态规划习题_图文.ppt
运筹学动态规划习题 - 习题三 一、某工厂购进100台机器,准备生产A、B 两种
运筹学动态规划分析_图文.ppt
运筹学动态规划分析 - Page:1 运动 态筹 规 划学 华东理工大学 工商经
运筹学动态规划.ppt
运筹学动态规划_数学_自然科学_专业资料。第7章重点: 动态规划 (Dynami
运筹学动态规划PPT_图文.ppt
运筹学动态规划PPT - 动态规划 (Dynamic programming)
清华大学运筹学课件动态规划_图文.pdf
清华大学运筹学课件动态规划 - 动态规划 主要内容 基本概念 多阶段问题 建模与
运筹学5(动态规划)_图文.ppt
运筹学5(动态规划) - 第七章 动态规划 7.1 动态规划问题和基本概念 7.2 动态规划的基本原理 7.3 动态规划的应用 引言 动态规划与多阶段决策: 多阶段决策是...
15《运筹学》(第四版)连续动态规划介绍_图文.pdf
15《运筹学》(第四版)连续动态规划介绍 - 第三章 动态规划(Dynamic
运筹学5(动态规划)_图文.ppt
运筹学5(动态规划) - 第七章 动态规划 7.1 动态规划问题和基本概念 7.2 动态规划的基本原理 7.3 动态规划的应用 引言 动态规划与多阶段决策: 多阶段决策是...
运筹学课件(动态规划)_图文.ppt
运筹学课件(动态规划) - 动态规划 (Dynamic programming) 动态规划的基本思想 最短路径问题 投资分配问题 背包问题 动态规划是用来解决多阶段决策过程最优 化...
运筹学---动态规划_图文.ppt
运筹学---动态规划 - 这是关于运筹学里的动态规划的课件ppt... 运筹学---动态规划_理学_高等教育_教育专区。这是关于运筹学里的动态规划的课件ppt 动态...
第七章运筹学动态规划_图文.ppt
第七章运筹学动态规划 - 动态规划 引言 □动态规划是解决多阶段决策过程最优化的
运筹学第10章 动态规划_图文.ppt
运筹学第10章 动态规划 - Page:1 管理运筹学 动态规划 Page:2
运筹学 07 动态规划_图文.ppt
运筹学 07 动态规划 - 1 多阶段决策过程的最优化 ? 概述 ? 多阶段决策过程及其最优化 ? 多阶段决策过程举例 ? 动态规划求解的多阶段决策问题的特点 ? 动态...
运筹学 动态规划应用.ppt
运筹学 动态规划应用_数学_自然科学_专业资料。第七章 动态规划动态规划问题的基
运筹学中excel的运用(用excel解决线性规划、动态规划、....pdf
运筹学中excel的运用(用excel解决线性规划、动态规划、排队论等问题) - 1 . 线性规划 2 . 动态规划 3 . 图与网络分析 4 . 决策分析 ...
运筹学课件第9章_动态规划_图文.ppt
运筹学课件第9章_动态规划 - 第9章 动态规划 教学目标与要求 ? ? ? ?
更多相关文章: