programacion dinámica 1

Luis Medina Aquino
PROGRAMACIÓN DINÁMICA

CONCEPTOS
BÁSICOS
Método de
optimización
Descomponer
un problema
grande en
Problemas mas
pequeños con
resolución mas
fácil

La Programación dinámica resuelve el
problema en etapas (problemas
multietápicos).
En cada etapa interviene una variable de
optimización.
Los cálculos de las diferentes etapas se
enlazan de forma recursiva para generar la
solución óptima.
CARACTERÍSTICAS

Cada etapa en una estructura en serie, se caracteriza por cuatro
variables o funciones (Fig. 1). Estas son: variable de entrada, Sn;
variable de decisión, dn; variable de salida, Sn+1 ; y función de
retorno, Rn. Estas dos últimas dependen de la entrada y de las
decisiones.
ANÁLISIS GENERAL
Etapa iSi Si+1
Ri
di

Se tiene un contrato para entregar 3 unidades mensuales de
cierto producto durante 4 meses, la capacidad de
producción de la planta es de 5 unidades mensuales como
máximo. El stock a fin de mes no puede ser mayor de 4
unidades. El costo de fabricación C(x) es como sigue:
C(0) = 0, C(1) = 15, C(2) = 17, C(3) = 19, C(4) = 21, y C(5) = 23.
El costo de almacenamiento por unidad-mes es 2.
El inventario inicial (II) es cero.
El inventario final (IF) es cero.
Se pide optimizar la producción en un horizonte de 4 meses
ANÁLISIS GENERAL

•Un inversionista tiene $7000 para invertir en
tres riesgos. Él debe invertir en unidades de
$1000. El retorno potencial a partir de la
inversión en cualquier riesgo depende de la
cantidad invertida, de acuerdo a la tabla
siguiente:
ANÁLISIS GENERAL
A B C
0 0 0 0
1000 80 90 100
2000 170 200 190
3000 260 240 280
4000 320 340 320
5000 450 480 430
Determine cuánto
tiene que invertir
en cada riesgo
para maximizar su
retorno

Determine, por programación dinámica, el número de
cada uno de los siguientes artículos que deben
incluirse en el cargamento de una camioneta de
servicio rural, tal que el valor del cargamento se
maximice. La capacidad de la camioneta es de 400
kilos. Además, debe haber por lo menos un artículo
de cada tipo.
ANÁLISIS GENERAL
Artículo Descripción Peso Valor
1 Arroz Saco de 25 kg S/. 35
2 Azúcar Saco de 75 kg S/. 100
3 Frijol Saco de 100 kg S/. 140

ANÁLISIS GENERAL
En un proceso en serie de multietapas la salida de la
etapa n es la entrada en la etapa n+1 (Fig. 2)
FIGURA 2
Etapa
1
S1 S2
R1
d1
Etapa
2
S3
R2
d2
Etapa
n-1
Sn-1 Sn
Rn-1
dn-1
Etapa
n
Sn+1
Rn
dn
f2(S2) fn(Sn)f1(S1) fn-1(Sn-1)

por tanto, la decisión que dé como resultado el
óptimo para cada entrada posible, puede ser
determinada para cada etapa
La última etapa de un proceso en serie, no tiene
ninguna variable de salida que afecte alguna otra
unidad del sistema
Por lo general, el análisis en programación dinámica
comienza con la última etapa y termina con la
primera
ANÁLISIS GENERAL

Richard Bellman, desarrolló en los años cincuenta
las ideas básicas de la programación dinámica,
postulando el principio de optimalidad que dice:
“Una política óptima tiene la propiedad de que
cualquiera que sean su estado y decisión iniciales,
las decisiones subsecuentes deben constituir una
política óptima con respecto al estado resultante
de la decisión inicial”
PRINCIPIO DE OPTIMALIDAD

Matemáticamente el principio de optimalidad es:
fn(Sn) = máx [Rn(Sn, dn) + fn+1(Sn+1)]
dn
fn(Sn) = mín [Rn(Sn, dn) + fn+1(Sn+1)]
dn
en caso de maximizar la función de retorno, ó
en caso de minimizar la función de retorno
*
*

Para el caso de maximizar la función de retorno:
fn(Sn) = máx [Rn(Sn, dn) + fn+1(Sn+1)]
dn
*
n = número de etapas subsecuentes en el proceso
Sn = variables de entrada a la n-ésima etapa
dn = variable de decisión en la n-ésima etapa
fn(Sn) = retorno máximo de un proceso con n etapas
y entradas Sn en la n-ésima etapa
rn =Rn(Sn, dn) = función de retorno de la etapa n con
entrada Sn y variable de decisión dn
Sn +1 = salida de la etapa n y entrada a la etapa n+1
fn+1(Sn+1) = función de retorno máximo desde la última
etapa hasta la etapa n+1.
*

Este problema se refiere a un vendedor
mítico que tuvo que viajar hacia el oeste
por diligencia, a través de tierras indias
hostiles, aproximadamente hace 125
años. Aun cuando su punto de partida y
destino eran fijos, tenía un número
considerable de opciones para elegir,
qué estados recorrer en su ruta.
*

•Los costos de la póliza estándar para el
viaje en diligencia del estado i al j son:
SEGUROS DE PÓLIZAS

A
D
C
B
G
F
E
I
H
J
2
1
4
3
3
6
3
1
4
3
4
5
4
2
3
6
4
7
4
3
*

DESEOS DEL VENDEDOR VIAJERO
• Determinar cuál es la ruta más
segura, es decir, desea correr el
menor riesgo posible.

¿Cuál es la ruta que minimiza el
costo total?
DETERMINAR

SOLUCIÓN
Una forma básica de resolver este
problema es por tanteo.
Pero el número de rutas posibles es muy
alto (en este caso 18) y por lo tanto son
muchos los cálculos a realizar.

SOLUCIÓN
La programación dinámica suministra una
solución con mucho menos esfuerzo que
la numeración exhaustiva

DEFINIR
– Etapas
– Variables de decisión
– Variables de Estado
– Función de retorno
– Objetivo

ETAPAS
• El problema puede dividirse en
etapas, con una decisión de la
política requerida en cada
etapa. Las etapas a considerar
van a depender del tipo de
problema a resolver.

2
1
4
3
3
6
3
1
4
3
4
5
4
2
3
6
4
7
4
3
C
B
D
E
F
G
H
I
JA
Etapa 1 Etapa 2 Etapa 3 Etapa 4

VARIABLESDEDECISIÓN
• Consideremos que las
variables de decisión dn (n
= 1, 2, 3, 4) son el destino
inmediato en la etapa n.

2
1
4
3
3
6
3
1
4
3
4
5
4
2
3
6
4
7
4
3
C
B
D
E
F
G
H
I
JA
Etapa 1 Etapa 2 Etapa 3 Etapa 4
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}

VARIABLESDEESTADO
• Cada etapa tiene cierto
número de variables de
estado asociados a ella.
• En nuestro caso las
variables de estado son:
S1, S2, S3, S4, S5

2
1
4
3
3
6
3
1
4
3
4
5
4
2
3
6
4
7
4
3
C
B
D
E
F
G
H
I
JA
S5={J}
Etapa 1
S2={B,C,D}
Etapa 2 Etapa 3 Etapa 4
S3={E,F,G} S4={H,I}S1={A}
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}
S2 = d1 S5 = d4S4 = d3S3 = d2

FUNCIÓN DE RETORNO
• Se dispone de una relación recursiva
que identifica la política óptima para cada
estado en la etapa n, dada la política óptima
para cada estado en la etapa (n + 1).

2
1
4
3
3
6
3
1
4
3
4
5
4
2
3
6
4
7
4
3
C
B
D
E
F
G
H
I
JA
S5={J}
Etapa 1
S2={B,C,D}
S3={E,F,G} S4={H,I}S1={A}
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}
R1(S1,d1) R2(S2,d2) R3(S3,d3) R4(S4,d4)
S2 = d1 S5 = d4S4 = d3S3 = d2

OBJETIVO
Minimizar los costos totales
Hallar f*1 (A) y la política
óptima correspondiente.
*

2
1
4
3
3
6
3
1
4
3
4
5
4
2
3
6
4
7
4
3
C
B
D
E
F
G
H
I
JA
S5={J}
Etapa 1
S2={B,C,D}
S3={E,F,G} S4={H,I}S1={A}
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}
R1(S1,d1) R2(S2,d2) R3(S3,d3) R4(S4,d4)
S2 = d1 S5 = d4S4 = d3S3 = d2
f*1 (A) f*2(S2) f*3 (S3) f*4(S4)

El proceso de calculo
es de atrás hacia
adelante
*

I
H
J
Estados
posibles
S4=H y S4= I
S5={J}
Etapa 4
S4={H,I}
d4={J}
R4(S4,d4)
3
4
*

f4(S4) = R4(S4, d4 ) + f5*(S5) min
f4*(S4) d4*d4 =J
H 3 + 0 = 3 3 J
I 4 + 0 = 4 4 J
ETAPA N = 4
d4
S4
0
S5={J}
Etapa 1
S2={B,C,D}
S3={E,F,G} S4={H,I}S1={A}
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}
R1(S1,d1) R2(S2,d2) R3(S3,d3) R4(S4,d4)
S2 = d1 S5 = d4S4 = d3S3 = d2

Estados
posibles
S3 = E, S3=F y
S3= J
G
F
E
I
H
J
Decisiones
posibles: d3 = H y
d3 = I
Etapa 3
S3={E,F,G} S4={H,I}
d3={H,I}
R3(S3,d3)
1
3
4
6
3
3
ETAPA N = 3

ETAPA N = 3
f3(S3) = R3(S3, d3 ) + f4*(S4)
f3*(S3) d3*
d3 = H d3 = I
E 1+ 3 = 4 4 +4 = 8 4 H
F 6+ 3 = 9 3 + 4 = 7 7 I
G 3 +3 = 6 3 + 4 = 7 6 H
d3
S3
S4 f4*(S4) d4*
H 3 J
I 4 J
ETAPA 4
S5={J}
Etapa 1
S2={B,C,D}
S3={E,F,G} S4={H,I}S1={A}
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}
R1(S1,d1) R2(S2,d2) R3(S3,d3) R4(S4,d4)
S2 = d1 S5 = d4S4 = d3S3 = d2
ETAPA 3: Variable de enlace S4 = d3

Etapa n= 2
Estados
posibles
S2 = B, S2 = C
y S2 = D
G
F
E
I
H
J
Decisiones
posibles:
d2 = E,
d2 = F y d2
= G
D
C
B
S2={B,C,D} Etapa
2
S3={E,F,G}
d2={E,F,G}
R2(S2,d2)
7
6
4
4
4
2
3
1
5
ETAPA N = 2

ETAPA N = 2
f2(S2) = R2(S2, d2 ) + f3*(S3)
f2*(S2) d2*
d2 = E d2 = F d2 = G
B 7+ 4 = 11 4 + 7 = 11 6 + 6 = 12 11 E ó F
C 3 + 4 = 7 2 + 7= 9 4 + 6 = 10 7 E
D 4 + 4 = 8 1 + 7 = 8 5 + 6 = 11 8 E ó F
S2
d2
S5={J}
Etapa 1
S2={B,C,D}
S3={E,F,G} S4={H,I}S1={A}
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}
R1(S1,d1) R2(S2,d2) R3(S3,d3) R4(S4,d4)
S2 = d1 S5 = d4S4 = d3S3 = d2
S3 f3*(S3) d3*
E 4 H
F 7 I
G 6 H
ETAPA 3 ETAPA 2: Variable de enlace S3 = d2

Etapa n= 1
Estado
posible
S1 = A G
F
E
I
H
J
Decisiones
posibles: d1
= B,
d1 = C y
d1 = D
D
C
B
A
Etapa
1
S2={B,C,D}S1={A}
d1={B,C,D}
R1(S1,d1)
2
4
3
ETAPA N = 1

ETAPA N = 1
f1(S1) = R1(S1, d1 ) + f2*(S2)
f1*(S1) d1*
d1 = B d1 = C d1 = D
A 2 +11 = 13 4 + 7 = 11 3 + 8 = 11 11 C ó D
ETAPA 1: variable de enlace S2 = d1
S2 f2*(S2) d2*
B 11 E ó F
C 7 E
D 8 E ó F
ETAPA 2
S5={J}
Etapa 1
S2={B,C,D}
S3={E,F,G} S4={H,I}S1={A}
d1={B,C,D} d2={E,F,G} d3={H,I} d4={J}
R1(S1,d1) R2(S2,d2) R3(S3,d3) R4(S4,d4)
S2 = d1 S5 = d4S4 = d3S3 = d2
S1
d1

SOLUCION
S1 f1*(S1) d1*
A 11 C ó D
ETAPA 1
S2 = d1
S2 f2*(S2) d2*
B 11 E ó F
C 7 E
D 8 E ó F
ETAPA 2
S3 = d2
S3 f3*(S3) d3*
E 4 H
F 7 I
G 6 H
ETAPA 3
S4 = d3
S4 f4*(S4) d4*
H 3 J
I 4 J
ETAPA 4
Etapa i di Ri
1 C 4
2 E 3
3 H 1
4 J 3
Etapa i di Ri
1 D 3
2 E 4
3 H 1
4 J 3
Etapa i di Ri
1 D 3
2 F 1
3 I 3
4 J 4
SOLUCION 1 SOLUCION 2 SOLUCION 3
COSTO TOTAL = 11

A C
E
H
J
Ruta N º 1
(Alternativa 1)
4
3
1
3

A
D
E
H
J
Ruta N º 2
(Alternativa 2)
3
4
1
3

A
D
F
I
J
Ruta N º 3
(Alternativa 3)
3
1
3 4

programacion dinámica 1

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a programacion dinámica 1

Similar a programacion dinámica 1 (20)

Último

Último (20)

programacion dinámica 1