Clase 7 IO Programación Dinamica_MÓNICA.pdf

Programación Dinámica
Mg. Mónica Zavala Soto

➢ Técnica cuantitativa de toma de decisiones desarrollada por
Bellman y Dantzig en 1957
➢ Se basa en una estructura de optimalidad que tiene un conjunto de:
una política óptima consiste de sub políticas óptimas. (Recursividad).
➢ PD: Técnica matemática que resuelve una serie de decisiones
secuenciales, cada una de las cuales afecta las decisiones futuras
INTRODUCCIÓN

Problema de la Diligencia
• Un vendedor mítico debe viajar hacia el Oeste a través de tierras
hostiles, utilizando como medio de transporte una diligencia
• Aun cuando su punto de partida y destino son fijos, tiene un numero
considerable de opciones para elegir que estados recorrer en su ruta
• El vendedor ofrece seguros de vida a los pasajeros de la diligencia
• El vendedor necesita determinar cual será la ruta mas segura para
disminuir sus costos de póliza de seguros.
• Los territorios y costos de póliza en cada recorrido se observan en
la figura a continuación

7
2 5
4
6
2
8 3
3 6
3
4 2
1 3 6 10
4
4
9
4 3
3 1 3
5
4 7
¿Cuál ruta (conjunto de Caminos) minimiza el costo total de la póliza?
4
1
estado
Costo del recorrido

pero
sacrificando un poco en una etapa
es posible obtener ahorros
mayores de allí en adelante.
1-4-6 es globalmente más barata
que 1-2-6
el número de rutas es muy
camino más barato ofrecido
en cada etapa sucesiva
1-2-6-9-10 -> Costo total de 13
pero
grande (1x3x3x2x1=18)
Solución2: Por tanteos,
Solución1:

Solución3:
PROGRAMACIÓN
DINÁMICA
Parte de una pequeña porción del problema y encuentra la solución
óptima para ese problema más pequeño. Entonces gradualmente
Agranda el problema, hallando la solución óptima en curso a partir de la
anterior, hasta que se resuelve por completo el problema original.

n Etapa, subproblema que
estamos resolviendo
(n=1,2,3,4) .
Variable de decisión,
estado inmediato en la
etapa n
Estado
Costo del estado S a Xn
Costo total de la mejor política
global para las etapas
restantes, dado que el
vendedor se encuentra en el
nodo S (listo para inicial la
etapa n) y se selecciona a Xn
como destino inmediato.
S
fn (s, xn )

Método de solución

Método de solución
El problema de la
diligencia es un diseño
conceptual, para dar una
interpretación física literal
de los problemas de PD.

Características de Programación Dinámica
Característica fundamental: Procesos multietapa de toma de
decisiones.
Propiedades:
• Sólo un número reducido de variables se debe conocer en
cualquier etapa con el fin de describir al problema.
• El resultado de una decisión en cualquier etapa altera los
valores numéricos de un número reducido de variables
relevantes al problema.

Elementos básicos de Programación Dinámica
➢ El problema puede dividirse en etapas, con una decisión de la política
requerida en cada etapa.
➢ Cada etapa tiene un cierto número de estados asociados a ella. En general
los estados son de diversas condiciones posibles, en las que el sistema
podría estar en esa etapa del problema. Puede ser finito o infinito.
➢ El valor asociado al estado no pude depender de decisiones de la misma
etapa no de futuras decisiones.
➢ El estado representa una foto del sistema. Una evaluación en un instante de
tiempo.

➢ La decisión debe corresponder a la política del estado vigente y no del
futuro.
➢ El efecto de la decisión de una política en cada etapa es: “transformar
el estado actual” en un estado asociado con la etapa siguiente”. El
estado resultante podría ser probable distribución.
➢ Dado el estado actual, una política óptima para las etapas restantes es
independiente de la política adoptada en las etapas previas (n-1, n,
n+1)
➢ El procedimiento de resolución empieza por hallar la política óptima
para cada estado de la última etapa.
Elementos básicos de Programación Dinámica

Elementos básicos de PD
• Se dispone de una “relación recursiva” que identifica la política óptima para
cada estado en la etapa n, dada la política óptima para cada estado en la
etapa (n+1).
• Usando esta relación recursiva, el procedimiento de resolución se mueve
“hacia atrás”, etapa por etapa - hallando en cada ocasión la política óptima
para cada estado de esa etapa - hasta que se encuentra la política óptima
cuando se parte de la etapa inicial.
Estado posible
de la etapa
Actual (n)
Resultado de la
política optima en
la etapa siguiente
(n+1)

Actividad Grupal
➢ Realizar en grupos la teoría y ejemplos de programación dinámica
determinística de los siguientes problemas tipo: Problema de la
mochila, problema de asignación de recursos y problema de
inventario. (Realizar los ejemplos manualmente detallando
procedimiento y deben realizarlo también en Excel).
➢ Realizar en grupos la teoría y ejemplos de programación dinámica
probabilística de modelos de inventario (Realizar los ejemplos
manualmente detallando procedimiento y deben realizarlo también
en Excel).

Clase 7 IO Programación Dinamica_MÓNICA.pdf

Clase 7 IO Programación Dinamica_MÓNICA.pdf

Recomendados

Recomendados

Más contenido relacionado

Similar a Clase 7 IO Programación Dinamica_MÓNICA.pdf

Similar a Clase 7 IO Programación Dinamica_MÓNICA.pdf (20)

Último

Último (20)

Clase 7 IO Programación Dinamica_MÓNICA.pdf