SlideShare una empresa de Scribd logo
1 de 22
PROGRAMACION DINAMICA
PROF. VENEROS MANRIQUE, HENRY
Prof. Henry Veneros Manrique 1
Prof. Henry Veneros Manrique
INTRODUCCION.
•Etimológicamente, el término
“programación” implica
planeamiento y el término
“dinámica” implica cambio en el
tiempo.
2
Prof. Henry Veneros Manrique
INTRODUCCION.
•Actualmente, el término ha
tomado un significado más general,
los valores que van a tomar las
variables no solamente están en
función del tiempo, sino en las
decisiones que se puede tomar.
3
Prof. Henry Veneros Manrique
INTRODUCCION
• El arte de formular y resolver problemas usando
programación dinámica se puede aprender sólo a
través de una participación activa del alumno.
• Sólo con una considerable práctica en resolver
problemas por su cuenta, el alumno adquirirá la
habilidad necesaria que le permita realizar las
formulaciones apropiadas en forma fácil y natural.
• Usar correctamente el software P4 y la
interpretación de los resultados, elaborando
informes administrativos.
4
Prof. Henry Veneros Manrique
Descripcion.
• PD es un procedimiento de optimización el cual es
aplicable a problemas que requieren una
secuencia de decisiones interrelacionadas
• Cada decisión nos responde sobre qué hacemos
ahora, pero lo que hagamos ahora afectará
directamente a la decisión que se haga en algún
otro punto del problema.
• Cada decisión transforma la situación actual en
una nueva situación.
5
Prof. Henry Veneros Manrique
Descripcion
• Se trata de obtener una secuencia de decisiones,
las cuales producirán una secuencia de situaciones
que maximicen ( o minimicen) alguna medida de
valor.
• El valor de una secuencia de decisiones es
generalmente igual a la suma de los valores de las
decisiones y situaciones individuales que la
conforman.
• Así, la programación dinámica descompone un
problema de N decisiones, en una secuencia de N
problemas de una decisión separados pero
interrelacionados.
6
Prof. Henry Veneros Manrique
Descripcion
• La PD debe la mayor parte de su desarrollo original
a Richard Bellman y sus colegas de la corporación
RAND.
• Sus trabajos fueron resumidos en un libro clásico
publicado en el año 1957.
• Con los años, esta técnica ha sufrido importantes
modificaciones especialmente para darle una
forma más accesible a programas
computacionales.
7
Prof. Henry Veneros Manrique
Principio de Optimalidad
• La técnica de PD se basa en un principio el cual
debe ser satisfecho plenamente por todo
problema que intente ser resuelto mediante esta
técnica. El saber reconocer si este principio es
satisfecho o nó, es punto clave en el arte de
aplicación de la PD.
• “La mejor ruta desde el estado A al estado B tiene
la propiedad de que sea cual fuera la decisión
hecha en A, el camino restante para llegar a B,
partiendo del estado alcanzado inmediantamente
desde A, debe ser el mejor entre dicho estado y B”
8
Prof. Henry Veneros Manrique
Principio de Optimalidad
•“La mejor ruta desde cualquier
estado Z al estado B, depende sólo
del estado Z y no de la ruta usada
para llegar a Z”
•Caso 1: Problema de la alforja
9
Prof. Henry Veneros Manrique
Ideas Claves
• Primero, reconocer que el problema total
puede ser resuelto si se determinan los
valores para las mejores soluciones de
ciertos subproblemas (principio de
optimalidad)
• Segundo, darse cuenta que si uno empieza
por el final o cerca del final del problema
completo, los subproblemas son tan
simples, que tienen soluciones triviales.
(Ecuación Recursiva)
10
Prof. Henry Veneros Manrique
ESTRUCTURA DE LA TECNICA
11
Prof. Henry Veneros Manrique
Estado y Decisiones
• Vector de Estado, es un conjunto de
variables de estado, cuyos valores
especifican la condición actual del
proceso, el número de variables de
estado depende del problema.
• Decisión, es una oportunidad para
cambiar el valor de las variables de
estado. Los elementos del conjunto de
decisión, puede depender del estado.
12
Prof. Henry Veneros Manrique
Estado y Decisiones
• Algunos ejemplos de estas relaciones estado-
decisión son:
• Estado: Nivel de agua en un reservorio
Decisión: cuánta agua se desembalsará
• Estado: Ubicado en una calle
Decisión: que dirección seguir
• Estado: Estamos en un mes con un
inventario
Decisión: cuanto producir para cumplir con
la demanda.
13
Prof. Henry Veneros Manrique
Terminología
1. Estado
S : vector de estado formado por n variables
S = {S1,S2,...,Sn}, conjunto de n variables
Si = variable del estado i
S = {S}, conjunto de m posibles estados
2. Decisiones
D(s) = {d1,d2, ...,dns} , conjunto de decisiones para el
estado S, es una función del estado S
3. Función de Transición
S = estado actual
Sn = estado generado , nuevo estado o estado
siguiente
Sn = T(s,d)
14
Prof. Henry Veneros Manrique
Terminología.
4. Restricciones
Sn <= Lìmite_superior
Sn >= Lìmite_inferior
Toda generaciòn de estado debe estar limitado
por lo menos por una restricciòn
5. Estado Inicial
S = (Valor Inicial) , definido por el problema
15
Prof. Henry Veneros Manrique
Terminología.
7. Función de Valor Optimo (f(s))
La regla que asigna valores a los diferentes
subproblemas se llama función de Valor
Optimo y se denotará por f(s). Es una función
de estado.
8. Función de Política Optima (P(s))
La regla que indica la mejor decisión
inmediata para cada subproblema, se llama
Función de Política Optima y se denota por
P(s).
16
Prof. Henry Veneros Manrique
Terminología
9. Función de Retorno
a(s,d) = esfuerzo asociado con el arco que
conecta el estado S con el estado Sn
R(s,d) = a(s,d) + f(sn)
10. Ecuación Recursiva
f(s) = Minimo (o Máximo) {R(s,d)}
11. Condiciòn de Contorno
Son estados que el valor de la función de
valor óptimo no requiere cálculo alguno, su
valor es obvio, por las condiciones del
problema.
17
Prof. Henry Veneros Manrique
Proceso de Solución
1. Generación de Estados
Para generar el conjunto de estados, se requiere que se defina:
Conjunto decisión
Función de Transición
Estado inicial y
Restricciones
2. Procedimiento solución
Para hallar la solución óptima, se requiere:
Haber generado los estados
Definir la función de retorno
Definir la función de valor óptimo
Definir el valor de la función óptima para los estados de contorno.
18
Prof. Henry Veneros Manrique
Aplicaciones
19
Prof. Henry Veneros Manrique
Características.
(tomado del libro Winston)
20
Prof. Henry Veneros Manrique
Características de las aplicaciones de la PD
1. El problema se puede dividir en etapas, cada
etapa requiere una decisión.
2. Cada etapa tiene un número de estados
asociados con ella. Por estado se entiende la
información que se necesita en cualquier etapa
para tomar una decisión óptima.
3. La decisión tomada en cualquier etapa, indica
como se transforma el estado en la etapa actual
en el estado en la etapa siguiente.
21
Prof. Henry Veneros Manrique
Características de las aplicaciones de la PD
4. Dado el estado actual, la decisión óptima para
cada una de las etapas restantes no debe
depender de estados previamente alcanzados o
de decisiones previamente tomadas. A esta idea
se le conoce como principio de optimalidad.
5. Si los estados del problema se han clasificado en
una de T etapas, debe haber una formula
recursiva que relaciones el costo o recompensa
ganada durante las etapas t, t+1,...,T con el
costo o recompensa de las etapas t+1,t+2,...,T.
22

Más contenido relacionado

Similar a Programacion dinamica

Clase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdfClase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdf
NekoRojas3
 
“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”
“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”
“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”
vanessa sobvio
 

Similar a Programacion dinamica (20)

Programacion dinamica final
Programacion dinamica finalProgramacion dinamica final
Programacion dinamica final
 
Presentación de investigación de operaciones II
Presentación de investigación de operaciones IIPresentación de investigación de operaciones II
Presentación de investigación de operaciones II
 
Clase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdfClase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdf
 
“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”
“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”
“PROGRAMACIÓN LINEAL: COMO HERRAMIENTA PARA LA TOMA DE DECISIONES”
 
Programacion Dinamica
Programacion DinamicaProgramacion Dinamica
Programacion Dinamica
 
0208
02080208
0208
 
Presentacion programacion dinamica
Presentacion programacion dinamicaPresentacion programacion dinamica
Presentacion programacion dinamica
 
21
2121
21
 
Trabajo final inv. de operaciones
Trabajo final inv. de operacionesTrabajo final inv. de operaciones
Trabajo final inv. de operaciones
 
Programación Dinámica
Programación DinámicaProgramación Dinámica
Programación Dinámica
 
Pro no num Prog dinamica
Pro no num Prog dinamicaPro no num Prog dinamica
Pro no num Prog dinamica
 
Análisis de problemas y toma de decisiones 2
Análisis de problemas y toma de decisiones 2Análisis de problemas y toma de decisiones 2
Análisis de problemas y toma de decisiones 2
 
SESION 1_SIM_wk.pdf
SESION 1_SIM_wk.pdfSESION 1_SIM_wk.pdf
SESION 1_SIM_wk.pdf
 
Manual metodos cuantitativos equipo 3
Manual metodos cuantitativos equipo 3Manual metodos cuantitativos equipo 3
Manual metodos cuantitativos equipo 3
 
fgS-1.pptx
fgS-1.pptxfgS-1.pptx
fgS-1.pptx
 
Programacion
ProgramacionProgramacion
Programacion
 
CALCULO DOC.pptx
CALCULO DOC.pptxCALCULO DOC.pptx
CALCULO DOC.pptx
 
INVESTIGACION DE OPERACIONES
INVESTIGACION DE OPERACIONESINVESTIGACION DE OPERACIONES
INVESTIGACION DE OPERACIONES
 
Prog dinamica
Prog dinamicaProg dinamica
Prog dinamica
 
Sesion iii arbol de decisiones prob a priori
Sesion iii arbol de decisiones prob a prioriSesion iii arbol de decisiones prob a priori
Sesion iii arbol de decisiones prob a priori
 

Último

ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
gustavoiashalom
 
UC Fundamentos de tuberías en equipos de refrigeración m.pdf
UC Fundamentos de tuberías en equipos de refrigeración m.pdfUC Fundamentos de tuberías en equipos de refrigeración m.pdf
UC Fundamentos de tuberías en equipos de refrigeración m.pdf
refrielectriccarlyz
 
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONALSESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
EdwinC23
 
Tipos de Valvulas para uso industrial y comercial
Tipos de Valvulas para uso industrial y comercialTipos de Valvulas para uso industrial y comercial
Tipos de Valvulas para uso industrial y comercial
macsal12345
 

Último (20)

ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
 
UC Fundamentos de tuberías en equipos de refrigeración m.pdf
UC Fundamentos de tuberías en equipos de refrigeración m.pdfUC Fundamentos de tuberías en equipos de refrigeración m.pdf
UC Fundamentos de tuberías en equipos de refrigeración m.pdf
 
ingenieria grafica para la carrera de ingeniera .pptx
ingenieria grafica para la carrera de ingeniera .pptxingenieria grafica para la carrera de ingeniera .pptx
ingenieria grafica para la carrera de ingeniera .pptx
 
Análisis de Costos y Presupuestos CAPECO
Análisis de Costos y Presupuestos CAPECOAnálisis de Costos y Presupuestos CAPECO
Análisis de Costos y Presupuestos CAPECO
 
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf  PARA TRABAJO SEGUROATS-FORMATO cara.pdf  PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
 
PostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCDPostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCD
 
Video sustentación GA2- 240201528-AA3-EV01.pptx
Video sustentación GA2- 240201528-AA3-EV01.pptxVideo sustentación GA2- 240201528-AA3-EV01.pptx
Video sustentación GA2- 240201528-AA3-EV01.pptx
 
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONALSESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
 
27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt
 
libro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operacioneslibro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operaciones
 
Six Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processSix Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo process
 
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptxEFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
 
Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...
 
Tipos de Valvulas para uso industrial y comercial
Tipos de Valvulas para uso industrial y comercialTipos de Valvulas para uso industrial y comercial
Tipos de Valvulas para uso industrial y comercial
 
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdfCONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
 
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.pptTippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
 
Sistema de lubricación para motores de combustión interna
Sistema de lubricación para motores de combustión internaSistema de lubricación para motores de combustión interna
Sistema de lubricación para motores de combustión interna
 
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVOESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
 
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHTAPORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
 
DIAPOSITIVAS DE SEGURIDAD Y SALUD EN EL TRABAJO
DIAPOSITIVAS DE SEGURIDAD Y SALUD EN EL TRABAJODIAPOSITIVAS DE SEGURIDAD Y SALUD EN EL TRABAJO
DIAPOSITIVAS DE SEGURIDAD Y SALUD EN EL TRABAJO
 

Programacion dinamica

  • 1. PROGRAMACION DINAMICA PROF. VENEROS MANRIQUE, HENRY Prof. Henry Veneros Manrique 1
  • 2. Prof. Henry Veneros Manrique INTRODUCCION. •Etimológicamente, el término “programación” implica planeamiento y el término “dinámica” implica cambio en el tiempo. 2
  • 3. Prof. Henry Veneros Manrique INTRODUCCION. •Actualmente, el término ha tomado un significado más general, los valores que van a tomar las variables no solamente están en función del tiempo, sino en las decisiones que se puede tomar. 3
  • 4. Prof. Henry Veneros Manrique INTRODUCCION • El arte de formular y resolver problemas usando programación dinámica se puede aprender sólo a través de una participación activa del alumno. • Sólo con una considerable práctica en resolver problemas por su cuenta, el alumno adquirirá la habilidad necesaria que le permita realizar las formulaciones apropiadas en forma fácil y natural. • Usar correctamente el software P4 y la interpretación de los resultados, elaborando informes administrativos. 4
  • 5. Prof. Henry Veneros Manrique Descripcion. • PD es un procedimiento de optimización el cual es aplicable a problemas que requieren una secuencia de decisiones interrelacionadas • Cada decisión nos responde sobre qué hacemos ahora, pero lo que hagamos ahora afectará directamente a la decisión que se haga en algún otro punto del problema. • Cada decisión transforma la situación actual en una nueva situación. 5
  • 6. Prof. Henry Veneros Manrique Descripcion • Se trata de obtener una secuencia de decisiones, las cuales producirán una secuencia de situaciones que maximicen ( o minimicen) alguna medida de valor. • El valor de una secuencia de decisiones es generalmente igual a la suma de los valores de las decisiones y situaciones individuales que la conforman. • Así, la programación dinámica descompone un problema de N decisiones, en una secuencia de N problemas de una decisión separados pero interrelacionados. 6
  • 7. Prof. Henry Veneros Manrique Descripcion • La PD debe la mayor parte de su desarrollo original a Richard Bellman y sus colegas de la corporación RAND. • Sus trabajos fueron resumidos en un libro clásico publicado en el año 1957. • Con los años, esta técnica ha sufrido importantes modificaciones especialmente para darle una forma más accesible a programas computacionales. 7
  • 8. Prof. Henry Veneros Manrique Principio de Optimalidad • La técnica de PD se basa en un principio el cual debe ser satisfecho plenamente por todo problema que intente ser resuelto mediante esta técnica. El saber reconocer si este principio es satisfecho o nó, es punto clave en el arte de aplicación de la PD. • “La mejor ruta desde el estado A al estado B tiene la propiedad de que sea cual fuera la decisión hecha en A, el camino restante para llegar a B, partiendo del estado alcanzado inmediantamente desde A, debe ser el mejor entre dicho estado y B” 8
  • 9. Prof. Henry Veneros Manrique Principio de Optimalidad •“La mejor ruta desde cualquier estado Z al estado B, depende sólo del estado Z y no de la ruta usada para llegar a Z” •Caso 1: Problema de la alforja 9
  • 10. Prof. Henry Veneros Manrique Ideas Claves • Primero, reconocer que el problema total puede ser resuelto si se determinan los valores para las mejores soluciones de ciertos subproblemas (principio de optimalidad) • Segundo, darse cuenta que si uno empieza por el final o cerca del final del problema completo, los subproblemas son tan simples, que tienen soluciones triviales. (Ecuación Recursiva) 10
  • 11. Prof. Henry Veneros Manrique ESTRUCTURA DE LA TECNICA 11
  • 12. Prof. Henry Veneros Manrique Estado y Decisiones • Vector de Estado, es un conjunto de variables de estado, cuyos valores especifican la condición actual del proceso, el número de variables de estado depende del problema. • Decisión, es una oportunidad para cambiar el valor de las variables de estado. Los elementos del conjunto de decisión, puede depender del estado. 12
  • 13. Prof. Henry Veneros Manrique Estado y Decisiones • Algunos ejemplos de estas relaciones estado- decisión son: • Estado: Nivel de agua en un reservorio Decisión: cuánta agua se desembalsará • Estado: Ubicado en una calle Decisión: que dirección seguir • Estado: Estamos en un mes con un inventario Decisión: cuanto producir para cumplir con la demanda. 13
  • 14. Prof. Henry Veneros Manrique Terminología 1. Estado S : vector de estado formado por n variables S = {S1,S2,...,Sn}, conjunto de n variables Si = variable del estado i S = {S}, conjunto de m posibles estados 2. Decisiones D(s) = {d1,d2, ...,dns} , conjunto de decisiones para el estado S, es una función del estado S 3. Función de Transición S = estado actual Sn = estado generado , nuevo estado o estado siguiente Sn = T(s,d) 14
  • 15. Prof. Henry Veneros Manrique Terminología. 4. Restricciones Sn <= Lìmite_superior Sn >= Lìmite_inferior Toda generaciòn de estado debe estar limitado por lo menos por una restricciòn 5. Estado Inicial S = (Valor Inicial) , definido por el problema 15
  • 16. Prof. Henry Veneros Manrique Terminología. 7. Función de Valor Optimo (f(s)) La regla que asigna valores a los diferentes subproblemas se llama función de Valor Optimo y se denotará por f(s). Es una función de estado. 8. Función de Política Optima (P(s)) La regla que indica la mejor decisión inmediata para cada subproblema, se llama Función de Política Optima y se denota por P(s). 16
  • 17. Prof. Henry Veneros Manrique Terminología 9. Función de Retorno a(s,d) = esfuerzo asociado con el arco que conecta el estado S con el estado Sn R(s,d) = a(s,d) + f(sn) 10. Ecuación Recursiva f(s) = Minimo (o Máximo) {R(s,d)} 11. Condiciòn de Contorno Son estados que el valor de la función de valor óptimo no requiere cálculo alguno, su valor es obvio, por las condiciones del problema. 17
  • 18. Prof. Henry Veneros Manrique Proceso de Solución 1. Generación de Estados Para generar el conjunto de estados, se requiere que se defina: Conjunto decisión Función de Transición Estado inicial y Restricciones 2. Procedimiento solución Para hallar la solución óptima, se requiere: Haber generado los estados Definir la función de retorno Definir la función de valor óptimo Definir el valor de la función óptima para los estados de contorno. 18
  • 19. Prof. Henry Veneros Manrique Aplicaciones 19
  • 20. Prof. Henry Veneros Manrique Características. (tomado del libro Winston) 20
  • 21. Prof. Henry Veneros Manrique Características de las aplicaciones de la PD 1. El problema se puede dividir en etapas, cada etapa requiere una decisión. 2. Cada etapa tiene un número de estados asociados con ella. Por estado se entiende la información que se necesita en cualquier etapa para tomar una decisión óptima. 3. La decisión tomada en cualquier etapa, indica como se transforma el estado en la etapa actual en el estado en la etapa siguiente. 21
  • 22. Prof. Henry Veneros Manrique Características de las aplicaciones de la PD 4. Dado el estado actual, la decisión óptima para cada una de las etapas restantes no debe depender de estados previamente alcanzados o de decisiones previamente tomadas. A esta idea se le conoce como principio de optimalidad. 5. Si los estados del problema se han clasificado en una de T etapas, debe haber una formula recursiva que relaciones el costo o recompensa ganada durante las etapas t, t+1,...,T con el costo o recompensa de las etapas t+1,t+2,...,T. 22