SlideShare una empresa de Scribd logo
Ecuaciones de Bellman, HJB y
Pontryagin
Breve Introducción
al Control Óptimo y
a la Programación
Dinámica
Análisis Cuantitativo del Riesgo
David Solís
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Introducción
‣ Teoría del control óptimo
• Optimizar la suma de costos de la ruta y el costo final. El resultado es la secuencia de
control óptima y la trayectoria óptima
• Entrada: Función de costo
• Salida: Trayectoria y controles óptimos
3
G-­‐NIUS	
  Hybrid	
  Unmanned	
  Ground	
  Vehicle
Introducción
‣ Optimización de trayectorias para naves espaciales
• Trayectoria de retorno de la luna a la tierra para ahorro de
combustible
‣ Finanzas
• Idear una secuencia de ordenes de compra / venta para
maximizar el beneficio
4
Los problemas de control son problemas donde la
recompensa se encuentra posteriormente
Tipos de Problemas de Control Óptimo
‣ Dinámica y ambiente pueden depender
explícitamente del tiempo
‣ El control óptimo depende explícitamente del tiempo
5
Horizonte finito (horizonte de tiempo fijo)
Tipos de Problemas de Control Óptimo
‣ Dinámica y ambiente son estáticos
‣ El control óptimo es independiente del tiempo
6
Horizonte finito (horizonte móvil)
Tipos de Problemas de Control Óptimo
‣ Tiempo mínimo
‣ Horizonte Infinito
• Recompensa con descuento, aprendizaje por refuerzo
• Recompensa total, estados de absorción
• Recompensa promedio
‣ Otras consideraciones
• Discreto vs. estado continuo
• Discreto vs. tiempo continuo
• Observable vs. observable parcial
7
Intuición
8
! ∈ Χ!representa!el!medio!ambiente!de!un!agente!
! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x!
!
!"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!!
!"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!!
!
!!puede!ser!la!ciudad!donde!se!encuentra!el!agente!
!!el!vuelo!a!tomar!
!"#$(!, !)!el!destino!del!vuelo!
!"#$(!, !)!el!precio!del!boleto!de!avión!
!
Problema!
Encontrar!la!ruta!más!barata!al!destino!deseado!
!
Formalización!
Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente!
secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total!
!
!(!, !) = !"#$(!!, !!)
!!!
!!!
!
!
donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)!
!
El!estado!inicial!!! = !!"!#
!y!el!estado!final!(destino)!!! = !!"#$
!son!conocidos!
Intuición
8
! ∈ Χ!representa!el!medio!ambiente!de!un!agente!
! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x!
!
!"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!!
!"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!!
!
!!puede!ser!la!ciudad!donde!se!encuentra!el!agente!
!!el!vuelo!a!tomar!
!"#$(!, !)!el!destino!del!vuelo!
!"#$(!, !)!el!precio!del!boleto!de!avión!
!
Problema!
Encontrar!la!ruta!más!barata!al!destino!deseado!
!
Formalización!
Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente!
secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total!
!
!(!, !) = !"#$(!!, !!)
!!!
!!!
!
!
donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)!
!
El!estado!inicial!!! = !!"!#
!y!el!estado!final!(destino)!!! = !!"#$
!son!conocidos!
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Control a Tiempo Discreto
10
Programación Dinámica
11
Programación Dinámica
11
Encontrar(la(ruta(de(costo(mínimo(de(A(a(J(
(
! ! = 0, ! ! = 3, ! ! = 4
! ! = !"# 6 + ! ! , 3 + ! !
(
(
Programación Dinámica
12
t0 t1 t2 t3
Hay 3 trayectorias óptimas de 18 posibles con costo 11:
(A,D,F,I,J), (A,D,E,H,J) y (A,C,E,H,J)
Control a Tiempo Discreto
13
El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.#
#
Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)#
#
! !, !! = min
!!:!!!
! !! + ! !, !!, !!
!!!
!!!
#
#
que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo#
de#finalización#!,#para#todos#los#estados#intermedios#!!#
#
Entonces,#
#
! !, ! = ! !
! 0, ! = min
!!:!!!
! !, !!:!!!
#
#
Control a Tiempo Discreto
13
El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.#
#
Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)#
#
! !, !! = min
!!:!!!
! !! + ! !, !!, !!
!!!
!!!
#
#
que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo#
de#finalización#!,#para#todos#los#estados#intermedios#!!#
#
Entonces,#
#
! !, ! = ! !
! 0, ! = min
!!:!!!
! !, !!:!!!
#
#
Control a Tiempo Discreto
14
Control a Tiempo Discreto
14
15
Principio de Optimalidad de Bellman

[Bellman, R.E.: “Dynamic Programming”. Princeton
University Press, 1957]
Una política óptima tiene la propiedad de que,
sean cuales sea el estado inicial y la decisión
inicial, las decisiones restantes deben constituir
una solución óptima con respecto al estado
resultante de la primera decisión.
Control a Tiempo Discreto
16
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Caso Estocástico
18
Caso Estocástico
18
Caso Estocástico
19
Ecuación de Bellman Estocástica
20
Ecuación de Bellman Estocástica
20
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Límite Continuo
22
Límite Continuo
23
Límite Continuo
23
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Principio del mínimo de Pontryagin
25
Una$alternativa$es$el$enfoque$variacional$que$directamente$encuentra$la$trayectoria$óptima$
y$el$control$óptimo.$
Principio del mínimo de Pontryagin
26
Principio del mínimo de Pontryagin
26
Derivación Principio de Pontryagin
27
Derivación Principio de Pontryagin
28
Derivación Principio de Pontryagin
28
Receta Principio de Pontryagin
29
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Referencias
Otras fuentes
31
Preguntas
32

Más contenido relacionado

La actualidad más candente

Soluciones factibles y soluciones básicas factibles
Soluciones factibles y soluciones básicas factiblesSoluciones factibles y soluciones básicas factibles
Soluciones factibles y soluciones básicas factibles
Lupita Rodríguez
 
Unidad 3. Programación dinámica
Unidad 3. Programación dinámicaUnidad 3. Programación dinámica
Unidad 3. Programación dinámica
Universidad del golfo de México Norte
 
Formulario matematicas financieras
Formulario matematicas financierasFormulario matematicas financieras
Formulario matematicas financieras
antonio riutort
 
2.3 metodos de aproximacion
2.3 metodos de aproximacion2.3 metodos de aproximacion
2.3 metodos de aproximacionmorenito9001
 
Ineficiencia en los monopolios
Ineficiencia en los monopoliosIneficiencia en los monopolios
Ineficiencia en los monopolios
Mauro Gutierrez
 
Introducción a las Derivadas Parciales MA-III ccesa007
Introducción a las Derivadas Parciales  MA-III  ccesa007Introducción a las Derivadas Parciales  MA-III  ccesa007
Introducción a las Derivadas Parciales MA-III ccesa007
Demetrio Ccesa Rayme
 
Problemas resueltos-de-metodos-de-transporte
Problemas resueltos-de-metodos-de-transporteProblemas resueltos-de-metodos-de-transporte
Problemas resueltos-de-metodos-de-transporteAlexander Chunhuay Ruiz
 
concepción del concepto de limite
concepción del concepto de limiteconcepción del concepto de limite
concepción del concepto de limiteizumorin
 
El poder de mercado
El poder de mercado El poder de mercado
El poder de mercado
David Enrique Garcia Guevara
 
Cien problemas de programacion lineal parte 3
Cien problemas de programacion lineal   parte 3Cien problemas de programacion lineal   parte 3
Cien problemas de programacion lineal parte 3
fzeus
 
Vbtora98
Vbtora98Vbtora98
0 Prob7
0 Prob70 Prob7
Programación Dinámica
Programación DinámicaProgramación Dinámica
Programación Dinámica
Xavi2701
 
Analisis de sensibilidad 2222222 (1)
Analisis de sensibilidad   2222222 (1)Analisis de sensibilidad   2222222 (1)
Analisis de sensibilidad 2222222 (1)Irene Sarcos
 
Algoritmo de backtracking
Algoritmo de backtrackingAlgoritmo de backtracking
Algoritmo de backtrackingVictor Gonzalez
 
Procesos y Cadenas de Markov
Procesos y Cadenas de MarkovProcesos y Cadenas de Markov
Procesos y Cadenas de Markov
Luis Coba
 
Tema iii método gráfico y simplex
Tema iii   método gráfico y simplexTema iii   método gráfico y simplex
Tema iii método gráfico y simplexgoogle
 
Programacion lineal trabajo final-
Programacion lineal  trabajo final-Programacion lineal  trabajo final-
Programacion lineal trabajo final-Dayana Castro
 
Ejercicios resueltos base ortonormal
Ejercicios resueltos base ortonormalEjercicios resueltos base ortonormal
Ejercicios resueltos base ortonormalalgebra
 

La actualidad más candente (20)

Soluciones factibles y soluciones básicas factibles
Soluciones factibles y soluciones básicas factiblesSoluciones factibles y soluciones básicas factibles
Soluciones factibles y soluciones básicas factibles
 
Unidad 3. Programación dinámica
Unidad 3. Programación dinámicaUnidad 3. Programación dinámica
Unidad 3. Programación dinámica
 
Formulario matematicas financieras
Formulario matematicas financierasFormulario matematicas financieras
Formulario matematicas financieras
 
2.3 metodos de aproximacion
2.3 metodos de aproximacion2.3 metodos de aproximacion
2.3 metodos de aproximacion
 
Ineficiencia en los monopolios
Ineficiencia en los monopoliosIneficiencia en los monopolios
Ineficiencia en los monopolios
 
Introducción a las Derivadas Parciales MA-III ccesa007
Introducción a las Derivadas Parciales  MA-III  ccesa007Introducción a las Derivadas Parciales  MA-III  ccesa007
Introducción a las Derivadas Parciales MA-III ccesa007
 
Problemas resueltos-de-metodos-de-transporte
Problemas resueltos-de-metodos-de-transporteProblemas resueltos-de-metodos-de-transporte
Problemas resueltos-de-metodos-de-transporte
 
concepción del concepto de limite
concepción del concepto de limiteconcepción del concepto de limite
concepción del concepto de limite
 
El poder de mercado
El poder de mercado El poder de mercado
El poder de mercado
 
Cien problemas de programacion lineal parte 3
Cien problemas de programacion lineal   parte 3Cien problemas de programacion lineal   parte 3
Cien problemas de programacion lineal parte 3
 
Modelo solow
Modelo solowModelo solow
Modelo solow
 
Vbtora98
Vbtora98Vbtora98
Vbtora98
 
0 Prob7
0 Prob70 Prob7
0 Prob7
 
Programación Dinámica
Programación DinámicaProgramación Dinámica
Programación Dinámica
 
Analisis de sensibilidad 2222222 (1)
Analisis de sensibilidad   2222222 (1)Analisis de sensibilidad   2222222 (1)
Analisis de sensibilidad 2222222 (1)
 
Algoritmo de backtracking
Algoritmo de backtrackingAlgoritmo de backtracking
Algoritmo de backtracking
 
Procesos y Cadenas de Markov
Procesos y Cadenas de MarkovProcesos y Cadenas de Markov
Procesos y Cadenas de Markov
 
Tema iii método gráfico y simplex
Tema iii   método gráfico y simplexTema iii   método gráfico y simplex
Tema iii método gráfico y simplex
 
Programacion lineal trabajo final-
Programacion lineal  trabajo final-Programacion lineal  trabajo final-
Programacion lineal trabajo final-
 
Ejercicios resueltos base ortonormal
Ejercicios resueltos base ortonormalEjercicios resueltos base ortonormal
Ejercicios resueltos base ortonormal
 

Destacado

Metodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosMetodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosESCOM
 
ProgramacióN Curricular
ProgramacióN CurricularProgramacióN Curricular
ProgramacióN Curricularcarmenysabel
 
Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration mmi-deco
 
Programme scours populaire
Programme scours populaireProgramme scours populaire
Programme scours populaireevanim
 
Collective Transformation
Collective Transformation Collective Transformation
Collective Transformation
Lorenzo del Marmol
 
Pronoms
PronomsPronoms
Activitat 5 viquilletra
Activitat 5 viquilletraActivitat 5 viquilletra
Activitat 5 viquilletraaanddrea
 
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèseBaromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèseEurop Assistance Group
 
Dossier de presse - CultiZer
Dossier de presse - CultiZerDossier de presse - CultiZer
Dossier de presse - CultiZer
Yvan Godard
 
Departement05
Departement05Departement05
Departement05CCDH75
 
Crackers Ribner Gariglio Trik
Crackers Ribner Gariglio TrikCrackers Ribner Gariglio Trik
Crackers Ribner Gariglio TrikMarcela García
 
Nuestra propuesta (1)
Nuestra propuesta (1)Nuestra propuesta (1)
Nuestra propuesta (1)Conchi Allica
 
Cultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.comCultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.com
ykro
 
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Julià Minguillón
 
Impactante Anaconda
Impactante AnacondaImpactante Anaconda
Impactante AnacondaLUIS VELEZ
 
Webmarketing services
Webmarketing servicesWebmarketing services
Webmarketing servicescontactgws
 

Destacado (20)

Metodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosMetodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas Difusos
 
ProgramacióN Curricular
ProgramacióN CurricularProgramacióN Curricular
ProgramacióN Curricular
 
Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration
 
Programme scours populaire
Programme scours populaireProgramme scours populaire
Programme scours populaire
 
FOTOS ESPLENDIDAS
FOTOS ESPLENDIDASFOTOS ESPLENDIDAS
FOTOS ESPLENDIDAS
 
Collective Transformation
Collective Transformation Collective Transformation
Collective Transformation
 
Sur le fascisme de la langue
Sur le fascisme de la langueSur le fascisme de la langue
Sur le fascisme de la langue
 
Pronoms
PronomsPronoms
Pronoms
 
Activitat 5 viquilletra
Activitat 5 viquilletraActivitat 5 viquilletra
Activitat 5 viquilletra
 
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèseBaromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
 
Dossier de presse - CultiZer
Dossier de presse - CultiZerDossier de presse - CultiZer
Dossier de presse - CultiZer
 
Departement05
Departement05Departement05
Departement05
 
Crackers Ribner Gariglio Trik
Crackers Ribner Gariglio TrikCrackers Ribner Gariglio Trik
Crackers Ribner Gariglio Trik
 
Nuestra propuesta (1)
Nuestra propuesta (1)Nuestra propuesta (1)
Nuestra propuesta (1)
 
Cultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.comCultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.com
 
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
 
Impactante Anaconda
Impactante AnacondaImpactante Anaconda
Impactante Anaconda
 
Webmarketing services
Webmarketing servicesWebmarketing services
Webmarketing services
 
Tag question
Tag questionTag question
Tag question
 
Vexetais
VexetaisVexetais
Vexetais
 

Más de David Solis

Uso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura FinancieraUso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura Financiera
David Solis
 
Industria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral EconomicsIndustria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral Economics
David Solis
 
Percepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas FinancierosPercepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
David Solis
 
Toma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCAToma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCA
David Solis
 
Ciencia, método y filosofía
Ciencia, método y filosofíaCiencia, método y filosofía
Ciencia, método y filosofía
David Solis
 
American Options Valuation
American Options ValuationAmerican Options Valuation
American Options Valuation
David Solis
 
Algoritmo EM
Algoritmo EMAlgoritmo EM
Algoritmo EM
David Solis
 
Calibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución DiferencialCalibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución Diferencial
David Solis
 
Reproducible Research
Reproducible ResearchReproducible Research
Reproducible Research
David Solis
 
Prueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovPrueba Kolmogorov-Smirnov
Prueba Kolmogorov-Smirnov
David Solis
 
Gestión de Continuidad de Negocio
Gestión de Continuidad de NegocioGestión de Continuidad de Negocio
Gestión de Continuidad de Negocio
David Solis
 
Guía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científicoGuía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científico
David Solis
 
Un Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para ReaseguroUn Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para Reaseguro
David Solis
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
David Solis
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
David Solis
 
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos DelictivosCaso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
David Solis
 
Organizational Change Management for IT Projects
Organizational Change Management for IT ProjectsOrganizational Change Management for IT Projects
Organizational Change Management for IT Projects
David Solis
 
Persi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedasPersi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedas
David Solis
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
David Solis
 
Métodos de Diferencias Finitas
Métodos de Diferencias FinitasMétodos de Diferencias Finitas
Métodos de Diferencias Finitas
David Solis
 

Más de David Solis (20)

Uso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura FinancieraUso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura Financiera
 
Industria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral EconomicsIndustria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral Economics
 
Percepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas FinancierosPercepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
 
Toma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCAToma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCA
 
Ciencia, método y filosofía
Ciencia, método y filosofíaCiencia, método y filosofía
Ciencia, método y filosofía
 
American Options Valuation
American Options ValuationAmerican Options Valuation
American Options Valuation
 
Algoritmo EM
Algoritmo EMAlgoritmo EM
Algoritmo EM
 
Calibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución DiferencialCalibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución Diferencial
 
Reproducible Research
Reproducible ResearchReproducible Research
Reproducible Research
 
Prueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovPrueba Kolmogorov-Smirnov
Prueba Kolmogorov-Smirnov
 
Gestión de Continuidad de Negocio
Gestión de Continuidad de NegocioGestión de Continuidad de Negocio
Gestión de Continuidad de Negocio
 
Guía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científicoGuía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científico
 
Un Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para ReaseguroUn Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para Reaseguro
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
 
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos DelictivosCaso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
 
Organizational Change Management for IT Projects
Organizational Change Management for IT ProjectsOrganizational Change Management for IT Projects
Organizational Change Management for IT Projects
 
Persi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedasPersi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedas
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
 
Métodos de Diferencias Finitas
Métodos de Diferencias FinitasMétodos de Diferencias Finitas
Métodos de Diferencias Finitas
 

Último

Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
danitarb
 
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptxc3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
Martín Ramírez
 
Fase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometricoFase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometrico
YasneidyGonzalez
 
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
20minutos
 
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdfFORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
El Fortí
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
pablomarin116
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
auxsoporte
 
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdfTestimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Txema Gs
 
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdfUn libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
sandradianelly
 
FICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIA
FICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIAFICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIA
FICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIA
JavierMontero58
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
Distea V región
 
El fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docxEl fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docx
Alejandrino Halire Ccahuana
 
Proceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de PamplonaProceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de Pamplona
Edurne Navarro Bueno
 
Educar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdfEducar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdf
Demetrio Ccesa Rayme
 
Junio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividadesJunio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividades
cintiat3400
 
Asistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdf
Asistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdfAsistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdf
Asistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdf
Demetrio Ccesa Rayme
 
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
HuallpaSamaniegoSeba
 
Fase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcionalFase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcional
YasneidyGonzalez
 
Fase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría AnalíticaFase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría Analítica
YasneidyGonzalez
 
HABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdf
HABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdfHABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdf
HABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdf
DIANADIAZSILVA1
 

Último (20)

Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
 
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptxc3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
c3.hu3.p3.p2.Superioridad e inferioridad en la sociedad.pptx
 
Fase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometricoFase 2, Pensamiento variacional y trigonometrico
Fase 2, Pensamiento variacional y trigonometrico
 
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
 
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdfFORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
 
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdfTestimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdf
 
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdfUn libro sin recetas, para la maestra y el maestro Fase 3.pdf
Un libro sin recetas, para la maestra y el maestro Fase 3.pdf
 
FICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIA
FICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIAFICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIA
FICHA DE EJERCICIOS GRECIA 1º DE LA ESO HISTORIA
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
 
El fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docxEl fundamento del gobierno de Dios. Lec. 09. docx
El fundamento del gobierno de Dios. Lec. 09. docx
 
Proceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de PamplonaProceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de Pamplona
 
Educar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdfEducar por Competencias GS2 Ccesa007.pdf
Educar por Competencias GS2 Ccesa007.pdf
 
Junio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividadesJunio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividades
 
Asistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdf
Asistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdfAsistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdf
Asistencia Tecnica Cartilla Pedagogica DUA Ccesa007.pdf
 
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
 
Fase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcionalFase 1, Lenguaje algebraico y pensamiento funcional
Fase 1, Lenguaje algebraico y pensamiento funcional
 
Fase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría AnalíticaFase 3; Estudio de la Geometría Analítica
Fase 3; Estudio de la Geometría Analítica
 
HABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdf
HABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdfHABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdf
HABILIDADES MOTRICES BASICAS Y ESPECIFICAS.pdf
 

Breve introducción a control óptimo y programación dinámica

  • 1. Ecuaciones de Bellman, HJB y Pontryagin Breve Introducción al Control Óptimo y a la Programación Dinámica Análisis Cuantitativo del Riesgo David Solís
  • 2. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 3. Introducción ‣ Teoría del control óptimo • Optimizar la suma de costos de la ruta y el costo final. El resultado es la secuencia de control óptima y la trayectoria óptima • Entrada: Función de costo • Salida: Trayectoria y controles óptimos 3 G-­‐NIUS  Hybrid  Unmanned  Ground  Vehicle
  • 4. Introducción ‣ Optimización de trayectorias para naves espaciales • Trayectoria de retorno de la luna a la tierra para ahorro de combustible ‣ Finanzas • Idear una secuencia de ordenes de compra / venta para maximizar el beneficio 4 Los problemas de control son problemas donde la recompensa se encuentra posteriormente
  • 5. Tipos de Problemas de Control Óptimo ‣ Dinámica y ambiente pueden depender explícitamente del tiempo ‣ El control óptimo depende explícitamente del tiempo 5 Horizonte finito (horizonte de tiempo fijo)
  • 6. Tipos de Problemas de Control Óptimo ‣ Dinámica y ambiente son estáticos ‣ El control óptimo es independiente del tiempo 6 Horizonte finito (horizonte móvil)
  • 7. Tipos de Problemas de Control Óptimo ‣ Tiempo mínimo ‣ Horizonte Infinito • Recompensa con descuento, aprendizaje por refuerzo • Recompensa total, estados de absorción • Recompensa promedio ‣ Otras consideraciones • Discreto vs. estado continuo • Discreto vs. tiempo continuo • Observable vs. observable parcial 7
  • 8. Intuición 8 ! ∈ Χ!representa!el!medio!ambiente!de!un!agente! ! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x! ! !"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!! !"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!! ! !!puede!ser!la!ciudad!donde!se!encuentra!el!agente! !!el!vuelo!a!tomar! !"#$(!, !)!el!destino!del!vuelo! !"#$(!, !)!el!precio!del!boleto!de!avión! ! Problema! Encontrar!la!ruta!más!barata!al!destino!deseado! ! Formalización! Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente! secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total! ! !(!, !) = !"#$(!!, !!) !!! !!! ! ! donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)! ! El!estado!inicial!!! = !!"!# !y!el!estado!final!(destino)!!! = !!"#$ !son!conocidos!
  • 9. Intuición 8 ! ∈ Χ!representa!el!medio!ambiente!de!un!agente! ! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x! ! !"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!! !"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!! ! !!puede!ser!la!ciudad!donde!se!encuentra!el!agente! !!el!vuelo!a!tomar! !"#$(!, !)!el!destino!del!vuelo! !"#$(!, !)!el!precio!del!boleto!de!avión! ! Problema! Encontrar!la!ruta!más!barata!al!destino!deseado! ! Formalización! Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente! secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total! ! !(!, !) = !"#$(!!, !!) !!! !!! ! ! donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)! ! El!estado!inicial!!! = !!"!# !y!el!estado!final!(destino)!!! = !!"#$ !son!conocidos!
  • 10. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 11. Control a Tiempo Discreto 10
  • 13. Programación Dinámica 11 Encontrar(la(ruta(de(costo(mínimo(de(A(a(J( ( ! ! = 0, ! ! = 3, ! ! = 4 ! ! = !"# 6 + ! ! , 3 + ! ! ( (
  • 14. Programación Dinámica 12 t0 t1 t2 t3 Hay 3 trayectorias óptimas de 18 posibles con costo 11: (A,D,F,I,J), (A,D,E,H,J) y (A,C,E,H,J)
  • 15. Control a Tiempo Discreto 13 El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.# # Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)# # ! !, !! = min !!:!!! ! !! + ! !, !!, !! !!! !!! # # que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo# de#finalización#!,#para#todos#los#estados#intermedios#!!# # Entonces,# # ! !, ! = ! ! ! 0, ! = min !!:!!! ! !, !!:!!! # #
  • 16. Control a Tiempo Discreto 13 El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.# # Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)# # ! !, !! = min !!:!!! ! !! + ! !, !!, !! !!! !!! # # que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo# de#finalización#!,#para#todos#los#estados#intermedios#!!# # Entonces,# # ! !, ! = ! ! ! 0, ! = min !!:!!! ! !, !!:!!! # #
  • 17. Control a Tiempo Discreto 14
  • 18. Control a Tiempo Discreto 14
  • 19. 15 Principio de Optimalidad de Bellman
 [Bellman, R.E.: “Dynamic Programming”. Princeton University Press, 1957] Una política óptima tiene la propiedad de que, sean cuales sea el estado inicial y la decisión inicial, las decisiones restantes deben constituir una solución óptima con respecto al estado resultante de la primera decisión.
  • 20. Control a Tiempo Discreto 16
  • 21. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 25. Ecuación de Bellman Estocástica 20
  • 26. Ecuación de Bellman Estocástica 20
  • 27. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 31. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 32. Principio del mínimo de Pontryagin 25 Una$alternativa$es$el$enfoque$variacional$que$directamente$encuentra$la$trayectoria$óptima$ y$el$control$óptimo.$
  • 33. Principio del mínimo de Pontryagin 26
  • 34. Principio del mínimo de Pontryagin 26
  • 35. Derivación Principio de Pontryagin 27
  • 36. Derivación Principio de Pontryagin 28
  • 37. Derivación Principio de Pontryagin 28
  • 38. Receta Principio de Pontryagin 29
  • 39. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6