SlideShare una empresa de Scribd logo
1 de 41
Ecuaciones de Bellman, HJB y
Pontryagin
Breve Introducción
al Control Óptimo y
a la Programación
Dinámica
Análisis Cuantitativo del Riesgo
David Solís
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Introducción
‣ Teoría del control óptimo
• Optimizar la suma de costos de la ruta y el costo final. El resultado es la secuencia de
control óptima y la trayectoria óptima
• Entrada: Función de costo
• Salida: Trayectoria y controles óptimos
3
G-­‐NIUS	
  Hybrid	
  Unmanned	
  Ground	
  Vehicle
Introducción
‣ Optimización de trayectorias para naves espaciales
• Trayectoria de retorno de la luna a la tierra para ahorro de
combustible
‣ Finanzas
• Idear una secuencia de ordenes de compra / venta para
maximizar el beneficio
4
Los problemas de control son problemas donde la
recompensa se encuentra posteriormente
Tipos de Problemas de Control Óptimo
‣ Dinámica y ambiente pueden depender
explícitamente del tiempo
‣ El control óptimo depende explícitamente del tiempo
5
Horizonte finito (horizonte de tiempo fijo)
Tipos de Problemas de Control Óptimo
‣ Dinámica y ambiente son estáticos
‣ El control óptimo es independiente del tiempo
6
Horizonte finito (horizonte móvil)
Tipos de Problemas de Control Óptimo
‣ Tiempo mínimo
‣ Horizonte Infinito
• Recompensa con descuento, aprendizaje por refuerzo
• Recompensa total, estados de absorción
• Recompensa promedio
‣ Otras consideraciones
• Discreto vs. estado continuo
• Discreto vs. tiempo continuo
• Observable vs. observable parcial
7
Intuición
8
! ∈ Χ!representa!el!medio!ambiente!de!un!agente!
! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x!
!
!"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!!
!"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!!
!
!!puede!ser!la!ciudad!donde!se!encuentra!el!agente!
!!el!vuelo!a!tomar!
!"#$(!, !)!el!destino!del!vuelo!
!"#$(!, !)!el!precio!del!boleto!de!avión!
!
Problema!
Encontrar!la!ruta!más!barata!al!destino!deseado!
!
Formalización!
Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente!
secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total!
!
!(!, !) = !"#$(!!, !!)
!!!
!!!
!
!
donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)!
!
El!estado!inicial!!! = !!"!#
!y!el!estado!final!(destino)!!! = !!"#$
!son!conocidos!
Intuición
8
! ∈ Χ!representa!el!medio!ambiente!de!un!agente!
! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x!
!
!"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!!
!"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!!
!
!!puede!ser!la!ciudad!donde!se!encuentra!el!agente!
!!el!vuelo!a!tomar!
!"#$(!, !)!el!destino!del!vuelo!
!"#$(!, !)!el!precio!del!boleto!de!avión!
!
Problema!
Encontrar!la!ruta!más!barata!al!destino!deseado!
!
Formalización!
Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente!
secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total!
!
!(!, !) = !"#$(!!, !!)
!!!
!!!
!
!
donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)!
!
El!estado!inicial!!! = !!"!#
!y!el!estado!final!(destino)!!! = !!"#$
!son!conocidos!
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Control a Tiempo Discreto
10
Programación Dinámica
11
Programación Dinámica
11
Encontrar(la(ruta(de(costo(mínimo(de(A(a(J(
(
! ! = 0, ! ! = 3, ! ! = 4
! ! = !"# 6 + ! ! , 3 + ! !
(
(
Programación Dinámica
12
t0 t1 t2 t3
Hay 3 trayectorias óptimas de 18 posibles con costo 11:
(A,D,F,I,J), (A,D,E,H,J) y (A,C,E,H,J)
Control a Tiempo Discreto
13
El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.#
#
Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)#
#
! !, !! = min
!!:!!!
! !! + ! !, !!, !!
!!!
!!!
#
#
que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo#
de#finalización#!,#para#todos#los#estados#intermedios#!!#
#
Entonces,#
#
! !, ! = ! !
! 0, ! = min
!!:!!!
! !, !!:!!!
#
#
Control a Tiempo Discreto
13
El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.#
#
Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)#
#
! !, !! = min
!!:!!!
! !! + ! !, !!, !!
!!!
!!!
#
#
que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo#
de#finalización#!,#para#todos#los#estados#intermedios#!!#
#
Entonces,#
#
! !, ! = ! !
! 0, ! = min
!!:!!!
! !, !!:!!!
#
#
Control a Tiempo Discreto
14
Control a Tiempo Discreto
14
15
Principio de Optimalidad de Bellman

[Bellman, R.E.: “Dynamic Programming”. Princeton
University Press, 1957]
Una política óptima tiene la propiedad de que,
sean cuales sea el estado inicial y la decisión
inicial, las decisiones restantes deben constituir
una solución óptima con respecto al estado
resultante de la primera decisión.
Control a Tiempo Discreto
16
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Caso Estocástico
18
Caso Estocástico
18
Caso Estocástico
19
Ecuación de Bellman Estocástica
20
Ecuación de Bellman Estocástica
20
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Límite Continuo
22
Límite Continuo
23
Límite Continuo
23
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Principio del mínimo de Pontryagin
25
Una$alternativa$es$el$enfoque$variacional$que$directamente$encuentra$la$trayectoria$óptima$
y$el$control$óptimo.$
Principio del mínimo de Pontryagin
26
Principio del mínimo de Pontryagin
26
Derivación Principio de Pontryagin
27
Derivación Principio de Pontryagin
28
Derivación Principio de Pontryagin
28
Receta Principio de Pontryagin
29
Control a Tiempo Discreto
Caso Estocástico
Límite Continuo
Principio del Minimo de Pontryagin
Introducción
Referencias
1
2
3
4
5
6
Referencias
Otras fuentes
31
Preguntas
32

Más contenido relacionado

La actualidad más candente

El problema del agente viajero resuelto por fuerza, programación dinámica y v...
El problema del agente viajero resuelto por fuerza, programación dinámica y v...El problema del agente viajero resuelto por fuerza, programación dinámica y v...
El problema del agente viajero resuelto por fuerza, programación dinámica y v...Luis Alfredo Moctezuma Pascual
 
Seccion 3.1 Transformada Z bilateral
Seccion 3.1 Transformada Z bilateralSeccion 3.1 Transformada Z bilateral
Seccion 3.1 Transformada Z bilateralJuan Palacios
 
Analisis de sensibilidad ejercicios resueltos
Analisis de sensibilidad   ejercicios resueltosAnalisis de sensibilidad   ejercicios resueltos
Analisis de sensibilidad ejercicios resueltosLuis Nuñez
 
Ejercicio resuelto de equilibrio de nash en puras y mixtas.
Ejercicio resuelto de equilibrio de nash en puras y mixtas.Ejercicio resuelto de equilibrio de nash en puras y mixtas.
Ejercicio resuelto de equilibrio de nash en puras y mixtas.Juan Carlos Aguado Franco
 
Metodologías de Peter Checkland y Hall & Jenkins
Metodologías de Peter Checkland y Hall & JenkinsMetodologías de Peter Checkland y Hall & Jenkins
Metodologías de Peter Checkland y Hall & JenkinsDiego Casso
 
Ejemplos modelos econometricos
Ejemplos modelos econometricosEjemplos modelos econometricos
Ejemplos modelos econometricosSam Wilson
 
Calculo negocios unidadiv_verano2011
Calculo negocios unidadiv_verano2011Calculo negocios unidadiv_verano2011
Calculo negocios unidadiv_verano2011Victor Cardenas
 
Dual y simplex dual
Dual y simplex dualDual y simplex dual
Dual y simplex dualpuracastillo
 
1.4 Estructura y características de la simulación de eventos discretos.
1.4 Estructura y características de la simulación de eventos discretos.1.4 Estructura y características de la simulación de eventos discretos.
1.4 Estructura y características de la simulación de eventos discretos.avengers92
 
Ejercicios resueltos 2011
Ejercicios resueltos 2011Ejercicios resueltos 2011
Ejercicios resueltos 2011Deyvid Atens
 
David salazar flip flops
David salazar flip flopsDavid salazar flip flops
David salazar flip flopsDavidSalaazar
 
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...Ekthor Daniel R G
 
5a UNIDAD PRONÓSTICOS E INVENTARIOS
5a UNIDAD PRONÓSTICOS E INVENTARIOS5a UNIDAD PRONÓSTICOS E INVENTARIOS
5a UNIDAD PRONÓSTICOS E INVENTARIOSbonbombon
 

La actualidad más candente (20)

El problema del agente viajero resuelto por fuerza, programación dinámica y v...
El problema del agente viajero resuelto por fuerza, programación dinámica y v...El problema del agente viajero resuelto por fuerza, programación dinámica y v...
El problema del agente viajero resuelto por fuerza, programación dinámica y v...
 
Seccion 3.1 Transformada Z bilateral
Seccion 3.1 Transformada Z bilateralSeccion 3.1 Transformada Z bilateral
Seccion 3.1 Transformada Z bilateral
 
Distribucion uniforme continua
Distribucion uniforme continuaDistribucion uniforme continua
Distribucion uniforme continua
 
Analisis de sensibilidad ejercicios resueltos
Analisis de sensibilidad   ejercicios resueltosAnalisis de sensibilidad   ejercicios resueltos
Analisis de sensibilidad ejercicios resueltos
 
Simulacion-unidad 1
Simulacion-unidad 1Simulacion-unidad 1
Simulacion-unidad 1
 
cadenas de markov
cadenas de markovcadenas de markov
cadenas de markov
 
Ejercicio resuelto de equilibrio de nash en puras y mixtas.
Ejercicio resuelto de equilibrio de nash en puras y mixtas.Ejercicio resuelto de equilibrio de nash en puras y mixtas.
Ejercicio resuelto de equilibrio de nash en puras y mixtas.
 
Econometria
EconometriaEconometria
Econometria
 
Metodologías de Peter Checkland y Hall & Jenkins
Metodologías de Peter Checkland y Hall & JenkinsMetodologías de Peter Checkland y Hall & Jenkins
Metodologías de Peter Checkland y Hall & Jenkins
 
Ejemplos modelos econometricos
Ejemplos modelos econometricosEjemplos modelos econometricos
Ejemplos modelos econometricos
 
Calculo negocios unidadiv_verano2011
Calculo negocios unidadiv_verano2011Calculo negocios unidadiv_verano2011
Calculo negocios unidadiv_verano2011
 
Dual y simplex dual
Dual y simplex dualDual y simplex dual
Dual y simplex dual
 
1.4 Estructura y características de la simulación de eventos discretos.
1.4 Estructura y características de la simulación de eventos discretos.1.4 Estructura y características de la simulación de eventos discretos.
1.4 Estructura y características de la simulación de eventos discretos.
 
Ejercicios resueltos 2011
Ejercicios resueltos 2011Ejercicios resueltos 2011
Ejercicios resueltos 2011
 
U5 ANÁLISIS DE REEMPLAZO
U5 ANÁLISIS DE REEMPLAZOU5 ANÁLISIS DE REEMPLAZO
U5 ANÁLISIS DE REEMPLAZO
 
David salazar flip flops
David salazar flip flopsDavid salazar flip flops
David salazar flip flops
 
3. unidad ii_factores_upes_2013
3. unidad ii_factores_upes_20133. unidad ii_factores_upes_2013
3. unidad ii_factores_upes_2013
 
Ec360 tema04
Ec360 tema04Ec360 tema04
Ec360 tema04
 
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
 
5a UNIDAD PRONÓSTICOS E INVENTARIOS
5a UNIDAD PRONÓSTICOS E INVENTARIOS5a UNIDAD PRONÓSTICOS E INVENTARIOS
5a UNIDAD PRONÓSTICOS E INVENTARIOS
 

Destacado

Metodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosMetodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosESCOM
 
ProgramacióN Curricular
ProgramacióN CurricularProgramacióN Curricular
ProgramacióN Curricularcarmenysabel
 
Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration mmi-deco
 
Programme scours populaire
Programme scours populaireProgramme scours populaire
Programme scours populaireevanim
 
Activitat 5 viquilletra
Activitat 5 viquilletraActivitat 5 viquilletra
Activitat 5 viquilletraaanddrea
 
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèseBaromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèseEurop Assistance Group
 
Dossier de presse - CultiZer
Dossier de presse - CultiZerDossier de presse - CultiZer
Dossier de presse - CultiZerYvan Godard
 
Departement05
Departement05Departement05
Departement05CCDH75
 
Crackers Ribner Gariglio Trik
Crackers Ribner Gariglio TrikCrackers Ribner Gariglio Trik
Crackers Ribner Gariglio TrikMarcela García
 
Nuestra propuesta (1)
Nuestra propuesta (1)Nuestra propuesta (1)
Nuestra propuesta (1)Conchi Allica
 
Cultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.comCultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.comykro
 
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Julià Minguillón
 
Impactante Anaconda
Impactante AnacondaImpactante Anaconda
Impactante AnacondaLUIS VELEZ
 
Webmarketing services
Webmarketing servicesWebmarketing services
Webmarketing servicescontactgws
 

Destacado (20)

Metodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas DifusosMetodos Neuronales En Sistemas Difusos
Metodos Neuronales En Sistemas Difusos
 
ProgramacióN Curricular
ProgramacióN CurricularProgramacióN Curricular
ProgramacióN Curricular
 
Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration Oscar Ono dans Résidences Décoration
Oscar Ono dans Résidences Décoration
 
Programme scours populaire
Programme scours populaireProgramme scours populaire
Programme scours populaire
 
FOTOS ESPLENDIDAS
FOTOS ESPLENDIDASFOTOS ESPLENDIDAS
FOTOS ESPLENDIDAS
 
Collective Transformation
Collective Transformation Collective Transformation
Collective Transformation
 
Sur le fascisme de la langue
Sur le fascisme de la langueSur le fascisme de la langue
Sur le fascisme de la langue
 
Pronoms
PronomsPronoms
Pronoms
 
Activitat 5 viquilletra
Activitat 5 viquilletraActivitat 5 viquilletra
Activitat 5 viquilletra
 
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèseBaromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
Baromètre Cercle Santé-CSA-Europ Assistance 2012 - synthèse
 
Dossier de presse - CultiZer
Dossier de presse - CultiZerDossier de presse - CultiZer
Dossier de presse - CultiZer
 
Departement05
Departement05Departement05
Departement05
 
Crackers Ribner Gariglio Trik
Crackers Ribner Gariglio TrikCrackers Ribner Gariglio Trik
Crackers Ribner Gariglio Trik
 
Nuestra propuesta (1)
Nuestra propuesta (1)Nuestra propuesta (1)
Nuestra propuesta (1)
 
Cultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.comCultura Android - Push notifications con Parse.com
Cultura Android - Push notifications con Parse.com
 
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
Educational Data Mining: cerrando el círculo del proceso de aprendizaje en en...
 
Impactante Anaconda
Impactante AnacondaImpactante Anaconda
Impactante Anaconda
 
Webmarketing services
Webmarketing servicesWebmarketing services
Webmarketing services
 
Tag question
Tag questionTag question
Tag question
 
Vexetais
VexetaisVexetais
Vexetais
 

Más de David Solis

Uso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura FinancieraUso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura FinancieraDavid Solis
 
Industria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral EconomicsIndustria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral EconomicsDavid Solis
 
Percepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas FinancierosPercepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas FinancierosDavid Solis
 
Toma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCAToma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCADavid Solis
 
Ciencia, método y filosofía
Ciencia, método y filosofíaCiencia, método y filosofía
Ciencia, método y filosofíaDavid Solis
 
American Options Valuation
American Options ValuationAmerican Options Valuation
American Options ValuationDavid Solis
 
Calibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución DiferencialCalibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución DiferencialDavid Solis
 
Reproducible Research
Reproducible ResearchReproducible Research
Reproducible ResearchDavid Solis
 
Prueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovPrueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovDavid Solis
 
Gestión de Continuidad de Negocio
Gestión de Continuidad de NegocioGestión de Continuidad de Negocio
Gestión de Continuidad de NegocioDavid Solis
 
Guía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científicoGuía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científicoDavid Solis
 
Un Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para ReaseguroUn Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para ReaseguroDavid Solis
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...David Solis
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...David Solis
 
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos DelictivosCaso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos DelictivosDavid Solis
 
Organizational Change Management for IT Projects
Organizational Change Management for IT ProjectsOrganizational Change Management for IT Projects
Organizational Change Management for IT ProjectsDavid Solis
 
Persi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedasPersi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedasDavid Solis
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...David Solis
 
Métodos de Diferencias Finitas
Métodos de Diferencias FinitasMétodos de Diferencias Finitas
Métodos de Diferencias FinitasDavid Solis
 

Más de David Solis (20)

Uso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura FinancieraUso de Tecnología de Blockchain en una Infraestructura Financiera
Uso de Tecnología de Blockchain en una Infraestructura Financiera
 
Industria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral EconomicsIndustria de Seguros y Behavioral Economics
Industria de Seguros y Behavioral Economics
 
Percepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas FinancierosPercepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
Percepción y Adopción de Tecnología: Disrupción en los Sistemas Financieros
 
Toma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCAToma de decisiones en condiciones VUCA
Toma de decisiones en condiciones VUCA
 
Ciencia, método y filosofía
Ciencia, método y filosofíaCiencia, método y filosofía
Ciencia, método y filosofía
 
American Options Valuation
American Options ValuationAmerican Options Valuation
American Options Valuation
 
Algoritmo EM
Algoritmo EMAlgoritmo EM
Algoritmo EM
 
Calibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución DiferencialCalibración del Modelo Heston usando Evolución Diferencial
Calibración del Modelo Heston usando Evolución Diferencial
 
Reproducible Research
Reproducible ResearchReproducible Research
Reproducible Research
 
Prueba Kolmogorov-Smirnov
Prueba Kolmogorov-SmirnovPrueba Kolmogorov-Smirnov
Prueba Kolmogorov-Smirnov
 
Gestión de Continuidad de Negocio
Gestión de Continuidad de NegocioGestión de Continuidad de Negocio
Gestión de Continuidad de Negocio
 
Guía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científicoGuía para la elaboración de un artículo científico
Guía para la elaboración de un artículo científico
 
Un Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para ReaseguroUn Juego Diferencial Estocástico para Reaseguro
Un Juego Diferencial Estocástico para Reaseguro
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
Valuación de Opciones Europeas con el Modelo de Heston utilizando Métodos de ...
 
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos DelictivosCaso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
Caso Enron. Contabilidad Creativa, Ética Cuestionable o Actos Delictivos
 
Organizational Change Management for IT Projects
Organizational Change Management for IT ProjectsOrganizational Change Management for IT Projects
Organizational Change Management for IT Projects
 
Persi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedasPersi Diaconis y el lanzamiento de monedas
Persi Diaconis y el lanzamiento de monedas
 
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
Valuación de Opciones Europeas con el Modelo de Heston utilizando el Método d...
 
Métodos de Diferencias Finitas
Métodos de Diferencias FinitasMétodos de Diferencias Finitas
Métodos de Diferencias Finitas
 

Último

Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxJUANSIMONPACHIN
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxJUANCARLOSAPARCANARE
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024IES Vicent Andres Estelles
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxMartín Ramírez
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxMartín Ramírez
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfcoloncopias5
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfromanmillans
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicaGianninaValeskaContr
 

Último (20)

Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
VISITA À PROTEÇÃO CIVIL _
VISITA À PROTEÇÃO CIVIL                  _VISITA À PROTEÇÃO CIVIL                  _
VISITA À PROTEÇÃO CIVIL _
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
DIA INTERNACIONAL DAS FLORESTAS .
DIA INTERNACIONAL DAS FLORESTAS         .DIA INTERNACIONAL DAS FLORESTAS         .
DIA INTERNACIONAL DAS FLORESTAS .
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdf
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básica
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 

Breve introducción a control óptimo y programación dinámica

  • 1. Ecuaciones de Bellman, HJB y Pontryagin Breve Introducción al Control Óptimo y a la Programación Dinámica Análisis Cuantitativo del Riesgo David Solís
  • 2. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 3. Introducción ‣ Teoría del control óptimo • Optimizar la suma de costos de la ruta y el costo final. El resultado es la secuencia de control óptima y la trayectoria óptima • Entrada: Función de costo • Salida: Trayectoria y controles óptimos 3 G-­‐NIUS  Hybrid  Unmanned  Ground  Vehicle
  • 4. Introducción ‣ Optimización de trayectorias para naves espaciales • Trayectoria de retorno de la luna a la tierra para ahorro de combustible ‣ Finanzas • Idear una secuencia de ordenes de compra / venta para maximizar el beneficio 4 Los problemas de control son problemas donde la recompensa se encuentra posteriormente
  • 5. Tipos de Problemas de Control Óptimo ‣ Dinámica y ambiente pueden depender explícitamente del tiempo ‣ El control óptimo depende explícitamente del tiempo 5 Horizonte finito (horizonte de tiempo fijo)
  • 6. Tipos de Problemas de Control Óptimo ‣ Dinámica y ambiente son estáticos ‣ El control óptimo es independiente del tiempo 6 Horizonte finito (horizonte móvil)
  • 7. Tipos de Problemas de Control Óptimo ‣ Tiempo mínimo ‣ Horizonte Infinito • Recompensa con descuento, aprendizaje por refuerzo • Recompensa total, estados de absorción • Recompensa promedio ‣ Otras consideraciones • Discreto vs. estado continuo • Discreto vs. tiempo continuo • Observable vs. observable parcial 7
  • 8. Intuición 8 ! ∈ Χ!representa!el!medio!ambiente!de!un!agente! ! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x! ! !"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!! !"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!! ! !!puede!ser!la!ciudad!donde!se!encuentra!el!agente! !!el!vuelo!a!tomar! !"#$(!, !)!el!destino!del!vuelo! !"#$(!, !)!el!precio!del!boleto!de!avión! ! Problema! Encontrar!la!ruta!más!barata!al!destino!deseado! ! Formalización! Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente! secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total! ! !(!, !) = !"#$(!!, !!) !!! !!! ! ! donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)! ! El!estado!inicial!!! = !!"!# !y!el!estado!final!(destino)!!! = !!"#$ !son!conocidos!
  • 9. Intuición 8 ! ∈ Χ!representa!el!medio!ambiente!de!un!agente! ! ∈ U(x)!la!acción!o!control!que!el!agente!elige!cuando!se!encuentra!en!el!estado!x! ! !"#$(!, !) ∈ Χ!denota!el!estado!que!resulta!de!aplicar!la!acción!!!en!el!estado!!! !"#$(!, !) ≥ 0!el!costo!de!aplicar!!!en!!! ! !!puede!ser!la!ciudad!donde!se!encuentra!el!agente! !!el!vuelo!a!tomar! !"#$(!, !)!el!destino!del!vuelo! !"#$(!, !)!el!precio!del!boleto!de!avión! ! Problema! Encontrar!la!ruta!más!barata!al!destino!deseado! ! Formalización! Encontrar!una!secuencia!de!acciones!(!!, !!, … , !!!!)!y!la!correspondiente! secuencia!de!estados!(!!, !!, … , !!)!que!minimice!el!costo!total! ! !(!, !) = !"#$(!!, !!) !!! !!! ! ! donde!!!!! = !"#$(!!, !!)!y!!! ∈ !(!!)! ! El!estado!inicial!!! = !!"!# !y!el!estado!final!(destino)!!! = !!"#$ !son!conocidos!
  • 10. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 11. Control a Tiempo Discreto 10
  • 13. Programación Dinámica 11 Encontrar(la(ruta(de(costo(mínimo(de(A(a(J( ( ! ! = 0, ! ! = 3, ! ! = 4 ! ! = !"# 6 + ! ! , 3 + ! ! ( (
  • 14. Programación Dinámica 12 t0 t1 t2 t3 Hay 3 trayectorias óptimas de 18 posibles con costo 11: (A,D,F,I,J), (A,D,E,H,J) y (A,C,E,H,J)
  • 15. Control a Tiempo Discreto 13 El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.# # Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)# # ! !, !! = min !!:!!! ! !! + ! !, !!, !! !!! !!! # # que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo# de#finalización#!,#para#todos#los#estados#intermedios#!!# # Entonces,# # ! !, ! = ! ! ! 0, ! = min !!:!!! ! !, !!:!!! # #
  • 16. Control a Tiempo Discreto 13 El#problema#de#control#óptimo#se#puede#resolver#mediante#programación#dinámica.# # Introducir#la#función#de#costo#óptima#(optimal(cost+to+go(function)# # ! !, !! = min !!:!!! ! !! + ! !, !!, !! !!! !!! # # que#resuelve#el#problema#de#control#óptimo#desde#un#tiempo#intermedio#!#hasta#el#tiempo# de#finalización#!,#para#todos#los#estados#intermedios#!!# # Entonces,# # ! !, ! = ! ! ! 0, ! = min !!:!!! ! !, !!:!!! # #
  • 17. Control a Tiempo Discreto 14
  • 18. Control a Tiempo Discreto 14
  • 19. 15 Principio de Optimalidad de Bellman
 [Bellman, R.E.: “Dynamic Programming”. Princeton University Press, 1957] Una política óptima tiene la propiedad de que, sean cuales sea el estado inicial y la decisión inicial, las decisiones restantes deben constituir una solución óptima con respecto al estado resultante de la primera decisión.
  • 20. Control a Tiempo Discreto 16
  • 21. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 25. Ecuación de Bellman Estocástica 20
  • 26. Ecuación de Bellman Estocástica 20
  • 27. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 31. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6
  • 32. Principio del mínimo de Pontryagin 25 Una$alternativa$es$el$enfoque$variacional$que$directamente$encuentra$la$trayectoria$óptima$ y$el$control$óptimo.$
  • 33. Principio del mínimo de Pontryagin 26
  • 34. Principio del mínimo de Pontryagin 26
  • 35. Derivación Principio de Pontryagin 27
  • 36. Derivación Principio de Pontryagin 28
  • 37. Derivación Principio de Pontryagin 28
  • 38. Receta Principio de Pontryagin 29
  • 39. Control a Tiempo Discreto Caso Estocástico Límite Continuo Principio del Minimo de Pontryagin Introducción Referencias 1 2 3 4 5 6