SlideShare una empresa de Scribd logo
1 de 18
Programación Dinámica
PROGRAMACIÓN DINÁMICA
 CARACTERISTICAS DE LA PROGRAMACIÓN DINÁMICA
Puede definirse como una técnica matemática para la solución de una serie de
decisiones en secuencia. Hay que tomar una secuencia de decisiones con cada
una de ellas que afecte las decisiones futuras. Por consiguiente, el ejecutivo se
enfrenta a situaciones que requieren que tome una serie de decisiones, en las
que el buen éxito de cada una, depende de los resultados de una decisión
previa de la misma serie.
Además de la característica esencial de la toma de decisiones en secuencia,
los problemas de programación dinámica tienen otras propiedades. Solo hay
que conocer una pequeña cantidad de datos en cada etapa, a fin describir el
problema. En realidad los problemas de programación dinámica se caracterizan
por la dependencia del resultado de las decisiones de una pequeña cantidad de
variables. Otra característica es que, en cualquier etapa, el resultado de una
decisión altera los valores de las variables relacionadas con el problema. Por lo
tanto, habrá que considerar el mismo numero de variables para la siguiente
serie.
En un problema de programación dinámica, hay que tomar una serie de decisiones en
una secuencia determinada. Cuando se hace así, se persigue una política óptima, sin
que importe cuales hayan sido los estados y decisiones anteriores, las decisiones
restantes constituirán una política óptima con respecto al estado que se obtenga con
la primera decisión.
 ESTRUCTURA DE LA PROGRAMACIÓN DINÁMICA
La programación dinámica comparte algunos conceptos con otros métodos
cuantitativos. El primer concepto es el de una variable de estado, cuyos valores
especifican las condiciones las condiciones del proceso. Los valores de esas variables
nos dicen todo lo que necesitamos saber sobre el sistema, a fin de tomar decisiones.
Por ejemplo, en un problema de producción, podríamos requerir variables de estado
que se relacionen con la capacidad de fabricas y los inventarios actuales. Hay que
recordar que el numero de variables de estado puede ser muy grande. Sin embargo,
la dificultad para resolver un problema aumenta considerablemente con un número
creciente de variables, y por lo tanto es conveniente reducir al mínimo el número de
variables de estado.
En la estructura de un problema de programación dinámica, se incluye el concepto de
una “decisión”, que es una oportunidad para cambiar las variables de estado en una
forma probabilística. Las retribuciones generadas por cada decisión dependen de los
estados de principio y de fin de la misma, y de ese modo se convierten en una
secuencia de decisiones. La tarea inmediata consiste en tomar decisiones que
aumenten al máximo las retribuciones totales. Pág. 354
Programación Dinámica
Probabilística
Modelos Probabilísticos
18 Enero 2010
Contenido
• Introducción
• Un juego de azar
• Referencias
Introducción
• La programación dinámica probabilística (PDP)
difiere de la programación dinámica
determinística (PDD) en que
– Las condiciones y resultados en cada etapa no son
fijos, sino que tienen un componente de aleatoriedad
– Se hace uso de conceptos de probabilidad en la
obtención de su solución
• Presentaremos la PDP mediante algunos
problemas prototipo
Un juego de azar
• Una variante del juego de ruleta requiere que
se gire una rueda marcada con los números
de 1 a n
• La probabilidad de que la rueda se detenga
en un número i después de hacerla girar es pi
• Un jugador paga $x para tener derecho a
girar la rueda hasta m veces
• El jugador obtiene como ganancia el doble
del número que obtiene cuando gira por
última vez
• Suponiendo que el juego se repite un número
grande de veces, queremos diseñar una
estrategia óptima para el jugador
Planteamiento general
• Para poner el problema en términos de PD,
consideremos lo siguiente:
– La etapa i corresponde a la i-ésima vuelta de la
rueda, i = 1, 2, …, m
– En cada etapa hay dos alternativas: se gira la
rueda una vez más o se termina el juego
– El estado j del sistema en la etapa i es el número
que se obtuvo la última vez que se giró la rueda,
el cual está entre 1 y n
Planteamiento general
• Sea fi(j) = Ganancia máxima esperada
dado que el juego está en la etapa i y
que el resultado de la última vuelta fue
j, entonces
 
 
1
1
2 , si termina
max
, si continúa
n
i
k i
k
j
f j
p f k




 


Planteamiento general
• La ecuación recursiva es entonces
 
 
1
1
2 , si termina
max , 2,...,
, si continúa
n
i
k i
k
j
f j i m
p f k




 



 
1 2
m
f j j
 
   
1 2
1
0
n
k
k
f p f k

 
Planteamiento general
• Los cálculos comienzan con fm+1 y
terminan con f1, de modo que hay m+1
etapas
• f1(0) representa el rendimiento
esperado de las m vueltas, así que el
rendimiento esperado neto, Rn, es
 
1 0
n
R f x
 
Ejemplo
• Supongamos que la ruleta está marcada con
los números 1 a 5 y que las probabilidades de
que se detenga en cada número son p1 = 0.30,
p2 = 0.25, p3 = 0.20, p4 = 0.15, p5 = 0.10
• El jugador paga $5 por un máximo de cuatro
vueltas
• Determine la estrategia óptima para cada una
de las cuatro vueltas y encuentre el
rendimiento esperado neto asociado
Ejemplo
Etapa 4 f4(j) = 2j
Resultado de la
vuelta 4 Solución óptima
j f4(j) Decisión
1 2 Terminar
2 4 Terminar
3 6 Terminar
4 8 Terminar
5 10 Terminar
Etapa 3
f3
(j) = max{2j,
Suma(pk
f4
(k))}
= max{2j,5}
Resultado de la
vuelta 3
Rendimiento
esperado
Solución
óptima
j Terminar Girar f3
(j) Decisión
1 2 5 5 Girar
2 4 5 5 Girar
3 6 5 6 Terminar
4 8 5 8 Terminar
5 10 5 10 Terminar
Etapa 2
f2(j) = max { 2j,
Suma(pkf3k)) }
= max { 2j, 6.15 }
Resultado de la vuelta
2 Rendimiento esperado Solución óptima
j Terminar Girar f3(j) Decisión
1 2 6.15 6.15 Girar
2 4 6.15 6.15 Girar
3 6 6.15 6.15 Girar
4 8 6.15 8 Terminar
5 10 6.15 10 Terminar
• En la etapa 1 debe girar. Su ganancia esperada es de 7.31
Etapa 1
f1(j) = max{2j,
Suma(pkf2(k))}
= max{2j,6.8125}
Resultado de la vuelta 1 Rendimiento esperado Solución óptima
j Terminar Girar f2(j) Decisión
1 2 6.8125 6.8125 Girar
2 4 6.8125 6.8125 Girar
3 6 6.8125 6.8125 Girar
4 8 6.8125 8 Terminar
5 10 6.8125 10 Terminar
Vuelta número Estrategia óptima
1
Continúe si la vuelta 1 produce 1,2, o 3; de
otra forma, termine
2
Continúe si la vuelta 2 produce 1, 2 o 3; de
otra forma, termine
3
Continúe si la vuelta 3 produce 1 o 2. De
otra forma, termine
4 Ultima vuelta, termina el juego.
Referencias
• Taha, Hamdy A. Investigación de
operaciones. Una introducción. Pearson
Educación. 6ª edición. México, 1997

Más contenido relacionado

Similar a 111067466-Programacion-Dinamica-Probabilistica-V.ppt

Baixardoc.com unidad-1-programacion-dinamica
Baixardoc.com unidad-1-programacion-dinamicaBaixardoc.com unidad-1-programacion-dinamica
Baixardoc.com unidad-1-programacion-dinamica
ManuelStreck
 
Programacion dinamica
Programacion dinamicaProgramacion dinamica
Programacion dinamica
RCOP
 
Analisis sensibilidad
Analisis sensibilidadAnalisis sensibilidad
Analisis sensibilidad
evo_perro
 
Logica de la programacion i bimestre
Logica de la programacion i bimestreLogica de la programacion i bimestre
Logica de la programacion i bimestre
UTPL UTPL
 
Presentación simposio-daga
Presentación simposio-dagaPresentación simposio-daga
Presentación simposio-daga
Eliecer Yance A
 
Algoritmos
AlgoritmosAlgoritmos
Algoritmos
taurivan
 
Clase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdfClase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdf
NekoRojas3
 
guia-unidad-1-teoria-clasica-de-optimizacion (7).docx
guia-unidad-1-teoria-clasica-de-optimizacion (7).docxguia-unidad-1-teoria-clasica-de-optimizacion (7).docx
guia-unidad-1-teoria-clasica-de-optimizacion (7).docx
cirov176
 

Similar a 111067466-Programacion-Dinamica-Probabilistica-V.ppt (20)

Baixardoc.com unidad-1-programacion-dinamica
Baixardoc.com unidad-1-programacion-dinamicaBaixardoc.com unidad-1-programacion-dinamica
Baixardoc.com unidad-1-programacion-dinamica
 
programacion dinámica 1
programacion dinámica 1programacion dinámica 1
programacion dinámica 1
 
Capitulo 9
Capitulo 9Capitulo 9
Capitulo 9
 
Programacion dinamica
Programacion dinamicaProgramacion dinamica
Programacion dinamica
 
Herramientas para la toma de decisiones-Unidad 5
Herramientas para la toma de decisiones-Unidad 5Herramientas para la toma de decisiones-Unidad 5
Herramientas para la toma de decisiones-Unidad 5
 
Gestion de proyectos sesion 3
Gestion de proyectos sesion 3Gestion de proyectos sesion 3
Gestion de proyectos sesion 3
 
Programación deterministica
Programación deterministicaProgramación deterministica
Programación deterministica
 
Programacion_Lineal.pdf
Programacion_Lineal.pdfProgramacion_Lineal.pdf
Programacion_Lineal.pdf
 
Analisis sensibilidad
Analisis sensibilidadAnalisis sensibilidad
Analisis sensibilidad
 
61178886 i-o-ii-principal
61178886 i-o-ii-principal61178886 i-o-ii-principal
61178886 i-o-ii-principal
 
Logica de la programacion i bimestre
Logica de la programacion i bimestreLogica de la programacion i bimestre
Logica de la programacion i bimestre
 
Presentación simposio-daga
Presentación simposio-dagaPresentación simposio-daga
Presentación simposio-daga
 
Prog dinamica
Prog dinamicaProg dinamica
Prog dinamica
 
meto_super_respu.ppt
meto_super_respu.pptmeto_super_respu.ppt
meto_super_respu.ppt
 
Algoritmos
AlgoritmosAlgoritmos
Algoritmos
 
Programación dinámica
Programación  dinámicaProgramación  dinámica
Programación dinámica
 
Clase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdfClase 7 IO Programación Dinamica_MÓNICA.pdf
Clase 7 IO Programación Dinamica_MÓNICA.pdf
 
Asignacion
AsignacionAsignacion
Asignacion
 
guia-unidad-1-teoria-clasica-de-optimizacion (7).docx
guia-unidad-1-teoria-clasica-de-optimizacion (7).docxguia-unidad-1-teoria-clasica-de-optimizacion (7).docx
guia-unidad-1-teoria-clasica-de-optimizacion (7).docx
 
Juegos de Producción y Estadística para la Promoción de las Metodologías Ágiles
Juegos de Producción y Estadística para laPromoción de las Metodologías ÁgilesJuegos de Producción y Estadística para laPromoción de las Metodologías Ágiles
Juegos de Producción y Estadística para la Promoción de las Metodologías Ágiles
 

Más de ElCrackmanJORGE

6 DIAPOSITIVAS 2 DE CLASE.pptx
6 DIAPOSITIVAS 2 DE CLASE.pptx6 DIAPOSITIVAS 2 DE CLASE.pptx
6 DIAPOSITIVAS 2 DE CLASE.pptx
ElCrackmanJORGE
 
4 DIAPOSITIVAS 1 DE CLASE.pptx
4 DIAPOSITIVAS 1 DE CLASE.pptx4 DIAPOSITIVAS 1 DE CLASE.pptx
4 DIAPOSITIVAS 1 DE CLASE.pptx
ElCrackmanJORGE
 
MIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).doc
MIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).docMIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).doc
MIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).doc
ElCrackmanJORGE
 
Dia 2 Ficha 1º y 2°- 02-09 (1).docx
Dia 2 Ficha 1º y 2°- 02-09 (1).docxDia 2 Ficha 1º y 2°- 02-09 (1).docx
Dia 2 Ficha 1º y 2°- 02-09 (1).docx
ElCrackmanJORGE
 

Más de ElCrackmanJORGE (8)

6 DIAPOSITIVAS 2 DE CLASE.pptx
6 DIAPOSITIVAS 2 DE CLASE.pptx6 DIAPOSITIVAS 2 DE CLASE.pptx
6 DIAPOSITIVAS 2 DE CLASE.pptx
 
4 DIAPOSITIVAS 1 DE CLASE.pptx
4 DIAPOSITIVAS 1 DE CLASE.pptx4 DIAPOSITIVAS 1 DE CLASE.pptx
4 DIAPOSITIVAS 1 DE CLASE.pptx
 
240393522-Capitulo-Vi.pdf
240393522-Capitulo-Vi.pdf240393522-Capitulo-Vi.pdf
240393522-Capitulo-Vi.pdf
 
SABADO 31 DE OCTUBRE 3° Y 4° GRADO.doc
SABADO 31 DE OCTUBRE 3° Y 4° GRADO.docSABADO 31 DE OCTUBRE 3° Y 4° GRADO.doc
SABADO 31 DE OCTUBRE 3° Y 4° GRADO.doc
 
MIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).doc
MIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).docMIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).doc
MIERCOLES 02 DE SETIEMBRE - 1° y 2° GRADO (1).doc
 
Dia 2 Ficha 1º y 2°- 02-09 (1).docx
Dia 2 Ficha 1º y 2°- 02-09 (1).docxDia 2 Ficha 1º y 2°- 02-09 (1).docx
Dia 2 Ficha 1º y 2°- 02-09 (1).docx
 
PERU VS SUIZA - ECONOMIA.pptx
PERU VS SUIZA - ECONOMIA.pptxPERU VS SUIZA - ECONOMIA.pptx
PERU VS SUIZA - ECONOMIA.pptx
 
MIERCOLES 02 DE DICIEMBRE 5° Y 6° GRADO.doc
MIERCOLES 02 DE DICIEMBRE 5° Y 6° GRADO.docMIERCOLES 02 DE DICIEMBRE 5° Y 6° GRADO.doc
MIERCOLES 02 DE DICIEMBRE 5° Y 6° GRADO.doc
 

Último

Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 

Último (20)

Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 

111067466-Programacion-Dinamica-Probabilistica-V.ppt

  • 2. PROGRAMACIÓN DINÁMICA  CARACTERISTICAS DE LA PROGRAMACIÓN DINÁMICA Puede definirse como una técnica matemática para la solución de una serie de decisiones en secuencia. Hay que tomar una secuencia de decisiones con cada una de ellas que afecte las decisiones futuras. Por consiguiente, el ejecutivo se enfrenta a situaciones que requieren que tome una serie de decisiones, en las que el buen éxito de cada una, depende de los resultados de una decisión previa de la misma serie. Además de la característica esencial de la toma de decisiones en secuencia, los problemas de programación dinámica tienen otras propiedades. Solo hay que conocer una pequeña cantidad de datos en cada etapa, a fin describir el problema. En realidad los problemas de programación dinámica se caracterizan por la dependencia del resultado de las decisiones de una pequeña cantidad de variables. Otra característica es que, en cualquier etapa, el resultado de una decisión altera los valores de las variables relacionadas con el problema. Por lo tanto, habrá que considerar el mismo numero de variables para la siguiente serie.
  • 3. En un problema de programación dinámica, hay que tomar una serie de decisiones en una secuencia determinada. Cuando se hace así, se persigue una política óptima, sin que importe cuales hayan sido los estados y decisiones anteriores, las decisiones restantes constituirán una política óptima con respecto al estado que se obtenga con la primera decisión.  ESTRUCTURA DE LA PROGRAMACIÓN DINÁMICA La programación dinámica comparte algunos conceptos con otros métodos cuantitativos. El primer concepto es el de una variable de estado, cuyos valores especifican las condiciones las condiciones del proceso. Los valores de esas variables nos dicen todo lo que necesitamos saber sobre el sistema, a fin de tomar decisiones. Por ejemplo, en un problema de producción, podríamos requerir variables de estado que se relacionen con la capacidad de fabricas y los inventarios actuales. Hay que recordar que el numero de variables de estado puede ser muy grande. Sin embargo, la dificultad para resolver un problema aumenta considerablemente con un número creciente de variables, y por lo tanto es conveniente reducir al mínimo el número de variables de estado. En la estructura de un problema de programación dinámica, se incluye el concepto de una “decisión”, que es una oportunidad para cambiar las variables de estado en una forma probabilística. Las retribuciones generadas por cada decisión dependen de los estados de principio y de fin de la misma, y de ese modo se convierten en una secuencia de decisiones. La tarea inmediata consiste en tomar decisiones que aumenten al máximo las retribuciones totales. Pág. 354
  • 5. Contenido • Introducción • Un juego de azar • Referencias
  • 6. Introducción • La programación dinámica probabilística (PDP) difiere de la programación dinámica determinística (PDD) en que – Las condiciones y resultados en cada etapa no son fijos, sino que tienen un componente de aleatoriedad – Se hace uso de conceptos de probabilidad en la obtención de su solución • Presentaremos la PDP mediante algunos problemas prototipo
  • 7. Un juego de azar • Una variante del juego de ruleta requiere que se gire una rueda marcada con los números de 1 a n • La probabilidad de que la rueda se detenga en un número i después de hacerla girar es pi • Un jugador paga $x para tener derecho a girar la rueda hasta m veces • El jugador obtiene como ganancia el doble del número que obtiene cuando gira por última vez • Suponiendo que el juego se repite un número grande de veces, queremos diseñar una estrategia óptima para el jugador
  • 8. Planteamiento general • Para poner el problema en términos de PD, consideremos lo siguiente: – La etapa i corresponde a la i-ésima vuelta de la rueda, i = 1, 2, …, m – En cada etapa hay dos alternativas: se gira la rueda una vez más o se termina el juego – El estado j del sistema en la etapa i es el número que se obtuvo la última vez que se giró la rueda, el cual está entre 1 y n
  • 9. Planteamiento general • Sea fi(j) = Ganancia máxima esperada dado que el juego está en la etapa i y que el resultado de la última vuelta fue j, entonces     1 1 2 , si termina max , si continúa n i k i k j f j p f k        
  • 10. Planteamiento general • La ecuación recursiva es entonces     1 1 2 , si termina max , 2,..., , si continúa n i k i k j f j i m p f k            1 2 m f j j       1 2 1 0 n k k f p f k   
  • 11. Planteamiento general • Los cálculos comienzan con fm+1 y terminan con f1, de modo que hay m+1 etapas • f1(0) representa el rendimiento esperado de las m vueltas, así que el rendimiento esperado neto, Rn, es   1 0 n R f x  
  • 12. Ejemplo • Supongamos que la ruleta está marcada con los números 1 a 5 y que las probabilidades de que se detenga en cada número son p1 = 0.30, p2 = 0.25, p3 = 0.20, p4 = 0.15, p5 = 0.10 • El jugador paga $5 por un máximo de cuatro vueltas • Determine la estrategia óptima para cada una de las cuatro vueltas y encuentre el rendimiento esperado neto asociado
  • 13. Ejemplo Etapa 4 f4(j) = 2j Resultado de la vuelta 4 Solución óptima j f4(j) Decisión 1 2 Terminar 2 4 Terminar 3 6 Terminar 4 8 Terminar 5 10 Terminar
  • 14. Etapa 3 f3 (j) = max{2j, Suma(pk f4 (k))} = max{2j,5} Resultado de la vuelta 3 Rendimiento esperado Solución óptima j Terminar Girar f3 (j) Decisión 1 2 5 5 Girar 2 4 5 5 Girar 3 6 5 6 Terminar 4 8 5 8 Terminar 5 10 5 10 Terminar
  • 15. Etapa 2 f2(j) = max { 2j, Suma(pkf3k)) } = max { 2j, 6.15 } Resultado de la vuelta 2 Rendimiento esperado Solución óptima j Terminar Girar f3(j) Decisión 1 2 6.15 6.15 Girar 2 4 6.15 6.15 Girar 3 6 6.15 6.15 Girar 4 8 6.15 8 Terminar 5 10 6.15 10 Terminar
  • 16. • En la etapa 1 debe girar. Su ganancia esperada es de 7.31 Etapa 1 f1(j) = max{2j, Suma(pkf2(k))} = max{2j,6.8125} Resultado de la vuelta 1 Rendimiento esperado Solución óptima j Terminar Girar f2(j) Decisión 1 2 6.8125 6.8125 Girar 2 4 6.8125 6.8125 Girar 3 6 6.8125 6.8125 Girar 4 8 6.8125 8 Terminar 5 10 6.8125 10 Terminar
  • 17. Vuelta número Estrategia óptima 1 Continúe si la vuelta 1 produce 1,2, o 3; de otra forma, termine 2 Continúe si la vuelta 2 produce 1, 2 o 3; de otra forma, termine 3 Continúe si la vuelta 3 produce 1 o 2. De otra forma, termine 4 Ultima vuelta, termina el juego.
  • 18. Referencias • Taha, Hamdy A. Investigación de operaciones. Una introducción. Pearson Educación. 6ª edición. México, 1997