3. INTRODUCCIÓN
Muchas veces las decisiones tienen que tomarse en entornos con mayor incertidumbre, por
ejemplo:
1. Un fabricante que introduce un nuevo producto al mercado. ¿cuál será la reacción probable
de los consumidores?, ¿cuánto debe producir?, ¿debe probar el producto en una población
pequeña antes de decidir la distribución total?, ¿cuánta publicidad necesita para el
lanzamiento del producto?
2. Una compañía petrolera que decide perforar en cierta región, ¿qué tan probable es que
encuentre petróleo y cuánto?, ¿qué tan profundo debe perforar?, ¿los geólogos deben
investigar más antes de perforar?
4. El análisis de decisiones se diseño para estudiar este tipo de decisiones que se deben
tomar en un ambiente de gran incertidumbre.
Esta herramienta proporciona una metodología para la toma de decisiones racional cuando
los resultados son inciertos.
El análisis de decisiones divide la toma de decisiones en los casos: sin experimentación y
con experimentación.
5. EJEMPLO: COMPAÑÍA PETROLERA
PEMEX es dueña de unos terrenos en los que puede haber petróleo. Un geólogo consultor ha
informado a la administración que piensa que existe una posibilidad de 1 entre 4 de
encontrar petróleo. Debido a esa posibilidad, otra compañía petrolera ha ofrecido comprar la
tierras en 90 000 dólares. Sin embargo, PEMEX considera conservarlas para perforar ella
misma. El costo de perforación es de 100 000 dólares. Si encuentra petróleo el ingreso
esperado será de 800 000 dólares; así, la ganancia esperada para la compañía (después de
reducir el costo de perforación) será de 700 000 dólares. Se incurrirá en una pérdida de 100
000 dólares (el costo de barrenar) sino se encuentra petróleo.
6. TOMA DE DECISIONES SIN EXPERIMENTACIÓN
FORMULACIÓN DE UN MARCO DE REFERENCIA PARA LA TOMA DE DECISIONES
El tomador de decisiones debe elegir una opción de entre un conjunto de acciones posibles. Esta
elección de la alternativa debe hacerse frente a la incertidumbre porque el resultado se verá afectado
por factores aleatorios que se encuentran fuera de control del tomador de decisiones.
Cada una de estas situaciones posibles se conoce como estado de la naturaleza.
En el caso de cada combinación de una opción y un estado de la naturaleza, el tomador de decisiones
debe saber cuál sería el pago resultante.
El pago es una medida cuantitativa del valor de las consecuencias del resultado por el tomador de
decisiones.
Si las consecuencias del resultado no son por completo ciertas, el pago se convierte en un valor
esperado.
Se usa una tabla de pagos que indica el pago de cada combinación de opción y estado de la
naturaleza.
7. ANALOGÍA CON EL JUEGO DE DOS PERSONAS Y SUMA CERO
El tomador de decisiones y la naturaleza se pueden ver como los dos jugadores.
Las opciones alternativas y los estados de la naturaleza posibles se pueden ver como
estrategias disponibles.
El resultado de cada combinación de estrategias es un pago para el jugador 1(tomador de
decisiones).
En la teoría de juegos se supone que ambos jugadores son racionales y eligen sus estrategias
para su propio beneficio. En la teoría de decisiones esto aplica para el tomador de decisiones
pero no para la naturaleza.
8. Una característica de la teoría de decisiones es que el tomador de decisiones casi siempre
tendrá alguna información que debe considerar sobre la posibilidad relativa de los estados
de la naturaleza. Esta información se traduce en una distribución de probabilidad,
Si se considera que el estado de la naturaleza es una variable aleatoria, esta distribución se
conoce como distribución a priori. Las probabilidades de los respectivos estados de la
naturaleza se llaman probabilidades a priori.
9. FORMULACIÓN DEL EJEMPLO DE LA COMPAÑÍA PETROLERA
Pemex debe considerar dos opciones: perforar para buscar petróleo o vender el terreno.
Los posibles estados de la naturaleza son que el subsuelo contenga petróleo y que no sea así,
estos serán los encabezados de las columnas.
Debido a que el geólogo ha estimado una oportunidad de 1 entre 4 que haya petróleo, por
ende hay 3 entre 4 de no lo haya, las probabilidades a priori respectivas son: 0.25 y 0.75
Las unidades de pago en unidades de miles de dólares se colocan en la tabla de pagos.
10. Para determinar la opción óptima para el tomador de decisiones se tienen tres criterios, el
primer criterio se deriva de la teoría de juegos (criterio maximin)
CRITERIO DEL PAGO MÁXIMO
Si el problema del tomador de decisiones se viera como un juego contra la naturaleza, la
teoría de juegos diría que se selecciona la opción de acuerdo con el criterio minimax, un
nombre más adecuado para este criterio es de pago máximo.
Criterio del pago máximo: Para cada opción posible, encuentre el pago mínimo sobre todos
estados posibles de la naturaleza. Después, encuentre el máximo de estos pagos mínimos. Elija
la opción cuyo pago mínimo corresponde a este máximo.
11. En el ejemplo de la compañía petrolera, el pago mínimo por vender (90) es más grade que el
de perforar (-100), por lo tanto, se elegirá la segunda acción, que es vender.
12. CRITERIO DE LA MÁXIMA POSIBILIDAD
El siguiente criterio se refiere al estado más probable de la naturaleza.
Criterio de la máxima posibilidad: Identifique el estado más probable de la naturaleza (aquel que
tiene la probabilidad a priori más grande). Para este estado de la naturaleza, encuentre la opción
con el máximo pago. Elija esta alternativa de decisión.
13. En la tabla se indica que el estado seco tiene la mayor probabilidad a priori, de esa columna
el pago máximo corresponde a la venta, por lo que la elección es vender el terreno.
14. REGLA DE DECISIÓN DE BAYES
El tercer criterio que se usa con más frecuencia es la regla de decisión de Bayes, descrita como:
Regla de decisión de Bayes: Se utilizan las mejores estimaciones disponibles de las
probabilidades de los respectivos estados de la naturaleza (en este momento las probabilidades
a priori), para calcular el valor esperado de pago de cada opción disponible. Se elige la opción
con el máximo pago esperado.
15. En el ejemplo de la compañía petrolera, los pagos esperados se calculan directamente de la
tabla, de la siguiente manera
𝐸 𝑃𝑎𝑔𝑜 𝑝𝑒𝑟𝑓𝑜𝑟𝑎𝑟 = 0.25 700 + 0.75 −100 = 100
𝐸 𝑃𝑎𝑔𝑜 𝑣𝑒𝑛𝑡𝑎 = 0.25 90 + 0.75 90 = 90
Como 100 es mayor que 90, la opción que se debe seleccionar es perforar en busca de petróleo.
16. La gran ventaja de la regla de decisión de Bayes es que incorpora toda la información disponible,
incluso todos los pagos y las mejores estimaciones disponibles de las probabilidades de los respectivos
estados de la naturaleza.
Sin embargo, deberá evaluarse qué tan razonables son estas estimaciones de las probabilidades en
el caso de cada situación individual. Para evaluar el efecto de posibles inexactitudes de las
probabilidades a priori, suele ser útil realizar un análisis de sensibilidad.
17. ANÁLISIS DE SENSIBILIDAD CON LA REGLA DE DECISIÓN DE BAYES
Comúnmente se usa el análisis de sensibilidad para estudiar el efecto de algunos números
incluidos en el modelo matemático en caso de no ser correctos. En el caso de la teoría de
decisiones, el modelo matemático está representado por la tabla de pagos, los números más
cuestionables de esa tabla son las probabilidades a priori.
18. La suma de las dos probabilidades debe ser 1, por lo que si se aumenta una de ellas la otra
debe disminuir en la misma cantidad y viceversa.
En el ejemplo de la compañía petrolera, la administración de PEMEX cree que la
posibilidad de encontrar petróleo debe estar entre 15 y 35%, es decir, es posible que la
probabilidad a priori verdadera de encontrar petróleo esté entre 0.15-0.35, de modo que la
probabilidad de que el terreno esté seco tiene una probabilidad a priori entre 0.85-0.65.
Si p=probabilidad a priori de encontrar petróleo
El pago esperado de perforar para cualquier valor de p es
𝐸 𝑝𝑎𝑔𝑜 𝑝𝑒𝑟𝑓𝑜𝑟𝑎𝑟 = 700𝑝 − 100 1 − 𝑝 = 800𝑝 − 100
19. La línea inclinada muestra la gráfica de pago
esperado contra p.
Como el pago por la venta del terreno es de 90 para
cualquier valor de p, se traza una línea horizontal.
Los cuatro puntos muestran el pago esperado para
las dos alternativas de decisión cuando p=0.15 o
p=0.35.
Para p=0.15
𝐸 𝑝𝑎𝑔𝑜 𝑝𝑒𝑟𝑓𝑜𝑟𝑎𝑟 = 800𝑝 − 100 = 800 0.15 − 100
= 20
La decisión se inclina hacia la venta
Cuando p=0.35
𝐸 𝑝𝑎𝑔𝑜 𝑝𝑒𝑟𝑓𝑜𝑟𝑎𝑟 = 800𝑝 − 100 = 800 0.35 − 100
= 180
La decisión es perforar
20. Cuando la decisión es muy sensible a la probabilidad
a priori, se debe hacer algo más para desarrollar una
estimación precisa del valor verdadero de p.
El punto donde se cruzan las dos rectas es el
punto de cruce donde la decisión cambia de una
alternativa a otra.
Para encontrar ese punto se establece que
𝐸 𝑝𝑎𝑔𝑜 𝑝𝑒𝑟𝑓𝑜𝑟𝑎𝑟 = 𝐸[𝑝𝑎𝑔𝑜(𝑣𝑒𝑛𝑡𝑎)]
800𝑝 − 100 = 90
𝑝 =
190
800
= 0.2375
Conclusión: se debe vender el terreno si p<0.2375
Se debe perforar en busca de petróleo si p>0.2375
21. En los problemas que tienen más de dos opciones alternativas, se puede aplicar el mismo análisis. La
diferencia principal es que habrá más rectas en la gráfica. Sin embargo, la línea superior de cualquier
valor de la probabilidad a priori indicará cual estrategia debe elegirse. Con más de dos líneas puede
haber más de un punto de cruce donde la decisión cambia de una alternativa a otra.
En el caso de un problema con más de dos estados de la naturaleza, el enfoque más directo es centrar el
análisis de sensibilidad en sólo dos estados a la vez. Esto implica investigar qué pasa cuando la
probabilidad a priori de un estado aumenta mientras la del otro disminuye en la misma cantidad, y se
mantienen fijas las probabilidades a priori de los estados restantes. Este procedimiento se repite para los
pares de datos que se desee.
22. En el caso de la compañía petrolera PEMEX, la decisión que se debe tomar depende de manera crítica de
la probabilidad de encontrar petróleo, por lo tanto, debe considerarse de manera seria la realización de
una investigación sismológica para estimar mejor esta probabilidad.
Esta opción se realizará considerando a toma de decisiones con experimentación.
23. TOMA DE DECISIONES CON EXPERIMENTACIÓN
Con frecuencia se hacen pruebas preliminares (experimentación) para mejorar las estimaciones
preliminares de las probabilidades de los respectivos estados de la naturaleza. Estas
estimaciones mejoradas se llaman probabilidades a posteriori.
CONTINUACIÓN DEL EJEMPLO
Una opción disponible de PEMEX antes de tomar una decisión es llevara cabo una
exploración sismológica para obtener una mejor estimación de la probabilidad de encontrar
petróleo. El costo de esta exploración es de 30,000 dólares.
Los resultados de la exploración se dividen en las siguientes categorías:
SSD: sondeos sísmicos desfavorables; poco probable encontrar petróleo
SSF: sondeos sísmicos favorables; muy probable encontrar petróleo
24. Si hay petróleo, la probabilidad de los sondeos sísmicos es
P(SSD | Estado=Petróleo)=0.4 P(SSF | Estado=Petróleo)=1 - 0.4 =0.6
Si no hay petróleo, la probabilidad de los sondeos sísmicos es
P(SSD | Estado=Seco)=0.8 P(SSF | Estado=Seco)=1 - 0.8 =0.2
26. Aplicando la fórmula al ejemplo de la compañía petrolera . Si el resultado de la exploración son
sondeos sísmicos desfavorables (SSD), entonces las probabilidades a posteriori son:
P(SSD | Estado=Petróleo)=0.4 P(SSD | Estado=Seco)=0.8
27. De manera similar, si el resultado de la exploración son sondeos sísmicos favorables (SSF):
P(SSF | Estado=Petróleo)=0.6 P(SSF | Estado=Seco)=0.2
28. En el diagrama de árbol de probabilidad se muestra
una manera conveniente de realizar estos cálculos
Se colocan las probabilidades a priori en la
primera columna y las probabilidades
condicionales en la segunda columna.
Se multiplica cada probabilidad de la primera y
segunda columna para obtener la probabilidad
conjunta correspondiente a la tercera columna.
Cada probabilidad conjunta se convierte en el
numerador del cálculo correspondiente de la
probabilidad a posteriori de la cuarta columna.
Al acumular las probabilidades conjuntas con los
mismos resultados, se obtiene el denominador de
cada probabilidad a posteriori.
29. Una vez completos estos cálculos, se puede aplicar la regla de decisión de Bayes, donde las
probabilidades a posteriori sustituyen a las probabilidades a priori, y se resta el costo de
experimentación.
Los resultados para el ejemplo de la compañía petrolera se muestran a continuación:
30. Como el objetivo es maximizar el pago esperado, estos resultados conducen a la política
óptima que se muestra en la siguiente tabla