2. TEORIA DE JUEGOS
En el mundo real, tanto en las relaciones económicas como en las políticas o
sociales, son muy frecuentes las situaciones en las que, al igual que en los
juegos, su resultado depende de la conjunción de decisiones de diferentes
agentes o jugadores.
La técnica para el análisis de estas situaciones es llamada Teoría de juegos la
cual es sin duda un modelo para empresas ganadoras o exitosas en un
ambiente competitivo: Por ejemplo, existen muchos factores importantes a
considerar cuando se hace una oferta importante, entre los cuales están:
Establecer y mantener una posición de preferencia como oferente, desarrollar
una relación de preferencia por parte de los clientes, de lo que se oferta en sí
mismo, y del precio.
Es una fascinante aplicación de la matemática pura y la psicología pura, e
incorpora series de modelos capaces de simplificar problemas complejos de
competencia o interacción incierta entre dos o más agentes.
3. CONCEPTOS
La teoría de juegos es una Teoría matemática, que estudia las
características generales de las situaciones competitivas y hace
parte de la teoría general de decisiones como mecanismo para el
manejo de las estrategias.
En la teoría de Juegos un oponente se designa como jugador, cada
jugador tiene un numero de elecciones llamadas estrategias. Los
resultados a pagar de un juego se resumen como funciones de las
diferentes estrategias para cada jugador, en donde la ganancia de
un jugador es igual a la pérdida del otro.
Se debe tener en cuenta siempre las siguientes definiciones
elementales como son:
Juego: es la situación de conflicto en la que dos o más adversarios
intentan alcanzar un objetivo seleccionando cursos de acción de
entre todos los que sean permitidos por las reglas.
Reglas: posibles cursos de acción que pueden ser elegidos y deben
ser conocidas por todos los jugadores.
Resultados: asociados a cada posible combinación de elecciones,
estos son definidos por adelantado y conocidos por todos los
jugadores.
4. Movida: elección de un curso de acción en particular de entre un
conjunto de alternativas posibles.
Partida: secuencias de movidas que se suceden en un juego desde
el principio hasta el final; Debe tenerse una secuencia por cada
jugador.
Estrategia de un jugador: Es la regla de decisión predeterminada
que permite a un jugador elegir cada una de las movidas que
conforman a una partida, ante el análisis de todas las posibles
elecciones de los competidores.
Estrategia pura: es aquella en la cual cada una de las movidas
hechas por un jugador a lo largo de una partida corresponde a una
única opción o curso de acción particular.
Estrategia mixta: es aquella en la cual no siempre se opta por el
mismo curso de acción a lo largo de una partida.
Valor del juego: Es el resultado de jugar una partida, cada jugador
con su estrategia. Indica cual es el beneficio o perjuicio que recibe
cada jugador.
Solución del juego: es el conjunto de estrategias óptimas para cada
jugador y valor del juego resultante de la aplicación de esas
estrategias.
5. IDEAS FUNDAMENTALES
- Una característica básica en muchas de las situaciones de conflicto y
competencia es que el resultado final, depende de la combinación de
estrategias seleccionadas por los adversarios.
- La Teoría de juegos estudia las características generales de las situaciones
competitivas de una manera formal y abstracta.
- Da una importancia especial a los procesos de toma de decisiones de los
adversarios.
- Se llaman juegos con suma cero por que un jugador gana lo que el otro
pierde, de manera que la suma de sus ganancias netas es cero. Este juego
consiste en que los dos jugadores muestran al mismo tiempo uno o dos
dados.
Si el número de dados coincide con el jugador que apuesta a pares (jugador 1) gana la
apuesta ($1) al jugador que va por impares (jugador 2).
Si el número no coincide el jugador 1 paga ($1) al jugador 2.
Un juego de dos personas se caracteriza por:
1. Las estrategias del jugador 1
2. Las estrategias del jugador 2
3. La matriz de pagos
6. METODOS DE SOLUCIÓN
Existen 4 métodos para la solución de Teoría de juegos:
Estrategias Dominadas
Punto de silla y suma cero
Estrategias mixtas
Grafico
7. Método de estrategias Dominadas.
Este método consiste en eliminar una serie de estrategias inferiores
hasta que quede una sola para elegir.
Específicamente se puede eliminar una estrategia cuando está
dominado por otra, es decir, si existe otra estrategia que siempre es al
menos tan buena como esta, sin importar lo que hace el oponente.
Se debe tener en cuenta que el jugador que se ubica en la casilla 1 es
el que prima en las decisiones, podríamos decir que este somos
nosotros y que el otro es nuestro oponente.
Además es clave decir que son las estrategias que más se buscan en las
contiendas políticas.
La mejor forma de entender estos métodos es por medio de un
ejemplo como el de a continuación.
8. EJEMPLO
El jugador 1 elimina la estrategia 3 (dominada) ya que ésta representa menos ganancias:
El jugador 2 elimina la estrategia 3 (dominante) ya que con ésta obtendrá mayores pérdidas.
9. El jugador 1 elimina la estrategia 2 (dominada):
El jugador 2 elimina la estrategia 2:
- Entonces sabemos que el jugador 1 recibe un pago de 6 por parte del jugador 2.
- El pago para el jugador, cuando ambos jugadores juegan de manera óptima recibe el
nombre de Valor de Juego.
10. Método suma cero y Punto de Silla.
El método de punto silla se utiliza cuando no se puede aplicar el método de
estrategias dominadas.
Esto se debe a que no hay un dominio específico entre una estrategia y otra,
Además debemos emplear para su solución los criterios de decisión estudiadas en
los capítulos anteriores.
El método consiste en que el jugador 1 debe elegir las estrategias de menor valor y
entre ellas escoger la estrategia de mayor valor a ganar (Maximin), mientras que el
jugador 2 debe elegir las estrategias de mayor valor y entre ellas escoger la
estrategia de menor valor a pagar (Minimax).
Cuando el Maximin es igual al Minimax tanto en el valor como en signo se dice que
hay punto silla. Esa posición corresponde a la intersección de la columna y la fila
(Punto Silla).
El Punto Silla es el valor del juego. Cuando estos valores no coinciden no existe
Punto Silla y se puede concluir que el juego no es justo o la solución es inestable
- Si el juego tiene un valor de cero (0) o suma cero, se denomina Juego Justo, y si
es diferente de cero (0) se denomina Juego Injusto.
11. Punto silla máximin mínimax
El Jugador 1 elige el valor mínimo de cada fila y el jugador 2 elige el valor máximo de
cada columna.
El Jugador 1 elige el valor mayor entre los valores mínimos (Maximin).
El Jugador 2 elige el valor mínimo entre los valores mayores (Minimax).
El punto de silla es igual a (0) (valor del juego), en este caso el juego es justo.
12. Método de estrategias Mixtas
Este método se emplea cuando un juego no se puede resolver por los
métodos anteriores (Estrategias dominadas y Punto Silla) utilizamos el método
de estrategias mixtas, que consiste en combinar las estrategias dominadas con
el procedimiento de Solución gráfica.
Con este método se le asigna a cada estrategia una probabilidad.
13. El jugador 1 elimina la estrategia 3 (dominada)
Determinando cual estrategia se debe eliminar se continua el proceso con el método
grafico, el cual se explicará a continuación. O se puede desarrollar por el método de
punto de silla.
14. LA CAMPAÑA POLÍTICA: EJEMPLO DE PROTOTIPO
Dos políticos contienden entre sí por la presidencia de la república de Bolivia.
En este momento ellos están haciendo sus planes de campaña para los dos
últimos días antes de las elecciones; se espera que dichos días sean cruciales
por ser tan próximos al final.
Por esto, ambos quieren emplearlos para hacer campañas en dos ciudades
importantes. La Paz y Santa Cruz para evitar pérdidas de tiempo, están
planeando viajar en la noche y para un día completo en cada ciudad o dos
días en solo una de las ciudades.
Como deben hacer los arreglos necesarios por adelantado, ninguno de los
dos sabrá lo que su oponente tiene planeado hasta después de concretar sus
propios planes.
Cada político tiene un Jefe de Campaña en cada ciudad para asesorarlo en
cuanto al impacto que tendrá (en términos de votos ganados o perdidos).
Las distintas combinaciones posibles de los días dedicados a cada ciudad por
ellos o por sus oponentes.
Ellos quieren emplear esta información para escoger su mejor estrategia para
estos dos días.
15. SOLUCIÓN
FORMULACION: Los 2 jugadores, las estrategias de cada Jugador y la matriz de pagos.
ESTRATEGIA 1: Pasar por un día en cada ciudad.
ESTRATEGIA 2: Pasar ambos días en Cali.
ESTRATEGIA 3: Pasar ambos días en Medellín.
MATRIZ DE PAGOS
16. METODO DE SOLUCIÓN: Para desarrollar este ejemplo se pueden emplear
cualquiera de los criterios de decisión estudiados. En este ejemplo se
empleará el criterio maximax para el político 1 y maximin para el político 2
Al tomar estos criterios el juego no es equilibrado y tiene un ganancia en la estrategia 2
para el político 1 con un valor de 5, al cual se le debe sumar 0 del pago correspondiente
del político 2 o sea que el valor del juego es de 5 para el político 1 con la estrategia 2
pasar ambos días en Cali, con respecto a la pérdida del político 2 de 0, al tomar la
estrategia 1 de pasar un día en cada ciudad.
17. Esta interacción estratégica tiene la misma estructura que el conocido juego llamado
Dilema de los Prisioneros, que responde a la siguiente historia:
El dilema de los prisioneros
18. Dos sospechosos son arrestados y acusados de un delito. La policía encierra a los dos
sospechosos en celdas separadas y les explica las consecuencias derivadas de las
decisiones que tomen:
Si ninguno confiesa, ambos serán condenados por un delito menor y sentenciados a un
mes de cárcel.
Si ambos confiesan, serán condenados a 8 meses de cárcel.
Finalmente, si uno confiesa y el otro no, el que confiesa será puesto en libertad
inmediatamente y el otro será sentenciado a diez meses de prisión.
Además únicamente interactúan una vez, es decir, se supone que los jugadores no
volverán a verse en el futuro, y por tanto no pueden aplicarse las nociones de venganza o
represalia.
20. Incentivos al esfuerzo en un equipo de
producción.
•Varios trabajadores deben trabajar en equipo para conseguir una producción
conjunta.
•Deben elegir entre esforzarse, que es costoso individualmente, o no esforzarse,
que tiene costes mucho menores.
•El nivel de ingresos obtenido por el equipo es una función de los esfuerzos de
todos los trabajadores.
•La decisión sobre el esfuerzo individual no es observable ni verificable.
•Una variable no es verificable, si aún siendo observable, no puede ser probada
ante una tercera parte, por ejemplo, un tribunal.
•Por lo tanto, el pago a cada trabajador deberá responder a una regla fija de
reparto de los ingresos totales generados.
21. Incentivos en un equipo de producción:
1. 1) Los jugadores son los trabajadores del equipo.
2. Las acciones:
• esforzarse (ei = 2) o
• no esforzarse (vaguear) (ei = 1).
El conjunto de acciones de cada jugador i es {1,2}, en este
caso con sólo dos elementos.
3 Las funciones de pagos.
Supongamos que los ingresos agregados que obtiene el
equipo de producción obedecen a la siguiente función de
los esfuerzos:
I= 4(e1 + e2 ).
costes: c(ei) = 3ei
elegir un nivel de esfuerzo igual a 1 tiene un coste de 3 ,
elegir un nivel de esfuerzo 2, tiene un coste 6.
22. El esfuerzo de cada trabajador es una variable no observable, por lo que la
retribución a cada uno no puede condicionarse a su esfuerzo.
La no observabilidad del esfuerzo o su no verificabilidad ante terceros (un juez,
por ejemplo), es lo que provoca un problema de incentivos al esfuerzo.
Los ingresos agregados se distribuirán según alguna regla de reparto acordada por
contrato previamente a la producción.
Por sencillez supondremos inicialmente que los ingresos se reparten a
partes iguales.
Por tanto, la función de pagos para el jugador 1, (cuando hay 2 jugadores por
ejemplo), sería:
u1 (e1, e2) = (1/2) 4 (e1 + e2) – 6 si e1 = 2
= (1/2) 4 (e1 + e2)- 3 si e1 = 1
23. Podemos representar en forma matricial el juego de incentivos del equipo
de producción suponiendo que hay 2 trabajadores.
Recordemos que estos dos trabajadores, deben decidir simultáneamente si
se “esfuerzan”, es decir, eligen un nivel de esfuerzo igual a 2, (ei = 2) o
“vaguean”, eligen un nivel de esfuerzo 1 (ei = 1).
El nivel de ingresos totales obtenidos viene dado por la función de
ingresos I= 4(e1 +e2) y dichos ingresos se dividen entre ellos a partes
iguales.
24. La representación matricial de esta situación será:
e2=2
(esforzarse)
e2=1
(vaguear)
e1=2
(esforzarse)
2,2 0,3
e1=1
(vaguear)
3,0 1,1
26. Aunque los pagos sean diferentes, la ordenación de los resultados para los
jugadores es la misma en todos los juegos.
Cada jugador prefiere
• en primer lugar el resultado en que no coopera cuando el otro coopera,
• en segundo lugar, el resultado en que ambos cooperan,
• en tercer lugar, el resultado en que ambos no cooperan
• y el peor resultado es aquél en que cooperas cuando el otro no coopera.
Existen en economía otras situaciones con esta misma estructura estratégica.
Diremos de este tipo de juegos que tienen estructura de dilema del
prisionero.
27. Dilema del Prisionero
Confesar, No confesar (0, -10)
No confesar, no confesar (-1, -1)
Confesar, Confesar (-8, -8)
No confesar, confesar(-10, 0)
Juego del hotel
Estafar, ser honesto (6, 3)
Ser honesto, ser honesto (5, 5)
Estafar, estafar (4,4)
Ser honesto, estafar (3, 6)
Incentivos en un equipo
Vaguear, esforzarse (3, 0)
Esforzarse, esforzarse (2, 2)
Vaguear, Vaguear (1, 1)
Esforzarse, Vaguear (0, 3)
Jugador 1
28. 2.3 Acción dominante: El Dilema de los Prisioneros
¿Qué deberían jugar en estas situaciones jugadores maximizadores de pagos e
inteligentes?
¿Cuál es la acción óptima, maximizadora de pagos, de un jugador racional?
En general no existirá la acción óptima de un jugador
porque sus acciones óptimas variarán dependiendo de qué acciones jueguen sus
rivales.
Sin embargo, esta “regla” admite excepciones y de hecho, existen juegos en los
que esto no sucede y algún jugador o todos, poseen una acción que les reporta
mayores pagos que todas las demás, hagan lo que hagan los oponentes.
En este caso, el jugador poseerá una única acción óptima que denominaremos su
acción dominante.
29. Por ejemplo, en el juego del hotel,
Nos fijamos exclusivamente en los pagos del jugador 1, (jugador filas), borramos los pagos
del jugador 2.
Estafar siempre proporciona unos pagos superiores a ser honesto, haga lo que haga el rival
(6 >5) y (4 >3)
Estafar es una acción dominante para el jugador 1 ya que proporciona unos pagos siempre
mayores que su otra acción, ser honesto, sea cual sea la acción que elija el rival.
Ser
honesto
Estafar
Ser honesto 5 3
Estafar 6 4
30. Por ejemplo, en el juego del hotel,
Nos fijamos exclusivamente en los pagos del jugador 2, (jugador columna), borramos los
pagos del jugador 1
Estafar siempre proporciona unos pagos superiores a ser honesto, haga lo que haga el rival
(6 >5) y (4 >3)
Estafar es una acción dominante para el jugador 2 ya que proporciona unos pagos siempre
mayores que su otra acción, ser honesto, sea cual sea la acción que elija el rival.
Ser
honesto
Estafar
Ser honesto 5 6
Estafar 3 4
31. Se puede observar que en el dilema de los prisioneros,
• si un sospechoso va a confesar, será mejor para el otro confesar.
• si un sospechoso va a callarse, para el otro sería mejor confesar y con ello ser puesto
en libertad inmediatamente en lugar de callarse.
Por tanto, confesar es una acción dominante para ambos prisioneros.
Juegos con la misma estructura estratégica tienen la misma solución.
En ambos casos, la acción que hemos denominado no cooperativa es acción dominante
para ambos jugadores.
-1,-1
-10,0
Callarse
0,-10
-8,-8
Confesar
Callarse
Confesar
32. Definición de acción dominante para cualquier juego:
Hagan lo que hagan mis rivales, jugar la acción dominante siempre me dará un
pago mayor que elegir cualquier otra acción.
Obviamente, al proporcionar los mayores pagos, un jugador racional (maximizador
de utilidad) siempre elegirá su acción dominante (si la tiene).
Primer resultado para la resolución de los juegos simultáneos:
En aquellos juegos en los que ambos jugadores tengan acciones dominantes, estos
las elegirán, por lo que concluimos que esta combinación de acciones será la
predicción en este tipo de juegos.
33. Incentivos en un equipo de producción
e2=2
(esforzarse)
e2=1
(vaguear)
e1=2
(esforzarse)
2,2 0,3
e1=1
(vaguear)
3,0 1,1
34. Elegir el nivel de esfuerzo mínimo, ei = 1, es una acción dominante para ambos
jugadores ya que proporciona unos pagos siempre mayores que su otra
acción, elegir un nivel de esfuerzo ei = 2, sea cual sea la acción que elija el
rival.
35. En aquellos juegos en los que ambos jugadores tengan acciones dominantes,
estos las elegirán
En este juego de incentivos en un equipo de producción, la predicción del
desarrollo del juego entre jugadores racionales sería el par de acciones en el
que ambos eligen los esfuerzos mínimos (e1 = 1, e2 = 1), lo que proporciona
unos pagos de 1 a cada uno.
Obsérvese que en estos juegos, elegir las acciones dominantes conduce a un
resultado ineficiente.
En este juego, si ambos jugadores eligen sus acciones dominantes tienen un pago
de 1, mientras que existe un resultado, en el que ambos eligen esforzarse (e1 =
2, e2 = 2), que les proporciona un par de pagos mayor (2,2).
36. En teoría económica cuando un resultado, un par de pagos en estos ejemplos,
ofrece menores pagos a todos los jugadores que otro resultado factible, se dice
que el primer resultado está Pareto dominado.
En general un resultado se dice que es óptimo de Pareto o eficiente cuando no se
puede mejorar el pago de un jugador sin que al menos otro empeore.
Ser
honesto
Estafar
Ser
honesto
5,5 3,6
Estafar 6,3 4,4 -1,-1
-10,0
Callarse
0,-10
-8,-8
Confesar
Callarse
Confesar
Predicción (resultado ineficiente)