SlideShare una empresa de Scribd logo
1 de 36
Descargar para leer sin conexión
Microeconom´ıa II
Teor´ıa de Juegos y Aplicaciones
Aldo Gonz´alez T. Daniel Hojman T.
Fabi´an Sep´ulveda C.
Esta versi´on: 10 de marzo de 2014, Primera versi´on: Agosto 2012
Cap´ıtulo 1
Teor´ıa de Juegos
1.1. Introducci´on
En muchas situaciones donde un sujeto debe tomar una decisi´on, el resultado que obtenga depen-
der´a no solo de sus propias acciones, sino tambi´en de las decisiones que tomen otros individuos. Por su
parte, los resultados de esos otros individuos tambi´en dependen de la decisi´on del sujeto en cuesti´on.
As´ı, un agente en este tipo de situaci´on se cuestionar´a qu´e har´an los dem´as... y qu´e piensan los dem´as
que har´a ´el mismo. Esta interdependencia -que se puede observar en una amplia variedad de situacio-
nes sociales- se conoce como interacci´on estrat´egica. Cuando la interacci´on estrat´egica sea un elemento
fundamental en la toma de decisiones entre individuos, hablaremos de situaci´on estrat´egica.
El objetivo de la teor´ıa de juegos es estudiar el comportamiento de individuos en situaciones es-
trat´egicas. Y aunque el ´enfasis est´a puesto en las decisiones que son tomadas de forma individual, una
de las dimensiones m´as interesantes de la teor´ıa es que permite hacer predicciones respecto de los resul-
tados agregados que divergen de los resultados cl´asicos en econom´ıa, en el sentido de que la motivaci´on
individual (self-interest) puede llevar a resultados ineficientes desde un punto de vista social. M´as en ge-
neral, la teor´ıa de juegos es ´util para analizar diversas situaciones de inter´es econ´omico, como mercados
poco competitivos, asimetr´ıas de informaci´on, cumplimiento bajo contratos incompletos, etc. Adem´as,
tiene aplicaciones en otras disciplinas, como ciencias sociales, management, e incluso biolog´ıa.
Una tipolog´ıa de juegos
Algo que conviene tener en mente antes de comenzar el estudio formal de la teor´ıa de juegos es que,
dependiendo del contexto o la situaci´on que nos interese, la interacci´on estrat´egica puede manifestarse en
diferentes formas. Por ejemplo, la situaci´on estrat´egica m´as sencilla que podemos pensar es una en la cual
cada agente involucrado debe tomar una decisi´on de forma simult´anea considerando el efecto que tienen
las decisiones de los dem´as en el resultado propio. Pero pensemos, por otro lado, en un juego de ajedrez
donde cada jugador toma decisiones en funci´on de lo que ha ocurrido previamente y de lo que espera que
ocurrir´a en el futuro. En este ´ultimo caso existe un elemento secuencial relevante, pues las decisiones
tomadas en por un jugador incidir´an en las jugadas subsecuentes. As´ı, cuando analicemos situaciones del
primero tipo hablaremos de juegos est´aticos, mientras que en el segundo caso nos referiremos a juegos
din´amicos.
Otro elemento que puede diferir seg´un la situaci´on que nos interese dice relaci´on con la informaci´on
que posee cada jugador respecto de los dem´as. Por ejemplo, pensemos en una subasta a sobre cerrado,
donde cada potencial comprador debe hacer una ´unica oferta y aquel que ofrezca un mayor pago se lleva
1
Facultad de Econom´ıa y Negocios - Universidad de Chile 2
el bien subastado. Si un postor no conoce la valoraci´on de los dem´as por el bien en cuesti´on, entonces
se enfrenta al dilema de ofrecer un pago alto y con ello aumentar las probabilidades de ser el ganador,
u ofrecer un pago m´as bajo y tener la posibilidad de adquirir el bien a un precio conveniente. En este
ejemplo, la valoraci´on que tiene cada comprador sobre el bien es informaci´on valiosa, en tanto el poseerla
o no incidir´a en la decisi´on tomada.
Cuando en una situaci´on estrat´egica no exista informaci´on privada como la descrita en el p´arrafo
anterior, hablaremos de juegos de informaci´on completa, mientras que cuando existe informaci´on sobre
los jugadores que no sea de conocimiento com´un se tratar´a de juegos de informaci´on incompleta. As´ı, una
tipolog´ıa de juegos muy general nos permite clasificar las diferentes situaciones estrat´egicas en cuatro
categor´ıas:
Juegos est´aticos de informaci´on completa
Juegos din´amicos de informaci´on completa
Juegos est´aticos de informaci´on incompleta
Juegos din´amicos de informaci´on incompleta
Cada uno de estos tipos de juego involucra -en t´erminos de la teor´ıa- conceptos e instrumentos le-
vemente diferentes, que estudiaremos caso a caso. No obstante, el foco del curso estar´a puesto sobre los
juegos de informaci´on completa, partiendo por los de tipo est´atico, para luego analizar las situaciones
que requieran un elemento din´amico. Los juegos de informaci´on incompleta, aunque no ser´an estudiados
al mismo nivel de profundidad, ser´an relevantes en el cap´ıtulo correspondiente a econom´ıa de la infor-
maci´on.
Ejemplos cl´asicos
En las siguientes secciones estudiaremos en detalle la terminolog´ıa y las t´ecnicas que se utilizan al
analizar situaciones estrat´egicas bajo la perspectiva de la teor´ıa de juegos. Pero para introducir cu´ales
ser´an los elementos b´asicos en los que pondremos nuestra atenci´on, a continuaci´on se muestran algunos
juegos cl´asicos que son ´utiles para ejemplificar ciertos tipos de interacci´on estrat´egica donde destaca
alguna dimensi´on como la cooperaci´on, la coordinaci´on, el conflicto, etc.
El primer ejemplo que revisaremos es probablemente uno de los juegos m´as famosos, conocido como el
dilema del prisionero. La situaci´on consiste en dos sospechosos que han sido arrestados y son mantenidos
en celdas separadas. La polic´ıa solo tiene evidencia suficiente para acusar a cada uno de un delito menor,
pero no para condenarlos por un delito mayor a menos que uno de ellos testifique en contra del otro
(confesar). As´ı, si ambos guardan silencio (callar) entonces cada uno ser´a sentenciado por el delito
menor y pasar´a un a˜no en prisi´on. Si solo uno de ellos confiesa, entonces ser´a liberado por cooperar con
la polic´ıa, mientras que su c´omplice ser´a condenado a 9 meses. Finalmente, si ambos confiesan entonces
cada uno pasar´a 6 meses en prisi´on.
Aunque toda la informaci´on relevante para entender esta situaci´on se encuentra en el p´arrafo anterior,
muchos juegos en los que nos interesaremos pueden ser resumidos de forma c´omoda en lo que se conoce
como una matriz de pagos. Para el caso del dilema del prisionero, esta matriz se muestra a continuaci´on:
Prisionero 2
Callar Confesar
Prisionero 1
Callar -1, -1 -9, 0
Confesar 0, -9 -6, -6
Figura 1.1: Dilema del prisionero
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 3
La forma en la que est´a escrita esta matriz nos indica que el jugador que llamamos “prisionero 1”
elige una acci´on entre las dos posibles filas “callar” y “confesar”. Por su parte, el “prisionero 2” puede
elegir entre las mismas alternativas, pero que en la matriz est´an representadas por las columnas. Los
n´umeros en cada celda de la matriz nos indican los pagos que recibe cada uno seg´un las estrategias
escogidas, donde convencionalmente se entiende que el primer n´umero corresponde al pago del jugador
que elige filas (prisionero 1 en este ejemplo), mientras el segundo corresponde al pago del jugador que
elige columnas. Por ejemplo, si el prisionero 1 elige confesar y el 2 callar, la celda correspondiente indica
(0, −9) porque aquel que confes´o saldr´a libre mientras que el que call´o ser´a condenado a 9 meses. En
general, los n´umeros asociados a los pagos no tienen por qu´e tener una interpretaci´on concreta como en
este caso, y los utilizaremos simplemente para indicar que aquellos resultados con un pago mayor son
preferidos a los que tienen un pago menor.
Viendo la matriz de pagos es f´acil notar que resulta m´as conveniente para ambos la situaci´on en la
que cada uno guarda silencio por sobre la alternativa en la que cada uno confiesa. As´ı, el resultado en
el que ambos eligen “callar” es uno cooperativo, en tanto les permite asegurar una sentencia menor. El
dilema est´a en el hecho de que bajo el resultado cooperativo, existe una tentaci´on individual a romper la
cooperaci´on y confesar para salir en libertad. Esta tensi´on entre la cooperaci´on social y el inter´es propio
se presenta en diversas situaciones cotidianas (es el mismo principio que se aplica en el an´alisis de la
provisi´on de bienes p´ublicos), y es capturada de forma sencilla en este juego. El an´alisis de los posibles
resultados de este juego lo dejamos para las secciones siguientes.
Para motivar el siguiente ejemplo, pensemos en situaciones donde la cooperaci´on no es lo relevante,
sino que los intereses de los jugadores est´an completamente contrapuestos porque -por ejemplo- lo que
gana uno lo pierde el otro.1
Un juego que ejemplifica esto se conoce como matching pennies y consiste
en dos jugadores, cada uno de los cuales tiene una moneda y debe mostrar una cara de esta. Si ambos
muestran la misma cara, entonces el jugador 1 gana el juego y se lleva las dos monedas; mientras que si
muestran distintas caras, entonces el jugador 2 gana el juego y el derecho a quedarse las monedas. Esta
mec´anica se resume en la siguiente matriz de pagos:
Jugador 2
Cara Sello
Jugador 1
Cara 1, −1 −1, 1
Sello −1, 1 1, −1
Figura 1.2: Matching Pennies
En este tipo de juegos el conflicto entre los jugadores es el elemento relevante, y la raz´on fundamental
por la que existe interacci´on estrat´egica es porque a cada uno le gustar´ıa saber qu´e es lo que har´a el
otro pero que el otro no sepa lo que har´a el primero. Podemos pensar -por ejemplo- en la ejecuci´on de
forma simplificada de un penal en un partido de f´utbol: el arquero debe elegir si saltar a la izquierda o
a la derecha, mientras que el tirador debe elegir si patear a la izquierda o a la derecha. Al igual que en
el juego de las monedas, el ´exito de uno de los jugadores significa el fracaso del otro.
Otro elemento que puede resultar relevante en ciertas situaciones, y que podemos capturar en un
juego sencillo, es la coordinaci´on. El ejemplo cl´asico en este contexto se conoce como la batalla de los
sexos2
, cuya historia cuenta que una pareja ten´ıa una cita, pero cada uno olvid´o el lugar de encuentro
(que puede ser un partido de f´utbol o el museo) y ya no pueden ponerse en contacto para aclararlo.
1A veces se denominan juegos de suma cero, pues no se generan ganancias netas de la interacci´on entre los agentes.
Esto es, dado alg´un resultado, la suma de los pagos de los jugadores es cero.
2El nombre es un tanto anacr´onico, pues hace referencia a una concepci´on sexista de las preferencias por entretenci´on.
En los ejemplos modernos del juego, como el que se presenta aqu´ı, se intenta eliminar este elemento aun cuando se conserva
el nombre.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 4
Adem´as, suponemos que cada uno tiene preferencias por uno de los lugares (Josefa por el f´utbol y
Manuel por el museo), pero que de todos modos ambos prefieren la compa˜n´ıa del otro por sobre ir a su
lugar favorito solos. As´ı, la matriz de pagos asociada al juego es la siguiente:
Manuel
F´utbol Museo
Josefa
F´utbol 2,1 0,0
Museo 0,0 1,2
Figura 1.3: Batalla de los sexos
En este caso el conflicto no es la dimensi´on relevante, sino la necesidad de coordinaci´on para alcanzar
un resultado conveniente. Como cada uno tiene preferencias distintas respecto de los lugares de encuen-
tro, no resulta obvio a cu´al de estos deben dirigirse y eventualmente pueden terminar en diferentes sitios,
lo que no es conveniente en ning´un caso.
Los ejemplos anteriores son una muestra del tipo de problem´aticas que se puede capturar de manera
muy sencilla en forma de juegos con dos estrategias y dos jugadores. Sin embargo, estudiaremos juegos
con estructuras m´as generales, donde puede haber m´as jugadores u otros tipos de estrategias. Para esto,
en la siguiente secci´on se introducen los conceptos que utilizaremos a lo largo del curso y se define de
manera formal la idea de juego introducida con estos ejemplos.
1.2. Conceptos b´asicos y definici´on de juego
Para el estudio formal de la teor´ıa de juegos requerimos de un marco te´orico sobre el cual poder
trabajar, estudiar problemas y proponer posibles soluciones. Aunque muchas veces nos interesemos en
juegos que b´asicamente son una situaci´on cotidiana y que resultan intuitivos de entender, para poder
utilizar el instrumental que la teor´ıa nos entrega necesitamos definir de forma concreta ciertos aspectos
que resultan claves para entender la interacci´on estrat´egica que puede darse entre los agentes en la
situaci´on que queramos estudiar.
As´ı, si queremos analizar situaciones estrat´egicas desde una perspectiva de juegos, es necesario que
nos preguntemos cuestiones como, ¿qui´enes toman decisiones relevantes en esta situaci´on?, ¿cu´ales son
las distintas opciones que tiene cada uno?, ¿cu´ales son las preferencias que tienen sobre los posibles
resultados finales cada jugador?. Esta ´ultima pregunta es particularmente relevante ya que en ella
est´a impl´ıcita la potencial interacci´on estrat´egica presente en el juego.
En t´erminos generales, los elementos que hay que definir con precisi´on para estructurar un juego son:
Jugadores: Son los agentes (individuos, firmas, organizaciones, pa´ıses, etc) que toman decisiones rele-
vantes en la determinaci´on del resultado final.
Estrategias: Estas explicitan cu´al es la decisi´on que debe tomar cada jugador, y entre cu´ales alterna-
tivas puede elegir. Notar que esta noci´on es bastante general, ya que una estrategia puede ir desde
algo sencillo como decidir entre un par de acciones (confesar o no confesar), hasta algo elaborado
como elegir un plan de acci´on completo para cada posible situaci´on en la que se encuentre el
jugador.
Pagos: Corresponde a alguna forma de definir la valoraci´on que tienen los individuos respecto de los
posibles resultados del juego. Puede ser simplemente un orden de preferencias (prefiero el resultado
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 5
A por sobre el B, y ´este ´ultimo por sobre el C), o una funci´on de utilidad definida sobre las
estrategias de todos los jugadores.
Reglas del juego: Es fundamental definir si las decisiones se toman en forma simult´anea o existe alg´un
elemento temporal, y en este ´ultimo caso, determinar qu´e informaci´on se maneja al momento de
tomar una decisi´on3
.
Podemos notar que son varias las dimensiones a tener en consideraci´on al momento de analizar
una situaci´on estrat´egica. Es por ello que nos gustar´ıa resumir todas las caracter´ısticas de un juego en
alguna estructura relativamente simple y bien definida. Para este prop´osito existen dos maneras b´asicas
de plantear un juego: las denominadas forma normal y forma extensiva. En esta secci´on vamos a definir
un juego en forma normal, y dejaremos la forma extensiva para el caso de juegos secuenciales, en donde
nos resultar´a m´as ´util.
Antes de entregar una definici´on formal de juego en forma normal estudiaremos un ejemplo diferente a
los vistos en la secci´on anterior. Se trata de un modelo de competencia imperfecta entre firmas, conocido
como modelo de Cournot. Pensemos en un mercado en el cual existen dos empresas que producen un
mismo bien, cuya demanda agregada est´a dada por una funci´on P(Q) = A − Q, donde P es el precio de
mercado y Q la producci´on agregada. Cada una de las firmas i = 1, 2 elige una cantidad a producir qi,
de modo que Q = q1 + q2. Adem´as cada firma enfrenta un costo marginal constante que denotaremos c.
As´ı, los beneficios de cada firma est´an dados, respectivamente, por:
π1 = (A − q1 − q2)q1 − cq1
π2 = (A − q1 − q2)q2 − cq2
La competencia que se da entre estas firmas al momento de elegir sus niveles de producci´on en forma
simult´anea, puede ser entendida como un juego. En efecto, la interacci´on estrat´egica es fundamental
en este caso, ya que el precio que enfrente la firma depender´a de la producci´on de su competidora, y
as´ı depender´a tambi´en su nivel de producci´on ´optimo.
Lo relevante del ejemplo -por el momento- es notar que este juego, aun cuando solo tiene 2 jugadores,
no puede ser escrito de forma matricial, porque cada jugador tiene un conjunto de posibilidades muy
grande sobre el cual elegir: cualquier nivel de producci´on (n´umero real) es un nivel de producci´on factible
para la firma. As´ı, escribir este juego en forma matricial no es solo poco conveniente, sino que es imposible
ya que se trata de un espacio de estrategias continuo.
Pero adem´as de enfrentarnos a diferentes tipos de estrategias seg´un el tipo de juego, podemos enfren-
tarnos a otras situaciones que hacen de la matriz de pagos un esquema poco conveniente en varios casos.
Pensemos, por ejemplo, en el mismo juego de competencia a la Cournot, pero con n firmas, donde n es
un n´umero cualquiera mayor que 1. En este caso, la producci´on agregada viene dada por Q =
n
i=1 qi,
y tenemos que la funci´on de beneficio es, para cada firma:
πi =

A −
n
j=1
qj

 qi − cqi ∀i = 1, ..., n
Tener una cantidad mayor de jugadores tambi´en hace complicado el uso de las matrices de pagos
para plantear juegos. Por todo lo anterior, requerimos de un esquema un tanto m´as general para definir
un juego, que nos permita utilizar los conceptos desarrollados por la teor´ıa en diversas situaciones,
independiente de cuestiones como el tipo de estrategias existentes o el n´umero de jugadores. Este esquema
es la forma normal de un juego.
3Una cuesti´on clave en este sentido es si al momento de elegir su estrategia, un jugador observa las estrategias seguidas
por los que jugaron antes que ´el.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 6
Para definir formalmente esta estructura, introduciremos un poco de notaci´on que ser´a utilizada
regularmente en lo sucesivo. Consideraremos juegos de n jugadores, que ser´an indizados por la letra i,
de modo que i = 1, ..., n. Adem´as denotaremos con Si al conjunto de estrategias del jugador i-´esimo, y
con si ∈ Si a alguna estrategia particular perteneciente a este conjunto. Dado lo anterior, entenderemos
como perfil de estrategias s = (s1, s2, ..., sn) a una combinaci´on particular de estrategias individuales.
Finalmente, la informaci´on respecto a las preferencias o pagos puede ser resumidas en funciones de
utilidad que asocian a cada perfil de estrategias s un n´umero real ui(s), de modo que si un perfil ¯s es
preferido a un perfil ˜s por el individuo i, se cumple que ui(¯s) > ui(˜s).4
Definici´on 1. Un juego en forma normal viene dado por:
1. Un conjunto de n jugadores, denotado por I
2. Para cada jugador i = 1, ..., n, un conjunto de estrategias Si que define las estrategias disponibles
para cada uno
3. Una funci´on de utilidad ui(s1, ..., sn) para cada jugador i = 1, ..., n, que define el pago que recibe
el jugador i si el juego se resuelve seg´un el perfil (s1, ..., sn)
Formalmente, podemos resumir toda la informaci´on del juego en una estructura G = I, {Si}n
i=1, {ui}n
i=1
Esta forma de definir un juego es particularmente conveniente para el caso de juegos est´aticos,
donde cada jugador elige simult´aneamente una acci´on entre un conjunto de posibilidades. Por ejemplo,
para el caso del dilema del prisionero tenemos que el conjunto de estrategias de cada jugador es Si =
{Callar, Confesar} y un posible perfil de estrategias ser´ıa (Callar, Callar).5
La funci´on de utilidad en
este caso es discreta, y se puede escribir como:
u1(s1, s2) =



−1 si (s1, s2) = (Callar, Callar)
−9 si (s1, s2) = (Callar, Confesar)
0 si (s1, s2) = (Confesar, Callar)
−6 si (s1, s2) = (Confesar, Confesar)
y de forma an´aloga para el jugador 2. Notar que en este ejemplo en particular se trata de un juego
sim´etrico, donde las estrategias y los pagos son iguales para cada jugador. En general, esto no tiene
por qu´e ser as´ı, y podemos pensar en juegos donde cada jugador toma distintas decisiones y/o tiene
diferentes preferencias sobre los potenciales resultados.
Por su parte, para el caso de la competencia a la Cournot con n firmas, el juego queda definido por
los siguientes elementos:
I = {1, 2, ..., n}
Si = R, para cada i en I
ui(q1, ..., qn) = A −
n
j=1 qj qi − cqi, para cada i en I
Podemos notar que aunque este juego es mucho “m´as grande” que los juegos de la introducci´on, en
el sentido de que hay n jugadores e infinitas estrategias disponibles para cada uno, la forma normal del
4Notar que, tal como estudiamos en Microeconom´ıa I, la funci´on de utilidad tiene un car´acter ordinal. Esto es, los
n´umeros que entrega no tienen necesariamente interpretaci´on en si mismo, sino que indican la preferencia de un resultado
del juego por sobre otro
5Una aclaraci´on de notaci´on: en el primer caso utilizamos los s´ımbolos { } porque estamos haciendo referencia a un
conjunto -el de todas las opciones disponibles para el jugador i-, mientras que en ´ultimo utilizamos ( ) porque se trata
de un par ordenado -el que indica las estrategias seguidas por los jugadores 1 y 2 respectivamente.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 7
juego resume toda la informaci´on relevante de una forma c´omoda y nos permitir´a utilizar el instrumental
que estudiaremos en las secciones siguiente sin restringirnos a estructuras muy particulares (como lo
son, por ejemplo, las matrices de pagos).
1.3. Estrategias dominantes y dominadas
El objetivo de estudiar teor´ıa de juegos es ser capaces de hacer predicciones sobre cu´al resultado
podr´ıamos esperar que se diera en una situaci´on estrat´egica. As´ı, el paso natural luego de formalizar
la idea de juego es preguntarse c´omo lo resolvemos, o m´as en general, qu´e podemos decir respecto del
comportamiento esperado de los jugadores. Los conceptos presentados a continuaci´on son una primera
aproximaci´on a estas preguntas.
Consideremos a un jugador en el ejemplo del dilema del prisionero. El sujeto en cuesti´on probable-
mente se estar´ıa preguntando si su c´omplice va a confesar o guardar´a silencio. Si el otro va a confesar,
entonces lo mejor para ´el ser´ıa confesar tambi´en, pues de ese modo pasar´ıa 6 meses en prisi´on, en vez
de los 9 a los que es sentenciado si callase. Por otra parte, si el otro guarda silencio entonces el jugador
preferir´ıa confesar, pues as´ı sale libre por cooperar con la polic´ıa, en vez de pasar un mes cumpliendo
sentencia. Lo clave es entonces, que no importa la estrategia que siga el otro, al sujeto siempre le con-
vendr´a confesar. En este caso, diremos que “confesar” es una estrategia dominante para el jugador, ya
que otorga un pago mayor sin importar cu´al es la estrategia que siga el otro.
Definici´on 2. Una estrategia es una estrategia dominante para un jugador, si esta entrega el mejor
pago para ese jugador, sin importar cu´al estrategia sigan los dem´as jugadores.
En el caso del dilema del prisionero, la estrategia “confesar” es dominante para cada jugador, por lo
que proponer que ambos seguir´an esta estrategia parece una predicci´on natural. As´ı, de acuerdo a este
criterio, el resultado del juego ser´ıa (confesar, confesar) seg´un lo cual cada jugador recibe un pago de
(−9).
Aunque plantear que un jugador siempre preferir´a una estrategia dominante por sobre otras estra-
tegias resulta muy intuitivo y es potencialmente una buena predicci´on de los resultados de un juego,
nos enfrentamos al problema de que no siempre existir´an este tipo de estrategias. En efecto, en general
tendremos que la estrategia ´optima de cada jugador variar´a seg´un las estrategias que sigan los dem´as,
lo cual es un elemento la mayor´ıa de las veces relevante en situaciones estrat´egicas. As´ı, el concepto de
estrategia dominante puede ser muy atractivo, pero poco ´util en muchas aplicaciones.
Cuando nos enfrentamos a juegos donde no existen estrategias dominantes, podemos utilizar otro
concepto ´util e intuitivo: estrategia dominada. En palabras simples, una estrategia es dominada si existe
otra estrategia que siempre resulta m´as conveniente. Consideremos el siguiente ejemplo para ver de
qu´e se trata:
Jugador B
Izquierda Centro Derecha
Jugador A
Arriba 10,10 14,12 14,15
Medio 12,14 20,20 28,15
Abajo 15,14 25,28 25,25
Figura 1.4: Estrategias dominadas
Comprobemos en primer lugar que no existen estrategias dominantes. En efecto, si el jugador B
juega centro, el A preferir´a abajo (porque 25 es preferido a 20 y a 14), mientras que si el B elige derecha,
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 8
entonces al A le convendr´a jugar medio (porque 28 es preferido a 25 y a 14). As´ı, no existe una estrategia
para el jugador A que sea ´optima en cualquier caso (de forma an´aloga se puede comprobar que para el
B tampoco existe).
No obstante, en este juego s´ı existen estrategias dominadas. Por ejemplo, la estrategia “arriba” es
dominada por la estrategia “medio” para el jugador A, ya que esta ´ultima le entrega un pago mayor sin
importar lo que haga el B (12 > 10, 20 > 14, y 28 > 14). As´ı, aun cuando “medio”no es una estrategia
dominante seg´un lo discutido en el p´arrafo anterior, s´ı es correcto afirmar que domina a la estrategia
“arriba”.
Definici´on 3. La estrategia si est´a estrictamente dominada por la estrategia si para el jugador i, si
es que ui(s1, ..., si , ..., sn) > ui(s1, ..., si, ..., sn) para cualquier combinaci´on de estrategias de los dem´as
jugadores (s1, ..., si−1, si+1, ..., sn).
De la definici´on se desprende que la estrategia si no es necesariamente una estrategia dominante, ya
que es superior bajo cualquier circunstancia solamente respecto de la estrategia si. En nuestro ejemplo
vimos que la estrategia “medio” del jugador A no siempre es superior a la estrategia “abajo”, pues
depend´ıa de la estrategia jugada por B; sin embargo, es claro que “medio” s´ı es superior a “arriba”, sin
importar lo que haga B.
Como no existe una estrategia dominante, no podemos aplicar el criterio utilizado en el dilema
del prisionero para proponer un potencial resultado del juego. ¿En qu´e nos pueden ayudar entonces las
estrategias dominadas?. Una idea natural es pensar que un jugador nunca utilizar´a una estrategia estric-
tamente dominada, pues no importa qu´e supuesto haga sobre la estrategia que seguir´a el otro jugador,
siempre tendr´a una alternativa superior a la estrategia que est´a dominada. M´as aun, si nos ponemos en
el lugar del jugador B -quien est´a conjeturando sobre la posible estrategia que seguir´a su contraparte-
es razonable pensar que descartar´a la posibilidad de que el jugador A siga una estrategia estrictamen-
te dominada, como lo es la estrategia “arriba”. As´ı, ambos jugadores eliminar´an esta posibilidad y se
enfocar´an en un juego reducido que no considera la estrategia estrictamente dominada:
Jugador B
Izquierda Centro Derecha
Jugador A
Medio 12,14 20,20 28,15
Abajo 15,14 25,28 25,25
Figura 1.5: Juego reducido
Si analizamos para este nuevo juego las posibilidades del jugador B, notaremos que la estrategia
“centro” es estrictamente dominante. Como la existencia de una estrategia estrictamente dominante
no es m´as que un caso en el que todas las estrategias -excepto una- est´an estrictamente dominadas,
utilizando el mismo criterio que en el paso anterior podemos eliminar “izquierda” y “derecha” para
obtener una nueva versi´on reducida del juego.
Jugador B
Centro
Jugador A
Medio 20,20
Abajo 25,28
Figura 1.6: Juego reducido
En este ´ultimo juego, mucho m´as sencillo que el original, se tiene que el jugador A tiene certeza
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 9
respecto del resultado de su decisi´on, por lo que seguir´a la estrategia que le otorga un mayor pago:
“abajo”.6
Este proceso se denomina eliminaci´on iterativa de estrategias estrictamente dominadas. As´ı,
bajo el criterio de eliminar estrategias estrictamente dominadas, podemos proponer que un resultado
probable de este juego ser´a el perfil (abajo, centro).
Definici´on 4. Un perfil de estrategias es un equilibrio por eliminaci´on iterativa de estrategias
estrictamente dominadas si es el ´unico perfil que sobrevive al procedimiento de eliminaci´on.
La eliminaci´on iterativa de estrategias estrictamente dominadas es un criterio m´as general que el
de estrategias dominantes que revisamos en primer lugar, y por lo tanto es ´util en m´as situaciones.
Sin embargo, seguir´an existiendo juegos donde no existir´an estrategias estrictamente dominadas, por
lo cual requeriremos de otros instrumentos para analizarlos y poder proponer posibles resultados. La
siguiente secci´on se dedica a elaborar el concepto m´as ampliamente utilizado en teor´ıa de juegos para
este prop´osito, conocido como equilibrio de Nash.
1.4. Equilibrio de Nash
Probablemente el concepto m´as importante en teor´ıa de juegos es el denominado Equilibrio de Nash,
llamado as´ı por el matem´atico estadounidense John F. Nash, quien gan´o el premio Nobel de econom´ıa
en el a˜no 1994 por su contribuci´on fundamental a esta ´area. La potencia de este concepto radica en que
se basa en una idea sencilla, pero muy general, y por lo tanto es ´util al momento de analizar diversas
situaciones estrat´egicas sin que se requiera la existencia de conceptos m´as exigentes, como el de estrategia
dominada.
La intuici´on detr´as del equilibrio de Nash (EN), es que si se propone que un juego tendr´a cierto perfil
de estrategias como resultado, lo m´ınimo que se puede pedir es que este perfil sea estrat´egicamente estable,
en el sentido de que ning´un jugador tenga incentivos unilaterales a cambiar su estrategia. Dicho de otro
modo, si existe alguna raz´on para pensar que los jugadores seguir´an ciertas estrategias7
, entonces cada
uno de ellos puede hacer esta conjetura. Si bajo esa conjetura alg´un jugador tiene incentivos a cambiar
de estrategia, entonces ser´ıa ingenuo proponer la conjetura como un resultado del juego, ya que aquel
jugador con incentivos a desviarse de la estrategia conjeturada probablemente tomar´a la alternativa que
le resulta m´as conveniente. Formalmente,
Definici´on 5. En un juego de n jugadores, el perfil de estrategias s∗
= (s∗
1, ..., s∗
n) es un equilibrio de
Nash si, para cada jugador i, s∗
i es una mejor respuesta a las estrategias de los otros (n − 1) jugadores.
Esto es, la desigualdad:
ui(s∗
1, ..., s∗
i , ...s∗
n) ≥ ui(s∗
1, ..., si, ..., s∗
n)
se cumple para cada posible estrategia si en Si.
Es decir, la estrategia de equilibrio de cada jugador es la mejor respuesta a las estrategias de equilibrio
de los dem´as jugadores. Para entender c´omo a partir de esta idea podemos proponer alg´un resultado
para un juego, resolveremos algunos ejemplos. En el caso del dilema del prisionero, la mejor respuesta
de cada jugador a cualquier estrategia que pueda seguir su contraparte es “confesar” (una estrategia
dominante siempre ser´a una mejor respuesta). En particular, el perfil (confesar, confesar) es un EN,
ya que ambos est´an jugando su mejor respuesta a la estrategia del otro. Tambi´en se puede ver que no
existen incentivos unilaterales a desviarse, ya que la alternativa “callar” disminuye el pago desde (−6)
a (−9) dado que el otro est´a jugando “confesar”.
6Tambi´en podemos decir que la estrategia “medio” est´a estrictamente dominada por “abajo” y eliminarla tal como lo
hicimos en las iteraciones anteriores.
7Por ejemplo, imaginemos que cada jugador anuncia la estrategia que planea seguir a todos los dem´as.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 10
Una forma conveniente de computar el equilibrio de Nash cuando escribimos el juego en forma matri-
cial es ir analizando cu´al es la mejor respuesta a cada posible estrategia del otro jugador, y subrayando
el mayor pago para indicar que la estrategia asociada a esa celda es la ´optima. Esto est´a ejemplificado
para el caso del dilema del prisionero en la figura 1.7, donde el hecho de que en la celda asociada al
perfil (confesar, confesar) ambos pagos est´en subrayados, nos indica que encontramos un EN.
Prisionero 2
Callar Confesar
Prisionero 1
Callar -1, -1 -9, 0
Confesar 0, -9 -6,-6
Figura 1.7: Mejores respuestas en dilema del prisionero
El ejemplo del dilema del prisionero ilustra un resultado interesante: todo equilibrio bajo eliminaci´on
iterativa de estrategias estrictamente dominadas es un equilibrio de Nash. Sin embargo, la implicancia
va en una sola direcci´on, en tanto no todo EN ser´a un equilibrio seg´un eliminaci´on iterativa. El hecho de
que -como veremos a continuaci´on- es posible que exista EN cuando no existen estrategias dominadas
es evidencia de este ´ultimo punto.
Un caso m´as interesante que el dilema del prisionero ser´a un juego donde la eliminaci´on iterativa
no nos entregue ninguna predicci´on del resultado del juego (porque no existen estrategias estrictamente
dominadas), y sin embargo s´ı exista un EN. Consideremos entonces el ejemplo dado por la matriz de la
figura 1.8.
Jugador Columna
I C D
Jugador Fila
A 0,4 4,0 5,3
M 4,0 0,4 5,3
B 3,5 3,5 6,6
Figura 1.8: Buscando EN cuando no existen estrategias dominadas
El lector ya debiese ser capaz de verificar que este juego no tiene estrategias estrictamente domina-
das. Para buscar un EN, hacemos el an´alisis de mejor respuesta: si el jugador columna fuera a jugar I,
por ejemplo, la mejor respuesta del jugador fila ser´ıa M, puesto que 4 es mayor que 3 y que 0; por ello, la
ganancia de 4 que recibe el jugador fila en la celda (M, I) de la matriz est´a subrayada. De forma an´alo-
ga encontramos la mejor respuesta ante las estrategias C y D, que son A y B, respectivamente. Luego
buscamos las mejores respuestas del jugador columna (lo que es directo, ya que el juego es sim´etrico), y
obtenemos as´ı que el perfil (B,D) es un EN para este juego.
Funci´on de respuesta ´optima
Para computar el EN en los ejemplos anteriores, hemos analizado la mejor respuesta de un jugador a
cada posible estrategia del otro. Esto nos permite encontrar de forma directa el par de estrategias bajo
las cuales nadie tiene incentivos unilaterales a desviarse. En el caso de juegos con estrategias continuas
podemos encontrar un EN bajo el mismo principio, aunque con una t´ecnica diferente.
Consideremos el ejemplo de competencia a la Cournot planteado en la secci´on (1.2). En ese caso,
como los jugadores tienen infinitas estrategias a su disposici´on, no es posible ir verificando la respuesta
´optima para cada caso como lo hacemos en los juegos matriciales. No obstante, podemos preguntarnos
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 11
cu´al es la respuesta ´optima de una de las firmas ante una cantidad fija arbitraria de su competidora.
Por ejemplo, fijemos la producci´on de la firma 2 en un nivel ¯q2. Siendo ese el caso, la respuesta ´optima
de la firma 1 corresponde a la soluci´on del problema:
m´ax
{q1}
(A − q1 − ¯q2)q1 − cq1
La condici´on de primer orden del problema es A − 2q1 − ¯q2 − c = 0, a partir de la cual obtenemos la
soluci´on q∗
1 = A−¯q2−c
2 . Pero ¯q2 es una cantidad arbitraria, por lo tanto lo que hemos encontrado es en
realidad la funci´on que nos indica cu´al es la cantidad ´optima para la firma 1 ante cualquier nivel de
producci´on de la firma 2:
q1(q2) =
A − q2 − c
2
Esta ´ultima se conoce como funci´on de respuesta ´optima o funci´on de reacci´on, en este caso, de la
firma 1.8
Como el problema es sim´etrico, la funci´on de reacci´on de la firma 2 es completamente an´aloga:
q2(q1) =
A − q1 − c
2
La utilidad de obtener este resultado radica en el hecho de que nos permite calcular de forma sencilla
el equilibrio de Nash de este juego. En efecto, si existe un par (q1, q2) tal que ning´un jugador tenga
incentivos a desviarse, ese par constituir´a un EN. Pero esto ocurre en el punto donde las funciones
de reacci´on coinciden (gr´aficamente se intersectan), por lo que encontrar el EN del juego se reduce a
resolver el sistema de ecuaciones dado por las dos funciones de respuesta ´optima. Al resolver el sistema
se obtiene el resultado:
qN
1 = qN
2 =
A − c
3
donde utilizamos el supra´ındice N para indicar que corresponde a la cantidad de EN.
Cabe destacar que el procedimiento reci´en desarrollado no es diferente del aplicado en el caso de los
juegos matriciales, donde lo que hacemos es computar la funci´on de reacci´on para el caso en el cual los
espacios de estrategia son discretos y luego buscar un perfil donde ´estas coincidan. La ´unica diferencia
es que como en este caso las estrategias son continuas, podemos utilizar las herramientas de c´alculo
diferencial para obtener el resultado.
Sobre la unicidad del EN
Volvamos ahora al ejemplo de la Batalla de los Sexos, el cual resolveremos para aprender otro
elemento relevante del EN. A continuaci´on se muestra la matriz de pagos con los pagos asociados a las
mejores respuestas ya subrayados:
Manuel
F´utbol Museo
Josefa
F´utbol 2,1 0,0
Museo 0,0 1,2
Figura 1.9: Batalla de los sexos y mejores respuestas
8Notar que ´esta es la respuesta ´optima para niveles de q2 menores a A − c. Si q2 > A − c, la respuesta ´optima es
producir cero porque ela firma 2 ha saturado el mercado y el precio asociado es muy bajo.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 12
En este caso, tal como en el juego de la figura 1.8, la mejor respuesta var´ıa junto con la estrategia
del otro jugador. Pero lo interesante ahora es que, como se desprende a partir de la matriz, existen dos
perfiles en los cuales la mejor estrategia coincide. ¿Significa esto que no existe equilibrio de Nash?. Al
contrario, lo que ocurre en este caso es que existen 2 equilibrios de Nash, pues cada perfil de estrategias
cumple con la definici´on de que la estrategia de cada jugador es mejor respuesta a las estrategias seguidas
por los dem´as. Adem´as, es f´acil ver que -por ejemplo- dado el perfil (f´utbol, f´utbol), ning´un jugador
tienen incentivos unilaterales a desviarse.
Este ejemplo nos muestra que el EN no tiene por qu´e ser ´unico, y que pueden existir 2 o incluso m´as
perfiles que cumplan con la definici´on de equilibrio. Lo que s´ı ocurre en este caso, es que se pierde la
posibilidad de hacer una predicci´on un´ıvoca respecto del resultado que se observar´a en esta situaci´on
estrat´egica. En las secciones posteriores veremos cu´ales son las alternativas que tenemos en estos casos,
respecto de si podemos inclinarnos por un equilibrio por sobre el otro, o si existe otro tipo de predicci´on
que pueda ayudarnos a precisar el posible resultado del juego.
Sobre la existencia del EN
Una ´ultima arista del concepto de EN que es relevante discutir en este momento, dice relaci´on con
su existencia. Consideremos el juego de Matching Pennies que fue explicado en la introducci´on, y cuya
matriz de pagos reescribimos aqu´ı incluyendo las mejores respuestas:
Jugador 2
Cara Sello
Jugador 1
Cara 1, −1 −1, 1
Sello −1, 1 1, −1
Figura 1.10: Matching Pennies
Al analizar las mejores respuestas en este juego, se observa que no existe ning´un perfil de estrategias
en el cual se cumpla la definici´on de EN. Esto resulta intuitivo si consideramos el hecho de que no existe
ninguna combinaci´on de estrategias bajo la cual no existan incentivos a desviarse: si ambos mostraron la
misma cara, entonces el jugador 2 preferir´ıa cambiar de estrategia; mientras que si mostraron distintas
cara, el primer jugador tendr´a incentivos a desviarse.
Este ejemplo ilustra que el concepto de EN no ser´a una herramienta infalible al momento de analizar
los posibles resultados de un juego, por el simple hecho de que no siempre existir´a un EN, al menos
como lo conocemos hasta ahora. Al igual que con el problema de la multiplicidad de equilibrios, en las
secciones subsecuentes analizaremos algunos conceptos a los cuales podremos echar mano cuando no
exista equilibrio de Nash.
1.5. Estrategias mixtas
Para motivar la idea de estrategia mixta, recordemos el ejemplo del tiro penal en un juego de f´utbol
que planteamos en la introducci´on. Lo modelamos concretamente como se muestra en la matriz de pagos
de la figura 1.11, donde las estrategias D e I corresponden a derecha e izquierda respectivamente.9
Adem´as, aunque suponemos que cuando el arquero ataja el gol los pagos son (0, 0), es importante notar
que en t´erminos estrat´egicos este juego no es diferente de matching pennies (el orden de preferencias
sobre los posibles resultados del juego es el mismo, aunque los n´umero en particular sean diferentes).
9Para los que no son seguidores del f´utbol, se aclara que Alexis ser´ıa el pateador e Iker el arquero.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 13
Iker
D I
Alexis
D 0,0 1,-1
I 1,-1 0,0
Figura 1.11: Penal de f´utbol
En una situaci´on de este tipo existe un elemento fundamental para ambos jugadores, el cual es
la posibilidad de sorprender al otro. En efecto, si es que por alg´un motivo Alexis supiera con certeza
en qu´e direcci´on saltar´a Iker, entonces podr´ıa lograr su mejor resultado pateando el bal´on en la otra
direcci´on. Del mismo modo, si Iker supiera de antemano la direcci´on del tiro, podr´ıa saltar correctamente
y atajarlo. As´ı, dada la incertidumbre que tiene cada uno respecto de la estrategia del otro, a un delantero
o arquero en la realidad le convendr´a jugar algunas veces I y algunas otras D. Si Iker saltase siempre
en la misma direcci´on ser´ıa una estrategia perdedora, puesto que el otro sabr´ıa en qu´e direcci´on tirar
para convertir con seguridad.
Otro ejemplo de una situaci´on que es interesante de modelar bajo la perspectiva de juegos, es la
relaci´on entre una entidad fiscalizadora y un agente que debe cumplir cierta obligaci´on por ley. Por
ejemplo, podemos pensar en el Servicio de Impuestos Internos (SII) y un contribuyente que se est´a cues-
tionando si disminuye o no su carga tributaria de alguna forma ileg´ıtima (evasi´on). Para el SII resulta
costoso hacer una auditor´ıa para fiscalizar si se est´a evadiendo el pago de impuestos, por lo que no es
obvio que siempre deba auditar. Por su parte, el contribuyente obtiene un beneficio evadiendo el pago
de impuestos, pero se enfrenta a un castigo si es que es descubierto. As´ı, la incertidumbre constituye
parte fundamental de la interacci´on estrat´egica, pues el contribuyente estar´a considerando cu´al es la
probabilidad de ser auditado al momento de decidir si evade, mientras que el SII eval´ua la probabilidad
de efectivamente descubrir un evasor al momento de realizar una auditor´ıa que le resulta costosa. Po-
demos pensar ejemplos similares con firmas que deben cumplir est´andares medioambientales, y el ente
regulador que las fiscaliza.
Esta idea de darle relevancia a la incertidumbre y pensar que para un jugador lo ´optimo no es
comprometerse con una estrategia en particular (saltar siempre a la izquierda), sino que variar su
estrategia si el juego hipot´eticamente se repitiese (algunas veces saltar a la izquierda y otras a la derecha),
tiene una expresi´on concreta en teor´ıa de juegos conocida como estrategias mixtas. Cuando analicemos
un juego desde esta perspectiva, pensaremos que los jugadores ya no eligen una estrategia particular
de su conjunto de posibilidades, sino que eligen una probabilidad con la cual jugar´an cada estrategia.
Por ejemplo, en el juego del penal, una estrategia mixta particular ser´ıa jugar con probabilidad 1/3 la
estrategia I, y con probabilidad 2/3, la D. As´ı, para un jugador que dispone de dos estrategias, una
estrategia mixta consiste en elegir un n´umero p en el intervalo [0, 1], de modo que p y (1 − p) son las
probabilidades con las que jugar´a una estrategia o la otra.
En general, si un jugador i dispone de un conjunto Si con L estrategias, Si = {si1
, si2
, ..., siL
}, una
estrategia pura consiste en elegir un elemento particular de este conjunto (este es el concepto que hemos
utilizado en las secciones anteriores y que de ahora en adelante llamaremos estrategia pura). En cambio,
una estrategia mixta consiste en elegir un vector p = (p1, p2, ..., pL), donde pl denota la probabilidad
con la que jugar´a la estrategia sil
∈ Si. Como lo que est´a eligiendo es una distribuci´on de probabilidades
sobre los elementos del conjuntos Si, este vector tiene que cumplir con las propiedades que por definici´on
posee una distribuci´on. Estas son:
1.
L
l=1
pl = 1
2. 0 ≤ pl ≤ 1, para cada l ∈ {1, 2, ..., L}
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 14
Es fundamental notar que al hacer esto, cambiamos la decisi´on que debe tomar el individuo. Si antes
deb´ıa elegir un elemento de su conjunto de posibilidad Si, ahora debe elegir un vector entre todos aquellos
que cumplen las propiedades reci´en enunciadas. Para que este cambio en las posibilidades de cada agente
nos sea ´util, resulta necesario definir una funci´on de utilidad acorde a las nuevas estrategias. La idea
natural en este caso es que dado un perfil de estrategias mixtas, el pago de cada jugador corresponde a
la utilidad esperada que se deriva de las probabilidades elegidas por cada uno.
Para aclarar esta idea, construiremos las funciones de utilidad esperada para el juego del penal. Sea p
la probabilidad con la que Alexis juega D, y sea q la probabilidad con la que Iker juega D. As´ı, tenemos
que -por ejemplo- el perfil (D, I) ocurre con probabilidad p · (1 − q), el cual entrega pagos 1 y -1 a
Alexis e Iker, respectivamente. Esta informaci´on, para cada perfil de estrategias puras, se resume en la
siguiente tabla:
Perfil Probabilidad Pago Alexis Pago Iker
(D, D) p · q 0 0
(D, I) p · (1 − q) 1 -1
(I, D) (1 − p) · q 1 -1
(I, I) (1 − p) · (1 − q) 0 0
Con la informaci´on anterior, se tiene que el pago esperado de Alexis, dado un perfil (p, q) es de
uA(p, q) = p · q · 0 + p · (1 − q) · 1 + (1 − p) · q · 1 + (1 − p)(1 − q) · 0
= p(1 − 2q) + q,
mientras que para Iker, de forma an´aloga se obtiene
uI(p, q) = p · q · 0 + p · (1 − q) · (−1) + (1 − p) · q · (−1) + (1 − p)(1 − q) · 0
= q(2p − 1) − p
As´ı, tenemos un nuevo juego asociado al juego original, pero en el cual los espacios de estrategias
son distintos10
y se tiene una funci´on de utilidad adecuada a aquellos espacios. La pregunta natural en
este punto ser´ıa, ¿cu´al es el equilbirio de Nash de este nuevo juego, si es que existe? Para responderla,
no necesitamos saber nada nuevo sobre el EN, pues simplemente aplicamos la definici´on ya estudiada al
juego “modificado”.
Tal como hicimos en la secci´on anterior, utilizaremos la funci´on de respuesta ´optima para computar
el EN. Recordemos que Alexis elige p en el intervalo [0, 1] y que su funci´on de utilidad viene dada por
uA(p, q) = p(1 − 2q) + q. En primer lugar, se tiene que dada una estrategia q cualquiera de Iker, el
segundo t´ermino de la suma est´a fijo para el jugador 1. As´ı, basta notar que cuando (1 − 2q) > 0, lo
mejor que puede hacer Alexis es elegir p = 1, mientras que si (1 − 2q) < 0 la respuesta ´optima ser´ıa
elegir p = 0. En cambio, si es que (1 − 2q) = 0 cualquier valor de p ser´a ´optimo, en tanto su utilidad
no depender´a de su estrategia sino que estar´a fija. Reescribiendo las condiciones para cada caso como
q 1
2 , podemos resumir este an´alisis en la siguiente funci´on de reacci´on11
:
p(q) =



1 si q < 1
2
0 si q > 1
2
[0, 1] si q = 1
2
10En estrategias mixtas cada jugador tiene disponible infinitas estrategias aun cuando solo existan 2 estrategias puras,
ya que el conjunto factible [0, 1] es un continuo de n´umeros reales.
11T´ecnicamente, la mejor respuesta no es una funci´on, pues las funciones por definici´on asocian puntos de un conjunto
con puntos de otro. En cambio, lo que observamos en este caso es que al evaluar p(q) en q = 1
2
no obtenemos un punto
en particular, sino que un conjunto de ellos (el de todos los valores que son una respuesta ´optima). En matem´aticas estas
“funciones”, que al evaluarlas entregan conjuntos en vez de puntos, se conocen como correspondencias. Aunque esto es
relevante en el estudio formal de teor´ıa de juegos, no es parte de los temas del curso.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 15
Este resultado es bastante intuitivo, pues nos dice que si Iker fuera a jugar D con mayor probabilidad
que I (q > 1
2 ), entonces lo mejor que puede hacer Alexis es patear a la izquierda (p = 0), puesto que
el perfil (I, D) lo hace ganar. Del mismo modo, cuando I es m´as probable (q < 1
2 ), lo mejor que puede
hacer es patear a la derecha, esto es, (p = 1). Finalmente, cuando Iker pone igual probabilidad en
ambas estrategias, entonces cualquier estrategia es igualmente buena para Alexis, puesto que no hay
informaci´on que pueda explotar para cargar la balanza a su favor.
Similarmente, la funci´on de reacci´on de Iker viene dada por:
q(p) =



0 si p < 1
2
1 si p > 1
2
[0, 1] si p = 1
2
Con lo anterior, resulta directo observar que el par de estrategias (p, q) = (1
2 , 1
2 ) es un EN, en tanto
ning´un jugador tiene incentivos unilaterales a cambiar de estrategias. As´ı, hemos encontrado un EN en
estrategias mixtas para un juego que no ten´ıa equilibrio en estrategias puras. Esto no es casualidad,
pues uno de los resultados m´as importantes en teor´ıa de juegos es el teorema de existencia de Nash,
cuya versi´on simplificada se entrega a continuaci´on:
Teorema 1. En un juego G = I, {Si}n
i=1, {ui}n
i=1 , donde la cantidad de jugadores y los espacios de
estrategias son finitos, siempre existir´a un equilibrio de Nash en estrategias mixtas.
Es importante notar que una estrategia pura es un caso particular de estrategia mixta. Por ejemplo,
en el caso del juego del penal el perfil (p, q) = (1, 1) corresponde al perfil de estrategias puras (D, D).
As´ı, si en un juego encontramos un equilibrio en estrategias puras, es factible que este sea el ´unico EN
del juego, ya que el teorema no debe ser interpretado como que siempre existir´a un equilibrio donde las
probabilidades sean diferentes de 0 y 1.
Computando equilibrio en estrategias mixtas en juegos de 2 × 2
A continuaci´on se presenta un m´etodo relativamente heur´ıstico para encontrar los EN de un juego de
2 × 2. Para ello, comenzaremos por graficar las funciones de reacci´on obtenidas para el juego del penal.
En la figura 1.12 dibujamos en rojo la funci´on de reacci´on de Alexis, p(q), y en azul la Iker, q(p), seg´un
las condiciones descritas m´as arriba. Se puede observar que en este caso el ´unico perfil de estrategias
donde estas se intersectan es en el EN ya planteado, p = q = 1
2 .
q
p
1
1 q(p)
p(q)
1
2
1
2
Figura 1.12: Juego del penal: Funciones de reacci´on
La propuesta para encontrar todos los EN se basa en la idea de que en estos juegos existen dos
“tipos” de equilibrio: (i) aquellos en estrategias puras, y (ii) aquellos en los cuales cada jugador, dado
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 16
lo que hace su contraparte, est´a indiferente respecto de su propia estrategia ya que no puede afectar
su utilidad. Estos ´ultimos son los que permiten una estrategia mixta que no sea un caso particular de
estrategia pura, esto es, una estrategia donde el par´ametro de probabilidad se encuentre en el intervalo
abierto (0, 1).
Para entender mejor la idea, consideremos el ejemplo de la batalla de los sexos, que como ya vimos
tiene dos EN en estrategias puras. Si denotamos por p y q la probabilidad con la que Josefa y Manuel,
respectivamente, juegan la estrategia “f´utbol”, podemos plantear las funciones de utilidad esperada para
obtener:
uJ (p, q) = 2pq + (1 − p)(1 − q) = p(3q − 1) − q
uM (p, q) = pq + 2(1 − p)(1 − q) = q(3p − 2) − 2p,
donde uJ y uM son las funciones de utilidad de Josefa y Manuel, respectivamente. Al hacer el an´alisis de
mejor respuesta para Josefa, tenemos que existe un punto cr´ıtico para la estrategia de su adversario, q =
1
3 , en el cual ella se encontrar´a indiferente respecto de su estrategia p. Cuando q > 1
3 le convendr´a jugar
p = 1 y, en caso contrario, le convendr´a p = 0. As´ı, la funci´on de reacci´on queda de la forma:
p(q) =



1 si q > 1
3
0 si q < 1
3
[0, 1] si q = 1
3
,
y haciendo el mismo an´alisis para Manuel, obtenemos:
q(p) =



1 si p > 2
3
0 si p < 2
3
[0, 1] si p = 1
2
Al dibujar estas funciones de reacci´on en el plano (p, q) obtenemos el gr´afico de la figura 1.13, donde
la l´ınea roja corresponde a la funci´on p(q), y la azul a q(p). En este caso observamos que las funciones
se intersectan en los perfiles asociados a estrategias puras (p, q) = (1, 1) y (p, q) = (0, 0), adem´as del EN
en estrategias mixtas dado por (2
3 , 1
3 ).
q
p
1
1
p(q)
q(p)2
3
1
3
Figura 1.13: Batalla de los sexos: Funciones de reacci´on
Aplicando este mismo concepto a otros juegos -como el dilema del prisionero- podremos observar que
en general nos enfrentaremos a alguno de los casos de funciones de reacci´on mostrados en los distintos
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 17
paneles de la figura 1.14. Los paneles (a) y (b) corresponden al caso donde existe un ´unico equilibrio en
estrategias puras, como el dilema del prisionero. Los paneles (c) y (d) muestran el caso en el cual existen
2 equilibrios en estrategias puras, con lo cual observamos que siempre existir´a un tercer equilibrio en
estrategias mixtas. Finalmente, los paneles (e) y (f) corresponden al caso en el cual no existen equilibrio
en estrategias puras, pero s´ı existe uno en estrategias mixtas, tal como asegura el teorema de existencia
de Nash.
q
p
1
1
(a)
q
p
1
1
(b)
q
p
1
1
V C1
V C2
(c)
q
p
1
1
V C1
V C2
(d)
q
p
1
1
V C1
V C2
(e)
q
p
1
1
V C1
V C2
(f)
Figura 1.14: Casos generales de funci´on de reacci´on en juegos de 2 × 2
El valor V C1 corresponde a la estrategia p, bajo la cual el otro jugador se encuentra indiferente entre
cualquier estrategia disponible, esto es, q(V C1) = [0, 1]. Del mismo modo, V C2 corresponde al valor de
q que hace indiferente al jugador que elige p, esto es, p(V C2) = [0, 1]. As´ı, una vez que encontramos los
equilibrios en estrategias puras (si es que estos existen), encontrar los equilibrios en mixtas se reduce
-para el caso de juegos de 2 × 2- a encontrar las probabilidades de cada jugador que deja indiferente al
otro. Notar que este valor no existe en juegos como los de los paneles (a) y (b), ya que en esos caso la
existencia de una estrategia pura dominante, hace imposible que el individuo se encuentre indiferente.
Linealidad del problema individual bajo estrategias mixtas
Para entender qu´e es lo que subyace al m´etodo reci´en expuesto, consideremos un juego de 2 × 2
gen´erico, donde p y q corresponden a las estrategias mixtas de los jugadores 1 y 2 respectivamente. Si A
y B son las estrategias puras del jugador 1 (donde p corresponde a la probabilidad de jugar la estrategia
A), entonces podemos escribir su utilidad esperada de la siguiente manera:
u1(p, q) = pu1(A, q) + (1 − p)u1(B, q)
= p [u1(A, q) − u1(B, q)] + u1(B, q)
Donde u1(A, q) denota la utilidad esperada del jugador 1 cuando juega la estrategia pura A y su
contraparte juega una estrategia mixta cualquiera, q. Lo mismo para u1(B, q), pero con la estrategia
pura B. As´ı, dado que u1(B, q) es un valor fijo cuando q est´a fijo, se tiene que para cualquiera valor q
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 18
tal que u1(A, q) = u1(B, q), entonces el valor de p que maximiza u1(p, q) necesariamente tiene que ser 0
´o 1, dependiendo del signo de la desigualdad u1(A, q) u1(B, q).
La ´unica forma en la que el valor ´optimo de p puede ser estrictamente mayor que 0 y estrictamente
menor que 1, es cuando u1(A, q) = u1(B, q), pues en ese caso el jugador estar´a indiferente entre cualquier
valor de p perteneciente al intervalo [0, 1]. Esta idea corresponde a la generalizaci´on de lo observado en los
ejemplos resueltos anteriormente, en los cuales los equilibrios en estrategias mixtas que no correspond´ıan
al caso particular de estrategias puras, eran aquellos pares (p, q) en los cuales ambos individuos estaban
indiferentes respecto de su propia elecci´on.
Si definimos p1 = p y p2 = (1 − p), podemos graficar este argumento en el plano (p1, p2), tal como se
muestra en los gr´aficos de la figura 1.15. La l´ınea oscura que une a los puntos (1, 0) y (0, 1) corresponde
al conjunto de posibilidades del jugador, ya que ah´ı yacen todos los pares (p1, p2) que cumplen las
condiciones (p1 + p2 = 1) y (0 ≤ p1 ≤ 1). Las l´ıneas azules corresponden a las curvas de nivel (curvas
de indiferencia) de la funci´on de utilidad esperada, dado un valor q fijo. En particular, las l´ınea azules
s´olidas son las asociadas al m´aximo nivel de utilidad esperada que puede alcanzar el jugador, mientras
que las punteadas muestran c´omo otras estrategias distintas a las ´optimas entregan una menor utilidad
esperada.
p1
p2
1
1
(a) u1(A, q) > u1(B, q)
p1
p2
1
1
(b) u1(A, q) < u1(B, q)
p1
p2
1
1
(c) u1(A, q) = u1(B, q)
Figura 1.15: Optimizaci´on bajo estrategias mixtas en un juego de 2 × 2
As´ı, se observa que dependiendo de la relaci´on u1(A, q) u1(B, q), se tendr´a que el valor ´optimo de
p ser´a una soluci´on esquina -como en los paneles (a) y (b)-, excepto cuando la pendiente de la curva
de indiferencia es igual a (-1) -como en el panel (c)-, en cuyo caso el individuo est´a indiferente entre
cualquier par (p1, p2).
Observaci´on. Un punto que se deriva de la discusi´on anterior, y que conviene tener presente al
momento de computar equilibrio en este tipo de juegos porque puede resultar un poco contra-intuitivo,
es que de la condici´on de indiferencia de un individuo se obtiene la estrategia de equilibrio del otro.
Por ejemplo, cuando planteamos la condici´on u1(A, q) = u1(B, q), lo que podremos despejar ser´a un
valor ¯q. Del mismo modo, la condici´on de indiferencia del jugador 2 nos permitir´a despejar un valor
¯p. As´ı, la estrategia de cada jugador no ser´a relevante para s´ı mismo, porque de hecho cada individuo
estar´a indiferente entre cualquiera de sus estrategias factibles. Sin embargo, la indiferencia nos permi-
te proponer que, bajo ese par de estrategias en particular, no existir´an incentivos unilaterales a desviarse.
Dominancia en estrategias mixtas
Una ´ultima dimensi´on de las estrategias mixtas que mencionaremos, dice relaci´on con el concepto
de dominancia estudiado anteriormente. Consideremos el juego abstracto planteado en la matriz de la
figura 1.16. Omitimos los pagos del jugador 2, porque no ser´an relevantes para el ejemplo.
En este caso, para el jugador 1 no existe ninguna estrategia dominada, al menos en el sentido que
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 19
Jugador 2
D I
Jugador 1
A 3, 0,
M 0, 3,
B 1, 1,
Figura 1.16: Dominancia en estrategias mixtas
estudiamos anteriormente. Sin embargo, si consideramos estrategias mixtas en nuestro an´alisis, parece
razonable pensar que una combinaci´on de las estrategias A y M puede resultar mejor que la estrategia B.
En efecto, si tomamos la estrategia mixta p = (1/2, 1/2, 0) se tiene que la utilidad esperada del jugador
1 ser´a igual a 1.5, sin importar la estrategia que siga el jugador 2. As´ı, esta estrategia mixta domina a la
estrategia pura D. Recordemos que las estrategias puras son un caso particular de estrategia mixta, que
en este caso ser´ıa ˜p = (0, 0, 1). As´ı, aunque en estrategias puras no exista dominancia, s´ı puede existir
dominancia en estrategias mixtas.
1.6. Juegos secuenciales
Todos los juegos que hemos estudiado en las secciones anteriores corresponden, de acuerdo a la
tipolog´ıa mencionada en la introducci´on, a juegos est´aticos de informaci´on completa. Pero muchas si-
tuaciones de inter´es econ´omico que involucran interacci´on estrat´egica tienen una dimensi´on din´amica
relevante, que no es capturada por el marco te´orico que manejamos hasta el momento. Pensemos, por
ejemplo, en una industria como el retail donde compiten pocas empresas de gran tama˜no. Es natural
pensar que si una de las firmas observa las decisiones de sus competidoras antes de tomar su propia
decisi´on, entonces su comportamiento ser´a diferente de aquel que seguir´ıa si las decisiones se tomaran
de forma simult´anea. Al mismo tiempo, si una de las firmas sabe que las dem´as observar´an su decisi´on
antes de actuar, entonces tendr´a en cuenta c´omo este elemento afecta lo que har´an sus competidoras y
tendr´a un efecto sobre su propia decisi´on.
Por lo anterior, nuestro siguiente objetivo ser´a el estudio de juegos din´amicos de informaci´on com-
pleta. Es decir, incorporaremos la dimensi´on temporal en el an´alisis de diferente situaciones estrat´egicas,
pero siempre manteni´endonos bajo el supuesto de que las funciones de pago son conocidas por todos
(esto es lo que llamamos informaci´on completa en la introducci´on). Esto implica que cada jugador tiene
perfecto conocimiento de los intereses que tienen los dem´as sobre los distintos resultados del juego, y
por lo tanto, que las decisiones observadas no entregan informaci´on adicional a este respecto.12
Como mencionamos anteriormente, la forma extensiva de un juego resultar´a m´as conveniente e intui-
tiva cuando nos interesemos en juegos din´amicos. Pero antes de introducir este concepto formalmente,
analizaremos algunos ejemplos donde se observa cu´ales son los principales conceptos que se tienen en
mente al estudiar este tipo de situaciones. Pensemos que dos pa´ıses, A y B, se enfrentan en un conflicto
armado, en el cual A est´a decidiendo si invade o no a B. Si el primero decide invadir, entonces el se-
gundo debe decidir entre batallar para defenderse o rendirse. Esta din´amica se resume en el ´arbol de la
figura 1.17, donde los c´ırculos negros corresponden a nodos de decisi´on y las ramas que nacen de cada
uno de ellos indican el conjunto de decisiones disponibles en ese nodo. Por su parte, los c´ırculos grises
corresponden a nodos terminales, cada uno de los cuales es un resultado particular del juego, al que se
llegar´a o no dependiendo de las decisiones de los jugadores.
12La revelaci´on de informaci´on privada a trav´es de las decisiones -y la interacci´on estrat´egica que esto implica- es una
caracter´ıstica fundamental de los juegos de informaci´on incompleta, como veremos en los modelos estudiados en el cap´ıtulo
de econom´ıa de la informaci´on.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 20
A
B
(7,2)
(9,6)
(8,8)
Invadir
No invadir
Pelear
Rendirse
Figura 1.17: ´Arbol de un juego din´amico
Es importante notar que cada nodo de decisi´on tiene una etiqueta que indica qui´en decide en ese
nodo (o a qui´en le corresponde jugar), mientras que cada rama tiene una etiqueta que indica la acci´on a
la cual est´a asociada. Por su parte, cada nodo terminal tiene una etiqueta con los pagos asociados a ese
resultado particular del juego. En nuestro ejemplo, los pagos indican que el pa´ıs A prefiere la situaci´on
en la que invade y su enemigo se rinde, luego aquella en la que no invade, y finalmente aquella en la que
invade y su enemigo se defiende. Por su parte, el pa´ıs B prefiere no ser invadido, pero en caso de ser
invadido prefiere rendirse antes que pelear.
¿Qu´e resultado podemos esperar en este juego? Para tener una primera aproximaci´on, escribiremos
el juego en su forma normal, lo que para este caso es sencillo ya que cada jugador solo enfrenta un nodo
de decisi´on, con dos posibles acciones cada uno (por lo tanto, queda como una matriz de 2 × 2). Esto
nos permitir´a encontrar los EN del juego tal como lo hemos venido haciendo hasta ahora.
Pa´ıs B
Pelear Rendirse
Pa´ıs A
Invadir 7,2 9,6
No invadir 8,8 8,8
Figura 1.18: Juego de invasi´on en forma normal
Observemos que existen dos EN en este juego, dados por los perfiles (No invadir, Pelear) e (Invadir,
Rendirse). El primero es un EN porque si el pa´ıs B est´a dispuesto a pelear, entonces el A prefiere no
invadir y nadie tiene incentivos a desviarse. El segundo es EN porque cuando el pa´ıs A invade el B
prefiere rendirse, y dado esto, ocurre que ninguno querr´a desviarse.
Al escribir el juego en forma normal estamos haciendo abstracci´on de la dimensi´on din´amica del
problema, y conviene preguntarnos si esto tiene implicancias sobre la precisi´on del an´alisis que esto nos
permite hacer. Analicemos, en particular, el equilibrio (No invadir, Pelear): es claro que el pa´ıs A no
tiene incentivos a desviarse, porque el resultado en el que terminan batallando es el menos preferido para
´el. Sin embargo, ese argumento se basa en una estrategia poco cre´ıble de parte del pa´ıs B: Pelear. Si
observamos el ´arbol, salta a la vista que antes una invasi´on, la mejor respuesta del pa´ıs B es Rendirse. Por
lo tanto, parece natural mostrarse esc´eptico si alguien propone que (No invadir, Pelear) es un resultado
predecible para este juego.
Por su parte, el EN dado por el perfil (Invadir, Rendirse) no presenta este problema, puesto que
como ya hemos dicho, cuando el pa´ıs A ataca lo racional para el pa´ıs B es rendirse, y nadie tiene
incentivos a desviarse. Entonces surge la pregunta, ¿es este equilibrio de alguna manera “mejor” que el
equilibrio (No invadir, Pelear)?. La respuesta es s´ı: aunque ambos son equilibrios de Nash del juego, el
perfil (Invadir, Rendirse) es, adem´as, un Equilibrio Perfecto en Subjuegos (EPS). Aunque este nombre
parece extra˜no dado que aun no hemos definido lo que es un subjuego, lo clave respecto del concepto es
lo que observamos en el ejemplo: el equilibrio no est´a basado en amenazas no cre´ıbles.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 21
Inducci´on hacia atr´as
Dada la discusi´on de los p´arrafos anteriores, surge la pregunta de c´omo diferenciar un EN de un
EPS. Afortunadamente existe un m´etodo muy sencillo para encontrar los EPS de los juegos en los que
estaremos interesados, conocido como inducci´on hacia atr´as. Este consiste, como su nombre lo indica,
en comenzar por los nodos de decisi´on finales y analizar qu´e har´ıan los jugadores en cada uno de ellos.
Una vez que se tiene la respuesta ´optima, se avanza hacia los nodos predecesores, y en cada uno de ellos
se analiza cu´al es la estrategia m´as conveniente dado que en los nodos sucesores cada jugador
elegir´a su estrategia ´optima.
Veamos c´omo funciona en el ejemplo anterior. El an´alisis comienza en el nodo donde decide el
pa´ıs B, y consiste en definir la acci´on ´optima si le tocase jugar en ese nodo en particular: esta acci´on
ser´a Rendirse, dado que el pago asociado a esta decisi´on (6) es mayor que el pago de Pelear (2). El
siguiente paso es ir al nodo de decisi´on precedente (en el cual decide A), y determinar la acci´on ´optima
dado que el pa´ıs B elegir´a Rendirse en caso de llegar al nodo en el cual debe decidir. Como el pago de
8 asociado a No Invadir es menor que el de 9 asociado a Invadir (el que a su vez est´a determinado por
la acci´on ´optima Rendirse), entonces nos quedamos con la acci´on de Invadir. As´ı, el EPS de este juego
viene dado por el perfil (Invadir, Rendirse), tal como hab´ıamos propuesto anteriormente.
Para enriquecer el entendimiento de la inducci´on hacia atr´as, consideremos un ejemplo un poco m´as
elaborado. Un sujeto entra a un banco, se acerca a un cajero y le dice que si no le entregan el dinero
de la b´oveda har´a explotar una bomba que lleva consigo. La situaci´on que nos interesa modelar en este
caso es din´amica, pues nos enfocamos en la decisi´on del cajero de entregar o no entregar el dinero, y
dado esto, la decisi´on del asaltante de explotar o no la bomba. El ´arbol del juego se presenta en la figura
1.19.
IIa(Asaltante)
Bomba No Bomba
Entregar No Entregar
No BombaBomba
I (Cajero)
IIb (Asaltante)
uc = −1
ua = −1
uc = 1
ua = 1
uc = −1
ua = −1
uc = 2
ua = 0
Figura 1.19: Asalto a un banco
Los pagos representan la idea de que, sea cual sea la decisi´on del cajero, el resultado en el cual el
asaltante explota la bomba es el menos preferido para ambos. Respecto a los resultados en los cuales
no explota la bomba, el cajero prefiere aquel en el que no entrega el dinero, mientras que el asaltante
-obviamente- prefiere aquel en el cual le entregan su bot´ın.
Resolvamos el juego por inducci´on hacia atr´as. Si el asaltante se ubica en el nodo en el que le entregan
el dinero, entonces su decisi´on ´optima es No Bomba. Ahora, si lo ubicamos en el nodo en el cual no le
entregan el dinero, su decisi´on ´optima tambi´en ser´a No Bomba (aqu´ı est´a la clave para la existencia de
una amenaza no cre´ıble). A continuaci´on analizamos la decisi´on del cajero, dadas las decisiones ´optimas
del asaltante: si entrega el dinero recibir´a un pago de 1, mientras que si no lo entrega recibir´a un pago
de 2. Por lo tanto, la decisi´on ´optima del cajero ser´a No Entregar. Por lo tanto, el resultado del juego
seg´un el m´etodo de inducci´on hacia atr´as ser´a que el cajero no entrega el dinero y el asaltante no entrega
la bomba.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 22
Estrategias en un juego din´amico
Es importante notar que en el p´arrafo anterior no hemos dicho que el EPS del juego sea (No Entregar,
No Bomba), porque aquello ser´ıa -en rigor- incorrecto. La raz´on de ello es que (No Entregar, No Bomba)
no es un perfil de estrategia por el simple hecho de que “No Bomba” no constituye una estrategia para
el asaltante. Esto nos lleva a la siguiente discusi´on, sobre qu´e es lo que entenderemos por estrategia en
un juego din´amico.
En el juego reci´en expuesto, por ejemplo, es natural pensar que las estrategias que puede seguir el
asaltante son “bomba” y “no bomba”, cuando en realidad ´estas son simplemente acciones que puede
seguir en determinados nodos. En un juego en forma extensiva, una estrategia ser´a un plan de acci´on
que indique qu´e acci´on seguir´a el jugador en cada nodo en los cuales le puede tocar jugar.
As´ı, una estrategia posible para el asaltante ser´ıa no explotar la bomba si le entregan el dinero, y
s´ı explotarla en caso que no se lo entreguen. Una forma c´omoda de describir esta estrategia es de la forma
(No Bomba, Bomba), donde el primer elemento del par indica la acci´on que seguir´a si se encuentra en
el nodo IIa, mientras que el segundo indica la acci´on ejecutada en el nodo IIb. Con lo anterior, tenemos
que el conjunto completo de estrategias posibles para el asaltante ser´a {(B,B), (B,NB), (NB,B), (NB,
NB)}. Por su parte, el cajero solo tiene que tomar una decisi´on en un nodo, por lo que las acciones de
las que dispone coinciden con su espacio de estrategias {Entregar, No entregar}.
Esta forma de entender las estrategias en un juego en forma extensiva facilita ver la equivalencia que
existe con la forma normal de un juego. En efecto, si lo que tiene que decidir el asaltante es un plan de
acci´on para cada posible situaci´on en la que le toque jugar, entonces podemos entender el juego desde
una perspectiva est´atica, donde cada jugador debe tomar solo una decisi´on: cu´al ser´a su plan de acci´on.
Para aclarar esta idea, en la matriz de la figura 1.20 se muestra el juego en su forma normal.
Asaltante
(B,B) (B,NB) (NB,B) (NB,NB)
Cajero
Entregar -1, -1 -1, -1 1, 1 1, 1
No Entregar -1, -1 2, 0 -1, -1 2, 0
Figura 1.20: Asalto a un banco en forma normal
Esta matriz de pagos contiene exactamente la misma informaci´on que el ´arbol del juego. Considere-
mos por ejemplo la segunda columna de pagos, en la cual la estrategia del asaltante (B,NB) nos indica
que ´este explotar´a la bomba si le entregan el dinero y no la explotar´a en caso contrario.13
Si el cajero
sigue la estrategia “entregar”, entonces la estrategia del asaltante (B,NB) indica que explotar´a la bomba,
con lo que se obtiene los pagos de (-1, -1) indicados en la celda correspondiente. Si en cambio el cajero
no entrega el dinero, el plan de acci´on indica no explotar la bomba, con lo cual los pagos son de 2 para
el cajero y 0 para el asaltante, tal como se indica en la celda. De forma an´aloga se obtienen las dem´as
columnas de la matriz.
Al computar los EN del juego en la matriz de pagos, se observa que existen tres perfiles bajo los
cuales no existen incentivos a desviarse: (No Entregar, (B,NB)), (Entregar, (NB,B)) y (No Entregar,
(NB,NB)). De acuerdo al an´alisis bajo inducci´on hacia atr´as, concluimos que la estrategia ´optima para
el asaltante es (NB,NB), porque para ´el siempre era peor explotar la bomba. As´ı, el ´unico EN que es a
la vez EPS viene dado por el perfil (No Entregar, (NB,NB)). Notar que lo clave para que este perfil sea
EPS es que la estrategia del asaltante es ´optima en cada uno en el que le podr´ıa tocar jugar. El perfil
(No Entregar, (B,NB)) implica el mismo resultado del juego que el perfil (No Entregar, (NB,NB)), sin
13Es posible que esta estrategia parezca no tener sentido en el contexto que se le ha dado al juego. Sin embargo, es una
posibilidad para el asaltante y como tal podemos analizarla.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 23
embargo no constituye un EPS porque el asaltante est´a siguiendo una estrategia sub´optima en el nodo
IIa.
Notar que tambi´en es un EN el perfil (Entregar, (NB,B)), seg´un el cual el resultado del juego es que
el cajero entrega el dinero al asaltante. Sin embargo, el hecho de que en este perfil el cajero no tenga
incentivos a desviarse, se basa en la amenaza no cre´ıble de que en el nodo IIb el asaltante explotar´ıa la
bomba. As´ı, observamos que en este contexto el EN por s´ı solo puede ser un criterio poco satisfactorio,
pues no considera la din´amica temporal del problema. El EPS aparece entonces como un refinamiento
´util que nos permite quedarnos con un equilibrio m´as cre´ıble, y en alg´un sentido m´as racional.
Dentro y fuera de la senda de equilibrio
En la discusi´on previa se plantea que un perfil de estrategias -y por lo tanto un equilibrio- constituye
un plan de acci´on completo para cada jugador, y por lo tanto no basta con definir cu´al ser´a el resultado
del juego sino que es necesario definir cu´ales son las acciones que se llevar´ıan a cabo en cada nodo, aun
cuando estos no ocurran seg´un nuestra predicci´on de equilibrio. Esto no es solo una cuesti´on formal, sino
que es fundamental para el an´alisis completo del juego porque las decisiones de cada jugador est´an a su
vez condicionadas por lo que espera este que har´an los dem´as si se llegasen a encontrar en determinadas
coyunturas. M´as concretamente, si pensamos en una partida de ajedrez, es claro que antes de decidir
una jugada el ajedrecista analiza cu´al ser´a la respuesta de su oponente ante las distintas movidas que
est´a tanteando en un determinado momento.
En terminolog´ıa de juegos, si tenemos un perfil de equilibrio, aquellos nodos que seg´un las estrategias
definidas efectivamente ocurrir´an se dice que est´an en la senda de equilibrio. De modo similar, los nodos
que no ocurren se dice que est´an fuera de la senda de equilibrio. En el ejemplo del asalto al banco, el
nodo los nodos I y IIb est´an en la senda de equilibrio, mientras que IIa est´a fuera. Entonces, la idea del
p´arrafo anterior se puede resumir en que un equilibrio no se constituye solo por las acciones que ocurren
en la senda de equilibrio, sino tambi´en por aquellas que se tomar´ıan fuera de esta (aun cuando nunca
se concreten seg´un nuestra predicci´on del resultado del juego).
Para observar la relevancia de las estrategias fuera de la senda de equilibrio en la determinaci´on del
mismo, analizaremos una extensi´on del juego de invasi´on, cuyo ´arbol se muestra en la figura 1.21. En
esta versi´on, agregamos un nodo en el cual el pa´ıs bajo amenaza tiene la posibilidad de constituir un
ej´ercito peque˜no o grande antes de que el potencial invasor decida si ataca o no. Adem´as, en el nodo
inicial el pa´ıs A puede elegir entre firmar un tratado de paz y terminar el conflicto o no hacerlo. As´ı, los
nodos Ai y Bi corresponden a aquellos donde juega A y B, respectivamente.
De los pagos se desprende la idea de que, en contraste con la versi´on original del juego, si el pa´ıs
B constituye un ej´ercito grande entonces ante una invasi´on preferir´a defenderse que rendirse. El caso
en el que constituye un ej´ercito peque˜no es igual al juego original, por lo que preferir´a rendirse en
caso de ser invadido. Es decir, al realizar el an´alisis de inducci´on hacia atr´as, se tiene que en los nodos
B2 y B3 las decisiones ´optimas son Rendirse y Pelear, respectivamente. Dado esto, en los nodos A2 y
A3 las decisiones ´optimas para el pa´ıs A son Invadir y No invadir, respectivamente. El siguiente paso
es preguntarse qu´e decidir´a B en el nodo B1; si constituye un ej´ercito peque˜no, entonces el pago que
recibir´a -dadas las decisiones ´optimas subsecuentes- ser´a de 6, mientras que si juega “Ej´ercito Grande”
el nodo final al que se llega tiene asociado un pago de 7. Por lo tanto, en el nodo B1 la decisi´on ´optima
ser´a Ej´ercito Grande. Finalmente, en el nodo A1 la decisi´on ´optima del pa´ıs A ser´a firmar el tratado, ya
que con eso recibe un pago de 8, en comparaci´on a los 7 que recibir´ıa si decide no firmar, y el juego se
desarrolla seg´un las decisiones ´optimas ya discutidas.
En resumen, el EPS del juego vendr´a dados por la estrategia (Tratado, Invadir, No invadir) para el
pa´ıs A, y (Ej´ercito grande, Rendirse, Pelear) para el pa´ıs B (donde las acciones est´an ordenadas siguiendo
la numeraci´on de los nodos para cada jugador). Por lo tanto, el resultado que parece razonable en este
caso es que los pa´ıses firmar´an el tratado de paz y el juego se acaba luego del primer nodo. Lo fundamental
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 24
A2
B2
A3
B3
A1
B1
(7,2)
(9,6)
(8,8)
(3,6)
(8,5)
(7,7)
(8,8)
Invadir
No inv.
Pelear
Rendirse
Invadir
No inv.
Pelear
Rendirse
Ej´ercito Peque˜no
Ej´ercito Grande
No firmar trat.
Firmar tratado
Figura 1.21: Juego de invasi´on extendido
del ejemplo, es que este resultado se sostiene gracias a lo que ocurrir´a fuera de la senda de equilibrio
seg´un las estrategias propuestas. En efecto, el mejor escenario para el pa´ıs A ser´ıa aquel en el que invade
contra un ej´ercito peque˜no y el pa´ıs B se rinde, pero la raz´on por la que firma el tratado y no intenta
llegar a ese nodo es que sabe que si B tiene la oportunidad para armarse, entonces constituir´a un ej´ercito
grande.14
As´ı, el resultado que observamos en la senda de equilibrio es consecuencia de las decisiones
que se tomar´ıan en aquellos nodos que finalmente no ocurren.
Estrategias continuas
Al igual que en el caso de los juegos est´aticos, en los juegos din´amicos podemos analizar y encontrar
equilibrios de juegos con espacios de estrategias continuos utilizando las herramientas de c´alculo diferen-
cial. A modo de ejemplo, consideremos un modelo de duopolio denominado competencia a la Stackelberg.
Suponemos que hay dos firmas que compiten en cantidades, pero a diferencia del modelo de Cournot,
existe una firma que elige su nivel de producci´on q1 primero, denominada “l´ıder”. La segunda firma,
llamada “seguidora”, observa esta cantidad y luego elige su propia producci´on q2. Suponiendo la misma
funci´on de demanda utilizada anteriormente, P(Q) = A − Q, resolveremos el modelo por inducci´on
hacia atr´as. Para ello, resolvemos el problema de la firma seguidora, el cual consiste en maximizar sus
beneficios, dado el nivel de q1 observado.
m´ax
q2
(A − q1 − q2)q2 − cq2
De la CPO se tiene que q2(q1) = A−q1−c
2 . Esta funci´on coincide con la respuesta ´optima de la firma
en el modelo de Cournot, pues el problema que resuelve es el mismo. Sin embargo, la interpretaci´on
es diferente, ya que en este caso se trata de la estrategia de la firma seguidora. En efecto, esta funci´on
resume un plan contingente a cada posible cantidad q1 que pueda observar.
El siguiente paso de la inducci´on hacia atr´as es resolver el problema de la firma l´ıder, teniendo
en cuenta la estrategia ´optima de la seguidora. Esto es, la l´ıder elige q1 tomando en cuenta que la
14Del mismo modo que en el asalto al banco, el cajero sab´ıa que llegado el momento el asaltante no explotar´ıa la bomba.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 25
seguidora reaccionar´a de acuerdo a la funci´on q2(q1) = A−q1−c
2 . Esto es completamente an´alogo a lo
que hemos hecho con los juegos din´amicos hasta ahora, donde para encontrar la acci´on ´optima de un
jugador tomamos en cuenta las acciones subsecuentes que resultan ´optimas. Por lo tanto, el problema
que resuelve la l´ıder es
m´ax
q1
(A − q1 − q2(q1))q1 − cq1
donde escribimos q2(q1) para explicitar que en su decisi´on est´a tomando en cuenta que la seguidora
reaccionar´a de forma ´optima al nivel de producci´on elegido. Al resolver la CPO se obtiene que:
qS
1 =
A − c
2
As´ı, el perfil de estrategias de EPS viene dado por (qS
1 = A−c
2 , q2(q1) = A−q1−c
2 ), donde tal como en
el juego de invasi´on definimos la estrategia de la firma seguidora como un plan de acci´on contingente,
y no como una cantidad en particular. Sin embargo, con esto en la mano podemos calcular cu´al es el
resultado asociado al equilibrio. En efecto, basta con reemplazar la cantidad ´optima qS
1 en la funci´on
que define la estrategia de la seguidora para obtener
qS
2 (qS
1 ) =
A − c
4
Es decir, en la senda de equilibrio se observar´a q1 = A−c
2 y q2 = A−c
4 . Entonces la predicci´on del EPS es
que la firma l´ıder produce m´as que en el modelo de Cournot, mientras que la seguidora produce menos.
Es f´acil verificar, reemplazando estas cantidades en la funci´on de beneficios, que la firma l´ıder est´a mejor
que en el modelo de Cournot y que la seguidora est´a peor.
A partir de esta ´ultima observaci´on surge la pregunta de qu´e ocurre si la firma seguidora elige la
estrategia q2(q1) = A−c
3 , esto es, su plan consiste en producir la cantidad de Cournot independiente
de cu´al sea la cantidad producida por q1. Si la firma l´ıder toma esa estrategia como fija, entonces su
estrategia ´optima tambi´en ser´a la cantidad de Cournot. As´ı, el perfil de estrategias (q1 = A−c
3 , q2(q1) =
A−c
3 ) constituye un EN puesto que aun cuando la firma seguidora reconsiderara su estrategia “r´ıgida”
de siempre producir la cantidad de Cournot, observaremos que no tendr´a incentivos a cambiar su plan
de acci´on.
Sin embargo, este equilibrio se basa en una “amenaza” no cre´ıble de parte de la firma seguidora, la
cual es que si la l´ıder produce la cantidad de Stackelberg, qS
1 , de todos modos la seguidora responder´a con
la cantidad de Cournot a pesar de que ´esta no es ´optima. En efecto, a partir de la inducci´on hacia atr´as
sabemos que cuando la l´ıder produce qS
1 la seguidora prefiere responder con qS
2 , de modo que cuando
dice que producir´a la cantidad de Cournot es lo mismo que cuando el asaltante de banco dec´ıa que de
no recibir el dinero entonces explotar´ıa la bomba.
1.6.1. Informaci´on perfecta e imperfecta
Una dimensi´on de los juegos din´amicos que hemos ignorado hasta ahora dice relaci´on con el conoci-
miento que tienen los jugadores respecto de c´omo se ha desarrollado el juego hasta el momento en el que
les toca jugar. Esto es, podemos permitir que en ciertas situaciones le corresponda mover a un jugador,
sin que este sepa con precisi´on qu´e es lo que ha hecho su contraparte previamente. Cuando ocurra esto,
hablaremos de juegos de informaci´on imperfecta. 15
Un caso sencillo de un juego de informaci´on imperfecta corresponde al ejemplo de matching pennies,
tal como lo hemos visto en las secciones anteriores. Aunque hasta ahora lo hemos descrito como un juego
15Recordemos que informaci´on completa se refer´ıa al hecho de que las funciones de pago de cada jugador (o sus prefe-
rencias) son de conocimiento p´ublico. Esto nada dice respecto de la capacidad de observar la jugada del otro, por lo que
un juego puede ser de informaci´on completa pero imperfecta.
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 26
est´atico, tambi´en podemos entenderlo como un juego din´amico, donde un jugador elige primero un lado
de la moneda, y luego el otro elige el suyo sin observar la moneda del primero. La forma extensiva del
juego se representa en la figura1.22, donde la l´ınea punteadas denota el hecho de que cuando al jugador
2 le corresponde mover, no sabe si se encuentra en el nodo IIa ´o en el IIb.
IIa(Jugador 2)
C S
C S
SC
I(Jugador 1)
IIb(Jugador 2)
u1 = 1
u2 = −1
u1 = −1
u2 = 1
u1 = −1
u2 = 1
u1 = 1
u2 = −1
Figura 1.22: Matching pennies en forma extensiva
Resulta claro que el hecho de que uno de los jugadores mueva primero no tiene implicancias es-
trat´egicas sobre la decisi´on del otro, ya que al no observar la moneda el juego es equivalente al caso en
el que muestran las monedas simult´aneamente. De hecho cualquier juego est´atico puede ser entendido
como un juego din´amico de informaci´on incompleta, donde uno de los jugadores mueve primero pero el
otro no observa la jugada. Lo importante en t´erminos estrat´egicos no es si un jugador mueve primero
que el otro, sino que aquel que mueve despu´es pueda observar la jugada del primero. Por lo tanto, no
hay nada nuevo que decir sobre el equilibrio en este caso, pues tal como estudiamos en el contexto de
juegos est´aticos, el ´unico EN es aquel en estrategias mixtas donde cada uno elige probabilidad 0,5.
En la terminolog´ıa de juegos, cuando a un jugador le corresponde jugar y no sabe con precisi´on lo
que ha ocurrido antes, el conjunto de nodos en los cu´ales podr´ıa estar ubicado lo llamaremos conjunto
de informaci´on. En particular, cuando s´ı sabe la historia del juego (y por lo tanto el nodo en el cual
est´a ubicado) el conjunto de informaci´on tiene un ´unico elemento. Por ejemplo, en la figura 1.22 obser-
vamos dos conjuntos de informaci´on: el que contiene al nodo I y el que contiene a los nodos IIa y IIb.
As´ı, en este ejemplo cada jugador tiene un conjunto de informaci´on.
Consideremos, en cambio, una versi´on de informaci´on completa del mismo juego. Es decir, un jugador
muestra primero su moneda, y el otro juega una vez que la observa. Esta versi´on del juego est´a represen-
tada en la figura 1.23, donde la ´unica diferencia en t´erminos del dibujo es que no est´a la l´ınea punteada
que une los nodos IIa y IIb. Por lo tanto, el jugador 2 ahora tiene dos conjuntos de informaci´on, aquel
que contiene solo al nodo IIa y el que contiene solo el IIb.
IIa(Jugador 2)
C S
C S
SC
I(Jugador 1)
IIb(Jugador 2)
u1 = 1
u2 = −1
u1 = −1
u2 = 1
u1 = −1
u2 = 1
u1 = 1
u2 = −1
Figura 1.23: Matching pennies con informaci´on perfecta
En este caso, igual que en los juegos de informaci´on perfecta analizados anteriormente, una estrategia
corresponde a un plan de acci´on ante cada posible coyuntura en la que tenga que mover. As´ı, el conjunto
de estrategias factibles para el jugador 2 viene dado por {(C, C), (C, S), (S, C), (S, C)}, mientras que el
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 27
del jugador 1 es {C, S}. En el caso de informaci´on incompleta, en cambio, el jugador 2 debe tomar una
´unica decisi´on porque no sabe en cu´al nodo se ubicar´a. Dicho de otro modo, en los juegos de informaci´on
imperfecta, una “coyuntura” en la cual le corresponde mover a un jugador no es un nodo, sino que un
conjunto de informaci´on. As´ı, para generalizar la noci´on de estrategia desarrollada en la secci´on anterior,
diremos que en juegos din´amicos una estrategia es un plan que indica qu´e acci´on tomar´a el jugador en
cada posible conjunto de informaci´on en el cual le puede tocar jugar.
1.7. Definici´on de juego en forma extensiva, subjuego y EPS
Con el concepto de conjunto de informaci´on explicado en la secci´on anterior ya tenemos todo lo
necesario para definir la forma extensiva de un juego, adem´as de aclarar qu´e es un subjuego y por lo
tanto un EPS. En los ejemplos vistos hasta ahora hemos observado cu´ales son los elementos que son
necesarios determinar para definir de forma completa un juego din´amico. Estos los resumimos en la
siguiente definici´on,
Definici´on 6. Un juego en forma extensiva viene dado por:
1. Una lista de n ≥ 1 jugadores, indizados por i, i = 1, 2, ..., n. (conjunto de jugadores)
2. a. Cu´ando le corresponde mover a cada jugador (nodos asociados con los respectivos jugadores)
b. Acciones disponibles al momento de mover (ramas que nacen a partir de cada nodo)
c. Qu´e es lo que el jugador sabe cuando mueve (conjuntos de informaci´on)
3. Los pagos que reciben en cada nodo terminal los jugadores (funciones de utilidad)
Tal como planteamos en la secci´on 1.2, para analizar una situaci´on estrat´egica desde la teor´ıa de
juegos resulta necesario definir de forma clara y concreta ciertos aspectos del problema, los que para el
caso de un juego din´amico se resumen en la definici´on de juego en forma extensiva reci´en entregada.
Por su parte, un subjuego corresponde a cada juego cuyo nodo inicial es un conjunto de informaci´on
del juego original con un ´unico elemento. En t´erminos del ´arbol de un juego, corresponde al conjunto
de nodos y ramas que nacen en los conjuntos de informaci´on con un ´unico elemento y que pueden
ser entendidos como un juego “m´as peque˜no”. Cabe destacar que el juego original es un subjuego en
s´ı mismo. Por ejemplo:
El juego de la figura 1.17 tiene 2 subjuegos: aquel que nace en el nodo B, y el juego original que
nace en el nodo A.
El juego de la figura 1.19 tiene 3 subjuegos, los cuales nacen de cada uno de los nodos del juego.
El juego de la figura 1.21 tiene 6 subjuegos: los sub-´arboles que nacen en cada uno de sus nodos.
De estos tres ejemplos ya debiese quedar claro que para juegos de informaci´on perfecta, la cantidad
de subjuegos coincide con la cantidad de nodos, pues cada nodo es un conjunto de informaci´on
con un ´unico elemento. (y por lo tanto, cada nodo corresponde al nodo inicial de un subjuego).
El juego de la figura 1.22 tiene un ´unico subjuego: el juego completo. La raz´on por la cual los
nodos IIa y IIb con sus respectivas ramas no constituyen un subjuego, es que ambos pertenecen
a un conjunto de informaci´on mayor, lo que contradice la definici´on de subjuego.
De los ejemplos anteriores salta a la vista que un subjuego no es m´as que lo que queda de un
juego una vez que se ha alcanzado cierto nodo decisi´on. Esta definici´on resulta sencilla y pareciera que
Microeconom´ıa II
Facultad de Econom´ıa y Negocios - Universidad de Chile 28
pudimos haberla entregado antes para explicar concretamente qu´e es un EPS. Sin embargo, es importante
entender que los nodos que no son un conjunto de informaci´on en si mismo no son el nacimiento de un
subjuego, y para ello primero ten´ıamos que conocer el concepto de informaci´on imperfecta. Ahora que
hemos aclarado este punto, podemos definir formalmente un EPS.
Definici´on 7. Un equilibrio de Nash perfecto en subjuegos es un EN tal que las acciones definidas
por el perfil de estrategias son, a su vez, equilibrios de Nash de cada subjuego.
Es decir, el EPS se diferencia de los dem´as EN del juego en el hecho de que si analizamos los subjuegos,
las decisiones de cada jugador siguen siendo satisfactorias en el sentido de que son una respuesta ´optima.
Por ejemplo, recordemos que en el juego del asalto al banco el perfil (Entregar,(NB,B)) era un EN del
juego. Sin embargo, si observamos el subjuego que comienza en el nodo IIb, el cual consiste en una
simple decisi´on entre las alternativas {B,NB}, la estrategia B no es ´optima, y por lo tanto no es un
EN del subjuego. Se puede verificar que el equilibrio que encontramos haciendo inducci´on hacia atr´as
s´ı verifica la definici´on reci´en planteada.
Microeconom´ıa II
Cap´ıtulo 2
Informaci´on incompleta
Como ya mencionamos en la introducci´on, una de las dimensiones m´as importantes a considerar en
muchas situaciones estrat´egicas es qu´e es lo que saben los jugadores respecto de las caracter´ısticas de los
dem´as. En efecto, si en los conceptos de equilibrio que hemos desarrollado hasta ahora se observa que
la estrategia de cada jugador depende de las estrategias de otros jugadores, resulta natural cuestionarse
qu´e ocurre cuando cierta informaci´on (como las preferencias o alguna otra caracter´ıstica) no es de
conocimiento p´ublico. El objetivo de este cap´ıtulo es introducir los conceptos necesarios para analizar
este tipo de situaciones, bas´andonos fundamentalmente en ejemplos sencillos que nos permitir´an resaltar
los puntos relevantes a tener en consideraci´on.
2.1. Juegos est´aticos de informaci´on incompleta
Para comenzar, revisitemos un ejemplo que ya hemos analizado en distintos contextos: la competencia
a la Cournot. Tenemos la estructura ya familiar en la que existen dos firmas, denotadas por i = {1, 2}, y la
demanda inversa del mercado en el que compiten viene dada por P(Q) = A−Q. Supongamos que la firma
1 tiene un costo marginal c fijo y conocido por ambas firmas. En cambio, la firma 2 tiene informaci´on
privada sobre su costo, el cual puede ser alto (ca) o bajo (cb). Concretamente, supondremos que la firma 1
solo sabe que con probabilidad α se trata de una firma con costo alto y con probabilidad (1−α), de costo
bajo. Recordemos que para el caso de informaci´on completa la funci´on de reacci´on de cada firma depend´ıa
de los costos de su contraparte. Por lo tanto, el hecho de que la firma 1 enfrente incertidumbre respecto
de los costos de la 2 deja en evidencia que se requiere agregar elementos adicionales al an´alisis. En
particular, para obtener una noci´on de equilibrio satisfactoria en un contexto de informaci´on incompleta
ser´a necesario replantearnos la forma en la que analizamos el comportamiento de los individuos.
Analicemos primero la decisi´on de la firma 2. Dado que ´esta conoce su costo con certeza, entonces es
natural pensar que su decisi´on ´optima ser´a distinta seg´un cu´al sea el costo que efectivamente enfrente.
En efecto, si fijamos la cantidad que produce la firma 1 en alg´un valor q1, la funci´on objetivo de la firma
2 viene dada por πa = (A − q1 − q2)q2 − caq2 si enfrenta costos altos. En cambio, si el costo verdadero
de la firma es bajo (cb), su funci´on de beneficios ser´a πB = (A − q1 − q2)q2 − cbq2. Si maximizamos cada
una de estas funciones respecto de q2 obtendremos que la respuesta ´optima de la firma 2 en funci´on de
su costo, se puede escribir como:
q∗
2(ca) =
A − q1 − ca
2
q∗
2(cb) =
A − q1 − cb
2
29
Facultad de Econom´ıa y Negocios - Universidad de Chile 30
Podemos notar que corresponde a la misma funci´on de reacci´on que obtuvimos en el caso de informa-
ci´on completa. La diferencia clave es que la firma puede encontrarse en 2 situaciones diferentes, y su
comportamiento ´optimo variar´a seg´un ocurra una o la otra.
Consideremos ahora la situaci´on que enfrenta la firma 1. Como ya se plante´o, nuestro supuesto es que
´esta no sabe si la firma 2 enfrenta costos altos o bajos, pero s´ı sabe que existen solo dos valores posibles
(ca y cb) y asigna cierta probabilidad a la ocurrencia de cada uno. Adem´as, seguimos suponiendo que
cada jugador entiende que el otro act´ua de forma racional y buscando maximizar su ganancia, lo que
en este caso se traduce en que la firma 1 sabe que la 2 seguir´a una estrategia distinta seg´un sus costos
efectivos sean altos o bajos. Todas estas ideas se resumen en el hecho de que la estrategia ´optima de la
firma 1, dadas ciertas cantidades q2(ca) y q2(cb) fijas, es aquella que maximiza su ganancia esperada:
π1 = α [(A − q1 − q2(ca))q1 − cq1] + (1 − α) [(A − q1 − q2(cb))q1 − cq1]
Al derivar respecto de q1 y despejar obtenemos que la respuesta ´optima de la firma 1, a cualquier par
de cantidades q2(ca) y q2(cb), viene dada por:
q∗
1 =
α (A − q2(ca) − c) + (1 − α) (A − q2(cb) − c)
2
As´ı, para proponer un equilibrio para este juego, hemos seguido hasta ahora el mismo camino que
para el caso de informaci´on completa: computar las funciones de reacci´on. Las diferencias fundamentales
que se evidencian a partir del ejemplo son que: (1) hay que encontrar una funci´on de reacci´on para cada
caso en el que se pueda encontrar un jugador (costo alto o bajo en el ejemplo), y (2) la funci´on objetivo
relevante toma en cuenta la incertidumbre que tienen los jugadores respecto de las caracter´ısticas de los
dem´as.
Una vez que hemos tenido en consideraci´on estas cuestiones, encontrar el equilibrio del juego se
reduce a calcular el perfil de estrategias en el cual las funciones de reacci´on se intersectan. De la discusi´on
anterior se deduce que un perfil viene dado por las cantidades q1, q2(ca) y q2(cb). Las tres funciones de
reacci´on ya planteadas constituyen un sistema que nos permiten calcular estas inc´ognitas. En efecto, al
despejar se obtienen los siguientes resultados:
qN
1 =
A − 2c + αca + (1 − α)cb
3
qN
2 (ca) =
A − 2ca + c
3
+
(1 − α)(ca − cb)
6
qN
2 (cb) =
A − 2cb + c
3
−
α(ca − cb)
6
El supra´ındice N hace referencia a Nash, pero en juegos de informaci´on incompleta muchas veces
se denomina equilibrio de Bayes-Nash. Aunque este ´ultimo concepto tiene una definici´on formal que
da cuenta de las diferencias con el EN, lo importante para nuestros prop´ositos lo podemos observar a
partir del ejemplo: el perfil de estrategias define una acci´on para cada posible “realizaci´on” de la firma
2 (ya que como discutimos esta actuar´a diferente seg´un los costos que enfrente) y la funci´on objetivo
relevante da cuenta de la incertidumbre que implica la informaci´on incompleta (en este caso se trata de
la ganancia esperada dada la probabilidad α).
Una subasta a sobre cerrado
Una situaci´on de inter´es que naturalmente debe ser estudiada como un juego de informaci´on in-
completa son las subastas. Esto, porque la valoraci´on que tiene cada postor o posible comprador es
Microeconom´ıa II
Apunte- Teoría de juegos
Apunte- Teoría de juegos
Apunte- Teoría de juegos
Apunte- Teoría de juegos
Apunte- Teoría de juegos

Más contenido relacionado

Similar a Apunte- Teoría de juegos

Estrategias de juego reactiva
Estrategias de juego reactivaEstrategias de juego reactiva
Estrategias de juego reactivaEder Garcia
 
La teoría de juegos y los oligopolios
La teoría de juegos y los oligopoliosLa teoría de juegos y los oligopolios
La teoría de juegos y los oligopoliosYeniMora
 
El Dilema Del Prisionero
El Dilema Del PrisioneroEl Dilema Del Prisionero
El Dilema Del Prisioneroricardo1962
 
El Dilema Del Prisionero
El Dilema Del PrisioneroEl Dilema Del Prisionero
El Dilema Del Prisioneroguestd28977a
 
Teoría de Juegos - Daniel Velásquez
Teoría de Juegos - Daniel VelásquezTeoría de Juegos - Daniel Velásquez
Teoría de Juegos - Daniel VelásquezDaniel Velasquez
 
La teoria de los juegos
La teoria de los juegosLa teoria de los juegos
La teoria de los juegosMarelvis_inf
 
TEORIA DE JUEGOS STALIN MEZA
TEORIA DE JUEGOS STALIN MEZATEORIA DE JUEGOS STALIN MEZA
TEORIA DE JUEGOS STALIN MEZASTALIN MEZA
 
Unidad 4 entorno economico logistica
Unidad 4 entorno economico logisticaUnidad 4 entorno economico logistica
Unidad 4 entorno economico logisticaFrancisco Martinez
 
Introduccion a-los-juegos
Introduccion a-los-juegosIntroduccion a-los-juegos
Introduccion a-los-juegosrafalo22
 
C:\Fakepath\La Guerra De Los Sexos
C:\Fakepath\La Guerra  De Los SexosC:\Fakepath\La Guerra  De Los Sexos
C:\Fakepath\La Guerra De Los Sexosmemexixunhttp
 
La Guerra De Los Sexos
La Guerra  De Los SexosLa Guerra  De Los Sexos
La Guerra De Los Sexosmemexixunhttp
 
C:\Fakepath\La Guerra De Los Sexos
C:\Fakepath\La Guerra  De Los SexosC:\Fakepath\La Guerra  De Los Sexos
C:\Fakepath\La Guerra De Los Sexosmemexixunhttp
 
C:\Fakepath\La Guerra De Los Sexos
C:\Fakepath\La Guerra  De Los SexosC:\Fakepath\La Guerra  De Los Sexos
C:\Fakepath\La Guerra De Los Sexosmemexixunhttp
 
Introduccion a la teoria de juegos
Introduccion a la teoria de juegosIntroduccion a la teoria de juegos
Introduccion a la teoria de juegosMartin Santos
 
T E O R I A D E J U E G O E C O N
T E O R I A  D E  J U E G O  E C O NT E O R I A  D E  J U E G O  E C O N
T E O R I A D E J U E G O E C O Nnarx
 

Similar a Apunte- Teoría de juegos (20)

teoriadesistemas
teoriadesistemasteoriadesistemas
teoriadesistemas
 
TEORÍA DE JUEGOS.pptx
TEORÍA DE JUEGOS.pptxTEORÍA DE JUEGOS.pptx
TEORÍA DE JUEGOS.pptx
 
1. La teoría de juegos.pptx
1. La teoría de juegos.pptx1. La teoría de juegos.pptx
1. La teoría de juegos.pptx
 
Estrategias de juego reactiva
Estrategias de juego reactivaEstrategias de juego reactiva
Estrategias de juego reactiva
 
Revista Luis Mejia
Revista Luis MejiaRevista Luis Mejia
Revista Luis Mejia
 
Teoria delosjuegos
Teoria delosjuegosTeoria delosjuegos
Teoria delosjuegos
 
La teoría de juegos y los oligopolios
La teoría de juegos y los oligopoliosLa teoría de juegos y los oligopolios
La teoría de juegos y los oligopolios
 
El Dilema Del Prisionero
El Dilema Del PrisioneroEl Dilema Del Prisionero
El Dilema Del Prisionero
 
El Dilema Del Prisionero
El Dilema Del PrisioneroEl Dilema Del Prisionero
El Dilema Del Prisionero
 
Teoría de Juegos - Daniel Velásquez
Teoría de Juegos - Daniel VelásquezTeoría de Juegos - Daniel Velásquez
Teoría de Juegos - Daniel Velásquez
 
La teoria de los juegos
La teoria de los juegosLa teoria de los juegos
La teoria de los juegos
 
TEORIA DE JUEGOS STALIN MEZA
TEORIA DE JUEGOS STALIN MEZATEORIA DE JUEGOS STALIN MEZA
TEORIA DE JUEGOS STALIN MEZA
 
Unidad 4 entorno economico logistica
Unidad 4 entorno economico logisticaUnidad 4 entorno economico logistica
Unidad 4 entorno economico logistica
 
Introduccion a-los-juegos
Introduccion a-los-juegosIntroduccion a-los-juegos
Introduccion a-los-juegos
 
C:\Fakepath\La Guerra De Los Sexos
C:\Fakepath\La Guerra  De Los SexosC:\Fakepath\La Guerra  De Los Sexos
C:\Fakepath\La Guerra De Los Sexos
 
La Guerra De Los Sexos
La Guerra  De Los SexosLa Guerra  De Los Sexos
La Guerra De Los Sexos
 
C:\Fakepath\La Guerra De Los Sexos
C:\Fakepath\La Guerra  De Los SexosC:\Fakepath\La Guerra  De Los Sexos
C:\Fakepath\La Guerra De Los Sexos
 
C:\Fakepath\La Guerra De Los Sexos
C:\Fakepath\La Guerra  De Los SexosC:\Fakepath\La Guerra  De Los Sexos
C:\Fakepath\La Guerra De Los Sexos
 
Introduccion a la teoria de juegos
Introduccion a la teoria de juegosIntroduccion a la teoria de juegos
Introduccion a la teoria de juegos
 
T E O R I A D E J U E G O E C O N
T E O R I A  D E  J U E G O  E C O NT E O R I A  D E  J U E G O  E C O N
T E O R I A D E J U E G O E C O N
 

Último

Dino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfDino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfAdrianKreitzer
 
Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxvladisse
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICOlupismdo
 
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docPRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docmilumenko
 
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdfQUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdflupismdo
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayEXANTE
 
abrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasabrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasDeniseGonzales11
 
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTMETODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTrodrigolozanoortiz
 
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxPRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxmanuelrojash
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.ManfredNolte
 
Principios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdfPrincipios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdfauxcompras5
 
Sistema_de_Abastecimiento en el peru.pptx
Sistema_de_Abastecimiento en el  peru.pptxSistema_de_Abastecimiento en el  peru.pptx
Sistema_de_Abastecimiento en el peru.pptxJUANJOSE145760
 
puntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfpuntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfosoriojuanpablo114
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptxNathaliTAndradeS
 
Estructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroEstructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroMARTINMARTINEZ30236
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionPedroSalasSantiago
 
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdfMANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdflupismdo
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfGegdielJose1
 
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSTEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSreyjuancarlosjose
 

Último (20)

Mercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdfMercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdf
 
Dino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfDino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdf
 
Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptx
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
 
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docPRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
 
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdfQUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en Uruguay
 
abrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasabrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuencias
 
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTMETODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
 
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxPRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
 
Principios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdfPrincipios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdf
 
Sistema_de_Abastecimiento en el peru.pptx
Sistema_de_Abastecimiento en el  peru.pptxSistema_de_Abastecimiento en el  peru.pptx
Sistema_de_Abastecimiento en el peru.pptx
 
puntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfpuntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdf
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptx
 
Estructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroEstructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financiero
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacion
 
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdfMANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
 
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSTEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
 

Apunte- Teoría de juegos

  • 1. Microeconom´ıa II Teor´ıa de Juegos y Aplicaciones Aldo Gonz´alez T. Daniel Hojman T. Fabi´an Sep´ulveda C. Esta versi´on: 10 de marzo de 2014, Primera versi´on: Agosto 2012
  • 2. Cap´ıtulo 1 Teor´ıa de Juegos 1.1. Introducci´on En muchas situaciones donde un sujeto debe tomar una decisi´on, el resultado que obtenga depen- der´a no solo de sus propias acciones, sino tambi´en de las decisiones que tomen otros individuos. Por su parte, los resultados de esos otros individuos tambi´en dependen de la decisi´on del sujeto en cuesti´on. As´ı, un agente en este tipo de situaci´on se cuestionar´a qu´e har´an los dem´as... y qu´e piensan los dem´as que har´a ´el mismo. Esta interdependencia -que se puede observar en una amplia variedad de situacio- nes sociales- se conoce como interacci´on estrat´egica. Cuando la interacci´on estrat´egica sea un elemento fundamental en la toma de decisiones entre individuos, hablaremos de situaci´on estrat´egica. El objetivo de la teor´ıa de juegos es estudiar el comportamiento de individuos en situaciones es- trat´egicas. Y aunque el ´enfasis est´a puesto en las decisiones que son tomadas de forma individual, una de las dimensiones m´as interesantes de la teor´ıa es que permite hacer predicciones respecto de los resul- tados agregados que divergen de los resultados cl´asicos en econom´ıa, en el sentido de que la motivaci´on individual (self-interest) puede llevar a resultados ineficientes desde un punto de vista social. M´as en ge- neral, la teor´ıa de juegos es ´util para analizar diversas situaciones de inter´es econ´omico, como mercados poco competitivos, asimetr´ıas de informaci´on, cumplimiento bajo contratos incompletos, etc. Adem´as, tiene aplicaciones en otras disciplinas, como ciencias sociales, management, e incluso biolog´ıa. Una tipolog´ıa de juegos Algo que conviene tener en mente antes de comenzar el estudio formal de la teor´ıa de juegos es que, dependiendo del contexto o la situaci´on que nos interese, la interacci´on estrat´egica puede manifestarse en diferentes formas. Por ejemplo, la situaci´on estrat´egica m´as sencilla que podemos pensar es una en la cual cada agente involucrado debe tomar una decisi´on de forma simult´anea considerando el efecto que tienen las decisiones de los dem´as en el resultado propio. Pero pensemos, por otro lado, en un juego de ajedrez donde cada jugador toma decisiones en funci´on de lo que ha ocurrido previamente y de lo que espera que ocurrir´a en el futuro. En este ´ultimo caso existe un elemento secuencial relevante, pues las decisiones tomadas en por un jugador incidir´an en las jugadas subsecuentes. As´ı, cuando analicemos situaciones del primero tipo hablaremos de juegos est´aticos, mientras que en el segundo caso nos referiremos a juegos din´amicos. Otro elemento que puede diferir seg´un la situaci´on que nos interese dice relaci´on con la informaci´on que posee cada jugador respecto de los dem´as. Por ejemplo, pensemos en una subasta a sobre cerrado, donde cada potencial comprador debe hacer una ´unica oferta y aquel que ofrezca un mayor pago se lleva 1
  • 3. Facultad de Econom´ıa y Negocios - Universidad de Chile 2 el bien subastado. Si un postor no conoce la valoraci´on de los dem´as por el bien en cuesti´on, entonces se enfrenta al dilema de ofrecer un pago alto y con ello aumentar las probabilidades de ser el ganador, u ofrecer un pago m´as bajo y tener la posibilidad de adquirir el bien a un precio conveniente. En este ejemplo, la valoraci´on que tiene cada comprador sobre el bien es informaci´on valiosa, en tanto el poseerla o no incidir´a en la decisi´on tomada. Cuando en una situaci´on estrat´egica no exista informaci´on privada como la descrita en el p´arrafo anterior, hablaremos de juegos de informaci´on completa, mientras que cuando existe informaci´on sobre los jugadores que no sea de conocimiento com´un se tratar´a de juegos de informaci´on incompleta. As´ı, una tipolog´ıa de juegos muy general nos permite clasificar las diferentes situaciones estrat´egicas en cuatro categor´ıas: Juegos est´aticos de informaci´on completa Juegos din´amicos de informaci´on completa Juegos est´aticos de informaci´on incompleta Juegos din´amicos de informaci´on incompleta Cada uno de estos tipos de juego involucra -en t´erminos de la teor´ıa- conceptos e instrumentos le- vemente diferentes, que estudiaremos caso a caso. No obstante, el foco del curso estar´a puesto sobre los juegos de informaci´on completa, partiendo por los de tipo est´atico, para luego analizar las situaciones que requieran un elemento din´amico. Los juegos de informaci´on incompleta, aunque no ser´an estudiados al mismo nivel de profundidad, ser´an relevantes en el cap´ıtulo correspondiente a econom´ıa de la infor- maci´on. Ejemplos cl´asicos En las siguientes secciones estudiaremos en detalle la terminolog´ıa y las t´ecnicas que se utilizan al analizar situaciones estrat´egicas bajo la perspectiva de la teor´ıa de juegos. Pero para introducir cu´ales ser´an los elementos b´asicos en los que pondremos nuestra atenci´on, a continuaci´on se muestran algunos juegos cl´asicos que son ´utiles para ejemplificar ciertos tipos de interacci´on estrat´egica donde destaca alguna dimensi´on como la cooperaci´on, la coordinaci´on, el conflicto, etc. El primer ejemplo que revisaremos es probablemente uno de los juegos m´as famosos, conocido como el dilema del prisionero. La situaci´on consiste en dos sospechosos que han sido arrestados y son mantenidos en celdas separadas. La polic´ıa solo tiene evidencia suficiente para acusar a cada uno de un delito menor, pero no para condenarlos por un delito mayor a menos que uno de ellos testifique en contra del otro (confesar). As´ı, si ambos guardan silencio (callar) entonces cada uno ser´a sentenciado por el delito menor y pasar´a un a˜no en prisi´on. Si solo uno de ellos confiesa, entonces ser´a liberado por cooperar con la polic´ıa, mientras que su c´omplice ser´a condenado a 9 meses. Finalmente, si ambos confiesan entonces cada uno pasar´a 6 meses en prisi´on. Aunque toda la informaci´on relevante para entender esta situaci´on se encuentra en el p´arrafo anterior, muchos juegos en los que nos interesaremos pueden ser resumidos de forma c´omoda en lo que se conoce como una matriz de pagos. Para el caso del dilema del prisionero, esta matriz se muestra a continuaci´on: Prisionero 2 Callar Confesar Prisionero 1 Callar -1, -1 -9, 0 Confesar 0, -9 -6, -6 Figura 1.1: Dilema del prisionero Microeconom´ıa II
  • 4. Facultad de Econom´ıa y Negocios - Universidad de Chile 3 La forma en la que est´a escrita esta matriz nos indica que el jugador que llamamos “prisionero 1” elige una acci´on entre las dos posibles filas “callar” y “confesar”. Por su parte, el “prisionero 2” puede elegir entre las mismas alternativas, pero que en la matriz est´an representadas por las columnas. Los n´umeros en cada celda de la matriz nos indican los pagos que recibe cada uno seg´un las estrategias escogidas, donde convencionalmente se entiende que el primer n´umero corresponde al pago del jugador que elige filas (prisionero 1 en este ejemplo), mientras el segundo corresponde al pago del jugador que elige columnas. Por ejemplo, si el prisionero 1 elige confesar y el 2 callar, la celda correspondiente indica (0, −9) porque aquel que confes´o saldr´a libre mientras que el que call´o ser´a condenado a 9 meses. En general, los n´umeros asociados a los pagos no tienen por qu´e tener una interpretaci´on concreta como en este caso, y los utilizaremos simplemente para indicar que aquellos resultados con un pago mayor son preferidos a los que tienen un pago menor. Viendo la matriz de pagos es f´acil notar que resulta m´as conveniente para ambos la situaci´on en la que cada uno guarda silencio por sobre la alternativa en la que cada uno confiesa. As´ı, el resultado en el que ambos eligen “callar” es uno cooperativo, en tanto les permite asegurar una sentencia menor. El dilema est´a en el hecho de que bajo el resultado cooperativo, existe una tentaci´on individual a romper la cooperaci´on y confesar para salir en libertad. Esta tensi´on entre la cooperaci´on social y el inter´es propio se presenta en diversas situaciones cotidianas (es el mismo principio que se aplica en el an´alisis de la provisi´on de bienes p´ublicos), y es capturada de forma sencilla en este juego. El an´alisis de los posibles resultados de este juego lo dejamos para las secciones siguientes. Para motivar el siguiente ejemplo, pensemos en situaciones donde la cooperaci´on no es lo relevante, sino que los intereses de los jugadores est´an completamente contrapuestos porque -por ejemplo- lo que gana uno lo pierde el otro.1 Un juego que ejemplifica esto se conoce como matching pennies y consiste en dos jugadores, cada uno de los cuales tiene una moneda y debe mostrar una cara de esta. Si ambos muestran la misma cara, entonces el jugador 1 gana el juego y se lleva las dos monedas; mientras que si muestran distintas caras, entonces el jugador 2 gana el juego y el derecho a quedarse las monedas. Esta mec´anica se resume en la siguiente matriz de pagos: Jugador 2 Cara Sello Jugador 1 Cara 1, −1 −1, 1 Sello −1, 1 1, −1 Figura 1.2: Matching Pennies En este tipo de juegos el conflicto entre los jugadores es el elemento relevante, y la raz´on fundamental por la que existe interacci´on estrat´egica es porque a cada uno le gustar´ıa saber qu´e es lo que har´a el otro pero que el otro no sepa lo que har´a el primero. Podemos pensar -por ejemplo- en la ejecuci´on de forma simplificada de un penal en un partido de f´utbol: el arquero debe elegir si saltar a la izquierda o a la derecha, mientras que el tirador debe elegir si patear a la izquierda o a la derecha. Al igual que en el juego de las monedas, el ´exito de uno de los jugadores significa el fracaso del otro. Otro elemento que puede resultar relevante en ciertas situaciones, y que podemos capturar en un juego sencillo, es la coordinaci´on. El ejemplo cl´asico en este contexto se conoce como la batalla de los sexos2 , cuya historia cuenta que una pareja ten´ıa una cita, pero cada uno olvid´o el lugar de encuentro (que puede ser un partido de f´utbol o el museo) y ya no pueden ponerse en contacto para aclararlo. 1A veces se denominan juegos de suma cero, pues no se generan ganancias netas de la interacci´on entre los agentes. Esto es, dado alg´un resultado, la suma de los pagos de los jugadores es cero. 2El nombre es un tanto anacr´onico, pues hace referencia a una concepci´on sexista de las preferencias por entretenci´on. En los ejemplos modernos del juego, como el que se presenta aqu´ı, se intenta eliminar este elemento aun cuando se conserva el nombre. Microeconom´ıa II
  • 5. Facultad de Econom´ıa y Negocios - Universidad de Chile 4 Adem´as, suponemos que cada uno tiene preferencias por uno de los lugares (Josefa por el f´utbol y Manuel por el museo), pero que de todos modos ambos prefieren la compa˜n´ıa del otro por sobre ir a su lugar favorito solos. As´ı, la matriz de pagos asociada al juego es la siguiente: Manuel F´utbol Museo Josefa F´utbol 2,1 0,0 Museo 0,0 1,2 Figura 1.3: Batalla de los sexos En este caso el conflicto no es la dimensi´on relevante, sino la necesidad de coordinaci´on para alcanzar un resultado conveniente. Como cada uno tiene preferencias distintas respecto de los lugares de encuen- tro, no resulta obvio a cu´al de estos deben dirigirse y eventualmente pueden terminar en diferentes sitios, lo que no es conveniente en ning´un caso. Los ejemplos anteriores son una muestra del tipo de problem´aticas que se puede capturar de manera muy sencilla en forma de juegos con dos estrategias y dos jugadores. Sin embargo, estudiaremos juegos con estructuras m´as generales, donde puede haber m´as jugadores u otros tipos de estrategias. Para esto, en la siguiente secci´on se introducen los conceptos que utilizaremos a lo largo del curso y se define de manera formal la idea de juego introducida con estos ejemplos. 1.2. Conceptos b´asicos y definici´on de juego Para el estudio formal de la teor´ıa de juegos requerimos de un marco te´orico sobre el cual poder trabajar, estudiar problemas y proponer posibles soluciones. Aunque muchas veces nos interesemos en juegos que b´asicamente son una situaci´on cotidiana y que resultan intuitivos de entender, para poder utilizar el instrumental que la teor´ıa nos entrega necesitamos definir de forma concreta ciertos aspectos que resultan claves para entender la interacci´on estrat´egica que puede darse entre los agentes en la situaci´on que queramos estudiar. As´ı, si queremos analizar situaciones estrat´egicas desde una perspectiva de juegos, es necesario que nos preguntemos cuestiones como, ¿qui´enes toman decisiones relevantes en esta situaci´on?, ¿cu´ales son las distintas opciones que tiene cada uno?, ¿cu´ales son las preferencias que tienen sobre los posibles resultados finales cada jugador?. Esta ´ultima pregunta es particularmente relevante ya que en ella est´a impl´ıcita la potencial interacci´on estrat´egica presente en el juego. En t´erminos generales, los elementos que hay que definir con precisi´on para estructurar un juego son: Jugadores: Son los agentes (individuos, firmas, organizaciones, pa´ıses, etc) que toman decisiones rele- vantes en la determinaci´on del resultado final. Estrategias: Estas explicitan cu´al es la decisi´on que debe tomar cada jugador, y entre cu´ales alterna- tivas puede elegir. Notar que esta noci´on es bastante general, ya que una estrategia puede ir desde algo sencillo como decidir entre un par de acciones (confesar o no confesar), hasta algo elaborado como elegir un plan de acci´on completo para cada posible situaci´on en la que se encuentre el jugador. Pagos: Corresponde a alguna forma de definir la valoraci´on que tienen los individuos respecto de los posibles resultados del juego. Puede ser simplemente un orden de preferencias (prefiero el resultado Microeconom´ıa II
  • 6. Facultad de Econom´ıa y Negocios - Universidad de Chile 5 A por sobre el B, y ´este ´ultimo por sobre el C), o una funci´on de utilidad definida sobre las estrategias de todos los jugadores. Reglas del juego: Es fundamental definir si las decisiones se toman en forma simult´anea o existe alg´un elemento temporal, y en este ´ultimo caso, determinar qu´e informaci´on se maneja al momento de tomar una decisi´on3 . Podemos notar que son varias las dimensiones a tener en consideraci´on al momento de analizar una situaci´on estrat´egica. Es por ello que nos gustar´ıa resumir todas las caracter´ısticas de un juego en alguna estructura relativamente simple y bien definida. Para este prop´osito existen dos maneras b´asicas de plantear un juego: las denominadas forma normal y forma extensiva. En esta secci´on vamos a definir un juego en forma normal, y dejaremos la forma extensiva para el caso de juegos secuenciales, en donde nos resultar´a m´as ´util. Antes de entregar una definici´on formal de juego en forma normal estudiaremos un ejemplo diferente a los vistos en la secci´on anterior. Se trata de un modelo de competencia imperfecta entre firmas, conocido como modelo de Cournot. Pensemos en un mercado en el cual existen dos empresas que producen un mismo bien, cuya demanda agregada est´a dada por una funci´on P(Q) = A − Q, donde P es el precio de mercado y Q la producci´on agregada. Cada una de las firmas i = 1, 2 elige una cantidad a producir qi, de modo que Q = q1 + q2. Adem´as cada firma enfrenta un costo marginal constante que denotaremos c. As´ı, los beneficios de cada firma est´an dados, respectivamente, por: π1 = (A − q1 − q2)q1 − cq1 π2 = (A − q1 − q2)q2 − cq2 La competencia que se da entre estas firmas al momento de elegir sus niveles de producci´on en forma simult´anea, puede ser entendida como un juego. En efecto, la interacci´on estrat´egica es fundamental en este caso, ya que el precio que enfrente la firma depender´a de la producci´on de su competidora, y as´ı depender´a tambi´en su nivel de producci´on ´optimo. Lo relevante del ejemplo -por el momento- es notar que este juego, aun cuando solo tiene 2 jugadores, no puede ser escrito de forma matricial, porque cada jugador tiene un conjunto de posibilidades muy grande sobre el cual elegir: cualquier nivel de producci´on (n´umero real) es un nivel de producci´on factible para la firma. As´ı, escribir este juego en forma matricial no es solo poco conveniente, sino que es imposible ya que se trata de un espacio de estrategias continuo. Pero adem´as de enfrentarnos a diferentes tipos de estrategias seg´un el tipo de juego, podemos enfren- tarnos a otras situaciones que hacen de la matriz de pagos un esquema poco conveniente en varios casos. Pensemos, por ejemplo, en el mismo juego de competencia a la Cournot, pero con n firmas, donde n es un n´umero cualquiera mayor que 1. En este caso, la producci´on agregada viene dada por Q = n i=1 qi, y tenemos que la funci´on de beneficio es, para cada firma: πi =  A − n j=1 qj   qi − cqi ∀i = 1, ..., n Tener una cantidad mayor de jugadores tambi´en hace complicado el uso de las matrices de pagos para plantear juegos. Por todo lo anterior, requerimos de un esquema un tanto m´as general para definir un juego, que nos permita utilizar los conceptos desarrollados por la teor´ıa en diversas situaciones, independiente de cuestiones como el tipo de estrategias existentes o el n´umero de jugadores. Este esquema es la forma normal de un juego. 3Una cuesti´on clave en este sentido es si al momento de elegir su estrategia, un jugador observa las estrategias seguidas por los que jugaron antes que ´el. Microeconom´ıa II
  • 7. Facultad de Econom´ıa y Negocios - Universidad de Chile 6 Para definir formalmente esta estructura, introduciremos un poco de notaci´on que ser´a utilizada regularmente en lo sucesivo. Consideraremos juegos de n jugadores, que ser´an indizados por la letra i, de modo que i = 1, ..., n. Adem´as denotaremos con Si al conjunto de estrategias del jugador i-´esimo, y con si ∈ Si a alguna estrategia particular perteneciente a este conjunto. Dado lo anterior, entenderemos como perfil de estrategias s = (s1, s2, ..., sn) a una combinaci´on particular de estrategias individuales. Finalmente, la informaci´on respecto a las preferencias o pagos puede ser resumidas en funciones de utilidad que asocian a cada perfil de estrategias s un n´umero real ui(s), de modo que si un perfil ¯s es preferido a un perfil ˜s por el individuo i, se cumple que ui(¯s) > ui(˜s).4 Definici´on 1. Un juego en forma normal viene dado por: 1. Un conjunto de n jugadores, denotado por I 2. Para cada jugador i = 1, ..., n, un conjunto de estrategias Si que define las estrategias disponibles para cada uno 3. Una funci´on de utilidad ui(s1, ..., sn) para cada jugador i = 1, ..., n, que define el pago que recibe el jugador i si el juego se resuelve seg´un el perfil (s1, ..., sn) Formalmente, podemos resumir toda la informaci´on del juego en una estructura G = I, {Si}n i=1, {ui}n i=1 Esta forma de definir un juego es particularmente conveniente para el caso de juegos est´aticos, donde cada jugador elige simult´aneamente una acci´on entre un conjunto de posibilidades. Por ejemplo, para el caso del dilema del prisionero tenemos que el conjunto de estrategias de cada jugador es Si = {Callar, Confesar} y un posible perfil de estrategias ser´ıa (Callar, Callar).5 La funci´on de utilidad en este caso es discreta, y se puede escribir como: u1(s1, s2) =    −1 si (s1, s2) = (Callar, Callar) −9 si (s1, s2) = (Callar, Confesar) 0 si (s1, s2) = (Confesar, Callar) −6 si (s1, s2) = (Confesar, Confesar) y de forma an´aloga para el jugador 2. Notar que en este ejemplo en particular se trata de un juego sim´etrico, donde las estrategias y los pagos son iguales para cada jugador. En general, esto no tiene por qu´e ser as´ı, y podemos pensar en juegos donde cada jugador toma distintas decisiones y/o tiene diferentes preferencias sobre los potenciales resultados. Por su parte, para el caso de la competencia a la Cournot con n firmas, el juego queda definido por los siguientes elementos: I = {1, 2, ..., n} Si = R, para cada i en I ui(q1, ..., qn) = A − n j=1 qj qi − cqi, para cada i en I Podemos notar que aunque este juego es mucho “m´as grande” que los juegos de la introducci´on, en el sentido de que hay n jugadores e infinitas estrategias disponibles para cada uno, la forma normal del 4Notar que, tal como estudiamos en Microeconom´ıa I, la funci´on de utilidad tiene un car´acter ordinal. Esto es, los n´umeros que entrega no tienen necesariamente interpretaci´on en si mismo, sino que indican la preferencia de un resultado del juego por sobre otro 5Una aclaraci´on de notaci´on: en el primer caso utilizamos los s´ımbolos { } porque estamos haciendo referencia a un conjunto -el de todas las opciones disponibles para el jugador i-, mientras que en ´ultimo utilizamos ( ) porque se trata de un par ordenado -el que indica las estrategias seguidas por los jugadores 1 y 2 respectivamente. Microeconom´ıa II
  • 8. Facultad de Econom´ıa y Negocios - Universidad de Chile 7 juego resume toda la informaci´on relevante de una forma c´omoda y nos permitir´a utilizar el instrumental que estudiaremos en las secciones siguiente sin restringirnos a estructuras muy particulares (como lo son, por ejemplo, las matrices de pagos). 1.3. Estrategias dominantes y dominadas El objetivo de estudiar teor´ıa de juegos es ser capaces de hacer predicciones sobre cu´al resultado podr´ıamos esperar que se diera en una situaci´on estrat´egica. As´ı, el paso natural luego de formalizar la idea de juego es preguntarse c´omo lo resolvemos, o m´as en general, qu´e podemos decir respecto del comportamiento esperado de los jugadores. Los conceptos presentados a continuaci´on son una primera aproximaci´on a estas preguntas. Consideremos a un jugador en el ejemplo del dilema del prisionero. El sujeto en cuesti´on probable- mente se estar´ıa preguntando si su c´omplice va a confesar o guardar´a silencio. Si el otro va a confesar, entonces lo mejor para ´el ser´ıa confesar tambi´en, pues de ese modo pasar´ıa 6 meses en prisi´on, en vez de los 9 a los que es sentenciado si callase. Por otra parte, si el otro guarda silencio entonces el jugador preferir´ıa confesar, pues as´ı sale libre por cooperar con la polic´ıa, en vez de pasar un mes cumpliendo sentencia. Lo clave es entonces, que no importa la estrategia que siga el otro, al sujeto siempre le con- vendr´a confesar. En este caso, diremos que “confesar” es una estrategia dominante para el jugador, ya que otorga un pago mayor sin importar cu´al es la estrategia que siga el otro. Definici´on 2. Una estrategia es una estrategia dominante para un jugador, si esta entrega el mejor pago para ese jugador, sin importar cu´al estrategia sigan los dem´as jugadores. En el caso del dilema del prisionero, la estrategia “confesar” es dominante para cada jugador, por lo que proponer que ambos seguir´an esta estrategia parece una predicci´on natural. As´ı, de acuerdo a este criterio, el resultado del juego ser´ıa (confesar, confesar) seg´un lo cual cada jugador recibe un pago de (−9). Aunque plantear que un jugador siempre preferir´a una estrategia dominante por sobre otras estra- tegias resulta muy intuitivo y es potencialmente una buena predicci´on de los resultados de un juego, nos enfrentamos al problema de que no siempre existir´an este tipo de estrategias. En efecto, en general tendremos que la estrategia ´optima de cada jugador variar´a seg´un las estrategias que sigan los dem´as, lo cual es un elemento la mayor´ıa de las veces relevante en situaciones estrat´egicas. As´ı, el concepto de estrategia dominante puede ser muy atractivo, pero poco ´util en muchas aplicaciones. Cuando nos enfrentamos a juegos donde no existen estrategias dominantes, podemos utilizar otro concepto ´util e intuitivo: estrategia dominada. En palabras simples, una estrategia es dominada si existe otra estrategia que siempre resulta m´as conveniente. Consideremos el siguiente ejemplo para ver de qu´e se trata: Jugador B Izquierda Centro Derecha Jugador A Arriba 10,10 14,12 14,15 Medio 12,14 20,20 28,15 Abajo 15,14 25,28 25,25 Figura 1.4: Estrategias dominadas Comprobemos en primer lugar que no existen estrategias dominantes. En efecto, si el jugador B juega centro, el A preferir´a abajo (porque 25 es preferido a 20 y a 14), mientras que si el B elige derecha, Microeconom´ıa II
  • 9. Facultad de Econom´ıa y Negocios - Universidad de Chile 8 entonces al A le convendr´a jugar medio (porque 28 es preferido a 25 y a 14). As´ı, no existe una estrategia para el jugador A que sea ´optima en cualquier caso (de forma an´aloga se puede comprobar que para el B tampoco existe). No obstante, en este juego s´ı existen estrategias dominadas. Por ejemplo, la estrategia “arriba” es dominada por la estrategia “medio” para el jugador A, ya que esta ´ultima le entrega un pago mayor sin importar lo que haga el B (12 > 10, 20 > 14, y 28 > 14). As´ı, aun cuando “medio”no es una estrategia dominante seg´un lo discutido en el p´arrafo anterior, s´ı es correcto afirmar que domina a la estrategia “arriba”. Definici´on 3. La estrategia si est´a estrictamente dominada por la estrategia si para el jugador i, si es que ui(s1, ..., si , ..., sn) > ui(s1, ..., si, ..., sn) para cualquier combinaci´on de estrategias de los dem´as jugadores (s1, ..., si−1, si+1, ..., sn). De la definici´on se desprende que la estrategia si no es necesariamente una estrategia dominante, ya que es superior bajo cualquier circunstancia solamente respecto de la estrategia si. En nuestro ejemplo vimos que la estrategia “medio” del jugador A no siempre es superior a la estrategia “abajo”, pues depend´ıa de la estrategia jugada por B; sin embargo, es claro que “medio” s´ı es superior a “arriba”, sin importar lo que haga B. Como no existe una estrategia dominante, no podemos aplicar el criterio utilizado en el dilema del prisionero para proponer un potencial resultado del juego. ¿En qu´e nos pueden ayudar entonces las estrategias dominadas?. Una idea natural es pensar que un jugador nunca utilizar´a una estrategia estric- tamente dominada, pues no importa qu´e supuesto haga sobre la estrategia que seguir´a el otro jugador, siempre tendr´a una alternativa superior a la estrategia que est´a dominada. M´as aun, si nos ponemos en el lugar del jugador B -quien est´a conjeturando sobre la posible estrategia que seguir´a su contraparte- es razonable pensar que descartar´a la posibilidad de que el jugador A siga una estrategia estrictamen- te dominada, como lo es la estrategia “arriba”. As´ı, ambos jugadores eliminar´an esta posibilidad y se enfocar´an en un juego reducido que no considera la estrategia estrictamente dominada: Jugador B Izquierda Centro Derecha Jugador A Medio 12,14 20,20 28,15 Abajo 15,14 25,28 25,25 Figura 1.5: Juego reducido Si analizamos para este nuevo juego las posibilidades del jugador B, notaremos que la estrategia “centro” es estrictamente dominante. Como la existencia de una estrategia estrictamente dominante no es m´as que un caso en el que todas las estrategias -excepto una- est´an estrictamente dominadas, utilizando el mismo criterio que en el paso anterior podemos eliminar “izquierda” y “derecha” para obtener una nueva versi´on reducida del juego. Jugador B Centro Jugador A Medio 20,20 Abajo 25,28 Figura 1.6: Juego reducido En este ´ultimo juego, mucho m´as sencillo que el original, se tiene que el jugador A tiene certeza Microeconom´ıa II
  • 10. Facultad de Econom´ıa y Negocios - Universidad de Chile 9 respecto del resultado de su decisi´on, por lo que seguir´a la estrategia que le otorga un mayor pago: “abajo”.6 Este proceso se denomina eliminaci´on iterativa de estrategias estrictamente dominadas. As´ı, bajo el criterio de eliminar estrategias estrictamente dominadas, podemos proponer que un resultado probable de este juego ser´a el perfil (abajo, centro). Definici´on 4. Un perfil de estrategias es un equilibrio por eliminaci´on iterativa de estrategias estrictamente dominadas si es el ´unico perfil que sobrevive al procedimiento de eliminaci´on. La eliminaci´on iterativa de estrategias estrictamente dominadas es un criterio m´as general que el de estrategias dominantes que revisamos en primer lugar, y por lo tanto es ´util en m´as situaciones. Sin embargo, seguir´an existiendo juegos donde no existir´an estrategias estrictamente dominadas, por lo cual requeriremos de otros instrumentos para analizarlos y poder proponer posibles resultados. La siguiente secci´on se dedica a elaborar el concepto m´as ampliamente utilizado en teor´ıa de juegos para este prop´osito, conocido como equilibrio de Nash. 1.4. Equilibrio de Nash Probablemente el concepto m´as importante en teor´ıa de juegos es el denominado Equilibrio de Nash, llamado as´ı por el matem´atico estadounidense John F. Nash, quien gan´o el premio Nobel de econom´ıa en el a˜no 1994 por su contribuci´on fundamental a esta ´area. La potencia de este concepto radica en que se basa en una idea sencilla, pero muy general, y por lo tanto es ´util al momento de analizar diversas situaciones estrat´egicas sin que se requiera la existencia de conceptos m´as exigentes, como el de estrategia dominada. La intuici´on detr´as del equilibrio de Nash (EN), es que si se propone que un juego tendr´a cierto perfil de estrategias como resultado, lo m´ınimo que se puede pedir es que este perfil sea estrat´egicamente estable, en el sentido de que ning´un jugador tenga incentivos unilaterales a cambiar su estrategia. Dicho de otro modo, si existe alguna raz´on para pensar que los jugadores seguir´an ciertas estrategias7 , entonces cada uno de ellos puede hacer esta conjetura. Si bajo esa conjetura alg´un jugador tiene incentivos a cambiar de estrategia, entonces ser´ıa ingenuo proponer la conjetura como un resultado del juego, ya que aquel jugador con incentivos a desviarse de la estrategia conjeturada probablemente tomar´a la alternativa que le resulta m´as conveniente. Formalmente, Definici´on 5. En un juego de n jugadores, el perfil de estrategias s∗ = (s∗ 1, ..., s∗ n) es un equilibrio de Nash si, para cada jugador i, s∗ i es una mejor respuesta a las estrategias de los otros (n − 1) jugadores. Esto es, la desigualdad: ui(s∗ 1, ..., s∗ i , ...s∗ n) ≥ ui(s∗ 1, ..., si, ..., s∗ n) se cumple para cada posible estrategia si en Si. Es decir, la estrategia de equilibrio de cada jugador es la mejor respuesta a las estrategias de equilibrio de los dem´as jugadores. Para entender c´omo a partir de esta idea podemos proponer alg´un resultado para un juego, resolveremos algunos ejemplos. En el caso del dilema del prisionero, la mejor respuesta de cada jugador a cualquier estrategia que pueda seguir su contraparte es “confesar” (una estrategia dominante siempre ser´a una mejor respuesta). En particular, el perfil (confesar, confesar) es un EN, ya que ambos est´an jugando su mejor respuesta a la estrategia del otro. Tambi´en se puede ver que no existen incentivos unilaterales a desviarse, ya que la alternativa “callar” disminuye el pago desde (−6) a (−9) dado que el otro est´a jugando “confesar”. 6Tambi´en podemos decir que la estrategia “medio” est´a estrictamente dominada por “abajo” y eliminarla tal como lo hicimos en las iteraciones anteriores. 7Por ejemplo, imaginemos que cada jugador anuncia la estrategia que planea seguir a todos los dem´as. Microeconom´ıa II
  • 11. Facultad de Econom´ıa y Negocios - Universidad de Chile 10 Una forma conveniente de computar el equilibrio de Nash cuando escribimos el juego en forma matri- cial es ir analizando cu´al es la mejor respuesta a cada posible estrategia del otro jugador, y subrayando el mayor pago para indicar que la estrategia asociada a esa celda es la ´optima. Esto est´a ejemplificado para el caso del dilema del prisionero en la figura 1.7, donde el hecho de que en la celda asociada al perfil (confesar, confesar) ambos pagos est´en subrayados, nos indica que encontramos un EN. Prisionero 2 Callar Confesar Prisionero 1 Callar -1, -1 -9, 0 Confesar 0, -9 -6,-6 Figura 1.7: Mejores respuestas en dilema del prisionero El ejemplo del dilema del prisionero ilustra un resultado interesante: todo equilibrio bajo eliminaci´on iterativa de estrategias estrictamente dominadas es un equilibrio de Nash. Sin embargo, la implicancia va en una sola direcci´on, en tanto no todo EN ser´a un equilibrio seg´un eliminaci´on iterativa. El hecho de que -como veremos a continuaci´on- es posible que exista EN cuando no existen estrategias dominadas es evidencia de este ´ultimo punto. Un caso m´as interesante que el dilema del prisionero ser´a un juego donde la eliminaci´on iterativa no nos entregue ninguna predicci´on del resultado del juego (porque no existen estrategias estrictamente dominadas), y sin embargo s´ı exista un EN. Consideremos entonces el ejemplo dado por la matriz de la figura 1.8. Jugador Columna I C D Jugador Fila A 0,4 4,0 5,3 M 4,0 0,4 5,3 B 3,5 3,5 6,6 Figura 1.8: Buscando EN cuando no existen estrategias dominadas El lector ya debiese ser capaz de verificar que este juego no tiene estrategias estrictamente domina- das. Para buscar un EN, hacemos el an´alisis de mejor respuesta: si el jugador columna fuera a jugar I, por ejemplo, la mejor respuesta del jugador fila ser´ıa M, puesto que 4 es mayor que 3 y que 0; por ello, la ganancia de 4 que recibe el jugador fila en la celda (M, I) de la matriz est´a subrayada. De forma an´alo- ga encontramos la mejor respuesta ante las estrategias C y D, que son A y B, respectivamente. Luego buscamos las mejores respuestas del jugador columna (lo que es directo, ya que el juego es sim´etrico), y obtenemos as´ı que el perfil (B,D) es un EN para este juego. Funci´on de respuesta ´optima Para computar el EN en los ejemplos anteriores, hemos analizado la mejor respuesta de un jugador a cada posible estrategia del otro. Esto nos permite encontrar de forma directa el par de estrategias bajo las cuales nadie tiene incentivos unilaterales a desviarse. En el caso de juegos con estrategias continuas podemos encontrar un EN bajo el mismo principio, aunque con una t´ecnica diferente. Consideremos el ejemplo de competencia a la Cournot planteado en la secci´on (1.2). En ese caso, como los jugadores tienen infinitas estrategias a su disposici´on, no es posible ir verificando la respuesta ´optima para cada caso como lo hacemos en los juegos matriciales. No obstante, podemos preguntarnos Microeconom´ıa II
  • 12. Facultad de Econom´ıa y Negocios - Universidad de Chile 11 cu´al es la respuesta ´optima de una de las firmas ante una cantidad fija arbitraria de su competidora. Por ejemplo, fijemos la producci´on de la firma 2 en un nivel ¯q2. Siendo ese el caso, la respuesta ´optima de la firma 1 corresponde a la soluci´on del problema: m´ax {q1} (A − q1 − ¯q2)q1 − cq1 La condici´on de primer orden del problema es A − 2q1 − ¯q2 − c = 0, a partir de la cual obtenemos la soluci´on q∗ 1 = A−¯q2−c 2 . Pero ¯q2 es una cantidad arbitraria, por lo tanto lo que hemos encontrado es en realidad la funci´on que nos indica cu´al es la cantidad ´optima para la firma 1 ante cualquier nivel de producci´on de la firma 2: q1(q2) = A − q2 − c 2 Esta ´ultima se conoce como funci´on de respuesta ´optima o funci´on de reacci´on, en este caso, de la firma 1.8 Como el problema es sim´etrico, la funci´on de reacci´on de la firma 2 es completamente an´aloga: q2(q1) = A − q1 − c 2 La utilidad de obtener este resultado radica en el hecho de que nos permite calcular de forma sencilla el equilibrio de Nash de este juego. En efecto, si existe un par (q1, q2) tal que ning´un jugador tenga incentivos a desviarse, ese par constituir´a un EN. Pero esto ocurre en el punto donde las funciones de reacci´on coinciden (gr´aficamente se intersectan), por lo que encontrar el EN del juego se reduce a resolver el sistema de ecuaciones dado por las dos funciones de respuesta ´optima. Al resolver el sistema se obtiene el resultado: qN 1 = qN 2 = A − c 3 donde utilizamos el supra´ındice N para indicar que corresponde a la cantidad de EN. Cabe destacar que el procedimiento reci´en desarrollado no es diferente del aplicado en el caso de los juegos matriciales, donde lo que hacemos es computar la funci´on de reacci´on para el caso en el cual los espacios de estrategia son discretos y luego buscar un perfil donde ´estas coincidan. La ´unica diferencia es que como en este caso las estrategias son continuas, podemos utilizar las herramientas de c´alculo diferencial para obtener el resultado. Sobre la unicidad del EN Volvamos ahora al ejemplo de la Batalla de los Sexos, el cual resolveremos para aprender otro elemento relevante del EN. A continuaci´on se muestra la matriz de pagos con los pagos asociados a las mejores respuestas ya subrayados: Manuel F´utbol Museo Josefa F´utbol 2,1 0,0 Museo 0,0 1,2 Figura 1.9: Batalla de los sexos y mejores respuestas 8Notar que ´esta es la respuesta ´optima para niveles de q2 menores a A − c. Si q2 > A − c, la respuesta ´optima es producir cero porque ela firma 2 ha saturado el mercado y el precio asociado es muy bajo. Microeconom´ıa II
  • 13. Facultad de Econom´ıa y Negocios - Universidad de Chile 12 En este caso, tal como en el juego de la figura 1.8, la mejor respuesta var´ıa junto con la estrategia del otro jugador. Pero lo interesante ahora es que, como se desprende a partir de la matriz, existen dos perfiles en los cuales la mejor estrategia coincide. ¿Significa esto que no existe equilibrio de Nash?. Al contrario, lo que ocurre en este caso es que existen 2 equilibrios de Nash, pues cada perfil de estrategias cumple con la definici´on de que la estrategia de cada jugador es mejor respuesta a las estrategias seguidas por los dem´as. Adem´as, es f´acil ver que -por ejemplo- dado el perfil (f´utbol, f´utbol), ning´un jugador tienen incentivos unilaterales a desviarse. Este ejemplo nos muestra que el EN no tiene por qu´e ser ´unico, y que pueden existir 2 o incluso m´as perfiles que cumplan con la definici´on de equilibrio. Lo que s´ı ocurre en este caso, es que se pierde la posibilidad de hacer una predicci´on un´ıvoca respecto del resultado que se observar´a en esta situaci´on estrat´egica. En las secciones posteriores veremos cu´ales son las alternativas que tenemos en estos casos, respecto de si podemos inclinarnos por un equilibrio por sobre el otro, o si existe otro tipo de predicci´on que pueda ayudarnos a precisar el posible resultado del juego. Sobre la existencia del EN Una ´ultima arista del concepto de EN que es relevante discutir en este momento, dice relaci´on con su existencia. Consideremos el juego de Matching Pennies que fue explicado en la introducci´on, y cuya matriz de pagos reescribimos aqu´ı incluyendo las mejores respuestas: Jugador 2 Cara Sello Jugador 1 Cara 1, −1 −1, 1 Sello −1, 1 1, −1 Figura 1.10: Matching Pennies Al analizar las mejores respuestas en este juego, se observa que no existe ning´un perfil de estrategias en el cual se cumpla la definici´on de EN. Esto resulta intuitivo si consideramos el hecho de que no existe ninguna combinaci´on de estrategias bajo la cual no existan incentivos a desviarse: si ambos mostraron la misma cara, entonces el jugador 2 preferir´ıa cambiar de estrategia; mientras que si mostraron distintas cara, el primer jugador tendr´a incentivos a desviarse. Este ejemplo ilustra que el concepto de EN no ser´a una herramienta infalible al momento de analizar los posibles resultados de un juego, por el simple hecho de que no siempre existir´a un EN, al menos como lo conocemos hasta ahora. Al igual que con el problema de la multiplicidad de equilibrios, en las secciones subsecuentes analizaremos algunos conceptos a los cuales podremos echar mano cuando no exista equilibrio de Nash. 1.5. Estrategias mixtas Para motivar la idea de estrategia mixta, recordemos el ejemplo del tiro penal en un juego de f´utbol que planteamos en la introducci´on. Lo modelamos concretamente como se muestra en la matriz de pagos de la figura 1.11, donde las estrategias D e I corresponden a derecha e izquierda respectivamente.9 Adem´as, aunque suponemos que cuando el arquero ataja el gol los pagos son (0, 0), es importante notar que en t´erminos estrat´egicos este juego no es diferente de matching pennies (el orden de preferencias sobre los posibles resultados del juego es el mismo, aunque los n´umero en particular sean diferentes). 9Para los que no son seguidores del f´utbol, se aclara que Alexis ser´ıa el pateador e Iker el arquero. Microeconom´ıa II
  • 14. Facultad de Econom´ıa y Negocios - Universidad de Chile 13 Iker D I Alexis D 0,0 1,-1 I 1,-1 0,0 Figura 1.11: Penal de f´utbol En una situaci´on de este tipo existe un elemento fundamental para ambos jugadores, el cual es la posibilidad de sorprender al otro. En efecto, si es que por alg´un motivo Alexis supiera con certeza en qu´e direcci´on saltar´a Iker, entonces podr´ıa lograr su mejor resultado pateando el bal´on en la otra direcci´on. Del mismo modo, si Iker supiera de antemano la direcci´on del tiro, podr´ıa saltar correctamente y atajarlo. As´ı, dada la incertidumbre que tiene cada uno respecto de la estrategia del otro, a un delantero o arquero en la realidad le convendr´a jugar algunas veces I y algunas otras D. Si Iker saltase siempre en la misma direcci´on ser´ıa una estrategia perdedora, puesto que el otro sabr´ıa en qu´e direcci´on tirar para convertir con seguridad. Otro ejemplo de una situaci´on que es interesante de modelar bajo la perspectiva de juegos, es la relaci´on entre una entidad fiscalizadora y un agente que debe cumplir cierta obligaci´on por ley. Por ejemplo, podemos pensar en el Servicio de Impuestos Internos (SII) y un contribuyente que se est´a cues- tionando si disminuye o no su carga tributaria de alguna forma ileg´ıtima (evasi´on). Para el SII resulta costoso hacer una auditor´ıa para fiscalizar si se est´a evadiendo el pago de impuestos, por lo que no es obvio que siempre deba auditar. Por su parte, el contribuyente obtiene un beneficio evadiendo el pago de impuestos, pero se enfrenta a un castigo si es que es descubierto. As´ı, la incertidumbre constituye parte fundamental de la interacci´on estrat´egica, pues el contribuyente estar´a considerando cu´al es la probabilidad de ser auditado al momento de decidir si evade, mientras que el SII eval´ua la probabilidad de efectivamente descubrir un evasor al momento de realizar una auditor´ıa que le resulta costosa. Po- demos pensar ejemplos similares con firmas que deben cumplir est´andares medioambientales, y el ente regulador que las fiscaliza. Esta idea de darle relevancia a la incertidumbre y pensar que para un jugador lo ´optimo no es comprometerse con una estrategia en particular (saltar siempre a la izquierda), sino que variar su estrategia si el juego hipot´eticamente se repitiese (algunas veces saltar a la izquierda y otras a la derecha), tiene una expresi´on concreta en teor´ıa de juegos conocida como estrategias mixtas. Cuando analicemos un juego desde esta perspectiva, pensaremos que los jugadores ya no eligen una estrategia particular de su conjunto de posibilidades, sino que eligen una probabilidad con la cual jugar´an cada estrategia. Por ejemplo, en el juego del penal, una estrategia mixta particular ser´ıa jugar con probabilidad 1/3 la estrategia I, y con probabilidad 2/3, la D. As´ı, para un jugador que dispone de dos estrategias, una estrategia mixta consiste en elegir un n´umero p en el intervalo [0, 1], de modo que p y (1 − p) son las probabilidades con las que jugar´a una estrategia o la otra. En general, si un jugador i dispone de un conjunto Si con L estrategias, Si = {si1 , si2 , ..., siL }, una estrategia pura consiste en elegir un elemento particular de este conjunto (este es el concepto que hemos utilizado en las secciones anteriores y que de ahora en adelante llamaremos estrategia pura). En cambio, una estrategia mixta consiste en elegir un vector p = (p1, p2, ..., pL), donde pl denota la probabilidad con la que jugar´a la estrategia sil ∈ Si. Como lo que est´a eligiendo es una distribuci´on de probabilidades sobre los elementos del conjuntos Si, este vector tiene que cumplir con las propiedades que por definici´on posee una distribuci´on. Estas son: 1. L l=1 pl = 1 2. 0 ≤ pl ≤ 1, para cada l ∈ {1, 2, ..., L} Microeconom´ıa II
  • 15. Facultad de Econom´ıa y Negocios - Universidad de Chile 14 Es fundamental notar que al hacer esto, cambiamos la decisi´on que debe tomar el individuo. Si antes deb´ıa elegir un elemento de su conjunto de posibilidad Si, ahora debe elegir un vector entre todos aquellos que cumplen las propiedades reci´en enunciadas. Para que este cambio en las posibilidades de cada agente nos sea ´util, resulta necesario definir una funci´on de utilidad acorde a las nuevas estrategias. La idea natural en este caso es que dado un perfil de estrategias mixtas, el pago de cada jugador corresponde a la utilidad esperada que se deriva de las probabilidades elegidas por cada uno. Para aclarar esta idea, construiremos las funciones de utilidad esperada para el juego del penal. Sea p la probabilidad con la que Alexis juega D, y sea q la probabilidad con la que Iker juega D. As´ı, tenemos que -por ejemplo- el perfil (D, I) ocurre con probabilidad p · (1 − q), el cual entrega pagos 1 y -1 a Alexis e Iker, respectivamente. Esta informaci´on, para cada perfil de estrategias puras, se resume en la siguiente tabla: Perfil Probabilidad Pago Alexis Pago Iker (D, D) p · q 0 0 (D, I) p · (1 − q) 1 -1 (I, D) (1 − p) · q 1 -1 (I, I) (1 − p) · (1 − q) 0 0 Con la informaci´on anterior, se tiene que el pago esperado de Alexis, dado un perfil (p, q) es de uA(p, q) = p · q · 0 + p · (1 − q) · 1 + (1 − p) · q · 1 + (1 − p)(1 − q) · 0 = p(1 − 2q) + q, mientras que para Iker, de forma an´aloga se obtiene uI(p, q) = p · q · 0 + p · (1 − q) · (−1) + (1 − p) · q · (−1) + (1 − p)(1 − q) · 0 = q(2p − 1) − p As´ı, tenemos un nuevo juego asociado al juego original, pero en el cual los espacios de estrategias son distintos10 y se tiene una funci´on de utilidad adecuada a aquellos espacios. La pregunta natural en este punto ser´ıa, ¿cu´al es el equilbirio de Nash de este nuevo juego, si es que existe? Para responderla, no necesitamos saber nada nuevo sobre el EN, pues simplemente aplicamos la definici´on ya estudiada al juego “modificado”. Tal como hicimos en la secci´on anterior, utilizaremos la funci´on de respuesta ´optima para computar el EN. Recordemos que Alexis elige p en el intervalo [0, 1] y que su funci´on de utilidad viene dada por uA(p, q) = p(1 − 2q) + q. En primer lugar, se tiene que dada una estrategia q cualquiera de Iker, el segundo t´ermino de la suma est´a fijo para el jugador 1. As´ı, basta notar que cuando (1 − 2q) > 0, lo mejor que puede hacer Alexis es elegir p = 1, mientras que si (1 − 2q) < 0 la respuesta ´optima ser´ıa elegir p = 0. En cambio, si es que (1 − 2q) = 0 cualquier valor de p ser´a ´optimo, en tanto su utilidad no depender´a de su estrategia sino que estar´a fija. Reescribiendo las condiciones para cada caso como q 1 2 , podemos resumir este an´alisis en la siguiente funci´on de reacci´on11 : p(q) =    1 si q < 1 2 0 si q > 1 2 [0, 1] si q = 1 2 10En estrategias mixtas cada jugador tiene disponible infinitas estrategias aun cuando solo existan 2 estrategias puras, ya que el conjunto factible [0, 1] es un continuo de n´umeros reales. 11T´ecnicamente, la mejor respuesta no es una funci´on, pues las funciones por definici´on asocian puntos de un conjunto con puntos de otro. En cambio, lo que observamos en este caso es que al evaluar p(q) en q = 1 2 no obtenemos un punto en particular, sino que un conjunto de ellos (el de todos los valores que son una respuesta ´optima). En matem´aticas estas “funciones”, que al evaluarlas entregan conjuntos en vez de puntos, se conocen como correspondencias. Aunque esto es relevante en el estudio formal de teor´ıa de juegos, no es parte de los temas del curso. Microeconom´ıa II
  • 16. Facultad de Econom´ıa y Negocios - Universidad de Chile 15 Este resultado es bastante intuitivo, pues nos dice que si Iker fuera a jugar D con mayor probabilidad que I (q > 1 2 ), entonces lo mejor que puede hacer Alexis es patear a la izquierda (p = 0), puesto que el perfil (I, D) lo hace ganar. Del mismo modo, cuando I es m´as probable (q < 1 2 ), lo mejor que puede hacer es patear a la derecha, esto es, (p = 1). Finalmente, cuando Iker pone igual probabilidad en ambas estrategias, entonces cualquier estrategia es igualmente buena para Alexis, puesto que no hay informaci´on que pueda explotar para cargar la balanza a su favor. Similarmente, la funci´on de reacci´on de Iker viene dada por: q(p) =    0 si p < 1 2 1 si p > 1 2 [0, 1] si p = 1 2 Con lo anterior, resulta directo observar que el par de estrategias (p, q) = (1 2 , 1 2 ) es un EN, en tanto ning´un jugador tiene incentivos unilaterales a cambiar de estrategias. As´ı, hemos encontrado un EN en estrategias mixtas para un juego que no ten´ıa equilibrio en estrategias puras. Esto no es casualidad, pues uno de los resultados m´as importantes en teor´ıa de juegos es el teorema de existencia de Nash, cuya versi´on simplificada se entrega a continuaci´on: Teorema 1. En un juego G = I, {Si}n i=1, {ui}n i=1 , donde la cantidad de jugadores y los espacios de estrategias son finitos, siempre existir´a un equilibrio de Nash en estrategias mixtas. Es importante notar que una estrategia pura es un caso particular de estrategia mixta. Por ejemplo, en el caso del juego del penal el perfil (p, q) = (1, 1) corresponde al perfil de estrategias puras (D, D). As´ı, si en un juego encontramos un equilibrio en estrategias puras, es factible que este sea el ´unico EN del juego, ya que el teorema no debe ser interpretado como que siempre existir´a un equilibrio donde las probabilidades sean diferentes de 0 y 1. Computando equilibrio en estrategias mixtas en juegos de 2 × 2 A continuaci´on se presenta un m´etodo relativamente heur´ıstico para encontrar los EN de un juego de 2 × 2. Para ello, comenzaremos por graficar las funciones de reacci´on obtenidas para el juego del penal. En la figura 1.12 dibujamos en rojo la funci´on de reacci´on de Alexis, p(q), y en azul la Iker, q(p), seg´un las condiciones descritas m´as arriba. Se puede observar que en este caso el ´unico perfil de estrategias donde estas se intersectan es en el EN ya planteado, p = q = 1 2 . q p 1 1 q(p) p(q) 1 2 1 2 Figura 1.12: Juego del penal: Funciones de reacci´on La propuesta para encontrar todos los EN se basa en la idea de que en estos juegos existen dos “tipos” de equilibrio: (i) aquellos en estrategias puras, y (ii) aquellos en los cuales cada jugador, dado Microeconom´ıa II
  • 17. Facultad de Econom´ıa y Negocios - Universidad de Chile 16 lo que hace su contraparte, est´a indiferente respecto de su propia estrategia ya que no puede afectar su utilidad. Estos ´ultimos son los que permiten una estrategia mixta que no sea un caso particular de estrategia pura, esto es, una estrategia donde el par´ametro de probabilidad se encuentre en el intervalo abierto (0, 1). Para entender mejor la idea, consideremos el ejemplo de la batalla de los sexos, que como ya vimos tiene dos EN en estrategias puras. Si denotamos por p y q la probabilidad con la que Josefa y Manuel, respectivamente, juegan la estrategia “f´utbol”, podemos plantear las funciones de utilidad esperada para obtener: uJ (p, q) = 2pq + (1 − p)(1 − q) = p(3q − 1) − q uM (p, q) = pq + 2(1 − p)(1 − q) = q(3p − 2) − 2p, donde uJ y uM son las funciones de utilidad de Josefa y Manuel, respectivamente. Al hacer el an´alisis de mejor respuesta para Josefa, tenemos que existe un punto cr´ıtico para la estrategia de su adversario, q = 1 3 , en el cual ella se encontrar´a indiferente respecto de su estrategia p. Cuando q > 1 3 le convendr´a jugar p = 1 y, en caso contrario, le convendr´a p = 0. As´ı, la funci´on de reacci´on queda de la forma: p(q) =    1 si q > 1 3 0 si q < 1 3 [0, 1] si q = 1 3 , y haciendo el mismo an´alisis para Manuel, obtenemos: q(p) =    1 si p > 2 3 0 si p < 2 3 [0, 1] si p = 1 2 Al dibujar estas funciones de reacci´on en el plano (p, q) obtenemos el gr´afico de la figura 1.13, donde la l´ınea roja corresponde a la funci´on p(q), y la azul a q(p). En este caso observamos que las funciones se intersectan en los perfiles asociados a estrategias puras (p, q) = (1, 1) y (p, q) = (0, 0), adem´as del EN en estrategias mixtas dado por (2 3 , 1 3 ). q p 1 1 p(q) q(p)2 3 1 3 Figura 1.13: Batalla de los sexos: Funciones de reacci´on Aplicando este mismo concepto a otros juegos -como el dilema del prisionero- podremos observar que en general nos enfrentaremos a alguno de los casos de funciones de reacci´on mostrados en los distintos Microeconom´ıa II
  • 18. Facultad de Econom´ıa y Negocios - Universidad de Chile 17 paneles de la figura 1.14. Los paneles (a) y (b) corresponden al caso donde existe un ´unico equilibrio en estrategias puras, como el dilema del prisionero. Los paneles (c) y (d) muestran el caso en el cual existen 2 equilibrios en estrategias puras, con lo cual observamos que siempre existir´a un tercer equilibrio en estrategias mixtas. Finalmente, los paneles (e) y (f) corresponden al caso en el cual no existen equilibrio en estrategias puras, pero s´ı existe uno en estrategias mixtas, tal como asegura el teorema de existencia de Nash. q p 1 1 (a) q p 1 1 (b) q p 1 1 V C1 V C2 (c) q p 1 1 V C1 V C2 (d) q p 1 1 V C1 V C2 (e) q p 1 1 V C1 V C2 (f) Figura 1.14: Casos generales de funci´on de reacci´on en juegos de 2 × 2 El valor V C1 corresponde a la estrategia p, bajo la cual el otro jugador se encuentra indiferente entre cualquier estrategia disponible, esto es, q(V C1) = [0, 1]. Del mismo modo, V C2 corresponde al valor de q que hace indiferente al jugador que elige p, esto es, p(V C2) = [0, 1]. As´ı, una vez que encontramos los equilibrios en estrategias puras (si es que estos existen), encontrar los equilibrios en mixtas se reduce -para el caso de juegos de 2 × 2- a encontrar las probabilidades de cada jugador que deja indiferente al otro. Notar que este valor no existe en juegos como los de los paneles (a) y (b), ya que en esos caso la existencia de una estrategia pura dominante, hace imposible que el individuo se encuentre indiferente. Linealidad del problema individual bajo estrategias mixtas Para entender qu´e es lo que subyace al m´etodo reci´en expuesto, consideremos un juego de 2 × 2 gen´erico, donde p y q corresponden a las estrategias mixtas de los jugadores 1 y 2 respectivamente. Si A y B son las estrategias puras del jugador 1 (donde p corresponde a la probabilidad de jugar la estrategia A), entonces podemos escribir su utilidad esperada de la siguiente manera: u1(p, q) = pu1(A, q) + (1 − p)u1(B, q) = p [u1(A, q) − u1(B, q)] + u1(B, q) Donde u1(A, q) denota la utilidad esperada del jugador 1 cuando juega la estrategia pura A y su contraparte juega una estrategia mixta cualquiera, q. Lo mismo para u1(B, q), pero con la estrategia pura B. As´ı, dado que u1(B, q) es un valor fijo cuando q est´a fijo, se tiene que para cualquiera valor q Microeconom´ıa II
  • 19. Facultad de Econom´ıa y Negocios - Universidad de Chile 18 tal que u1(A, q) = u1(B, q), entonces el valor de p que maximiza u1(p, q) necesariamente tiene que ser 0 ´o 1, dependiendo del signo de la desigualdad u1(A, q) u1(B, q). La ´unica forma en la que el valor ´optimo de p puede ser estrictamente mayor que 0 y estrictamente menor que 1, es cuando u1(A, q) = u1(B, q), pues en ese caso el jugador estar´a indiferente entre cualquier valor de p perteneciente al intervalo [0, 1]. Esta idea corresponde a la generalizaci´on de lo observado en los ejemplos resueltos anteriormente, en los cuales los equilibrios en estrategias mixtas que no correspond´ıan al caso particular de estrategias puras, eran aquellos pares (p, q) en los cuales ambos individuos estaban indiferentes respecto de su propia elecci´on. Si definimos p1 = p y p2 = (1 − p), podemos graficar este argumento en el plano (p1, p2), tal como se muestra en los gr´aficos de la figura 1.15. La l´ınea oscura que une a los puntos (1, 0) y (0, 1) corresponde al conjunto de posibilidades del jugador, ya que ah´ı yacen todos los pares (p1, p2) que cumplen las condiciones (p1 + p2 = 1) y (0 ≤ p1 ≤ 1). Las l´ıneas azules corresponden a las curvas de nivel (curvas de indiferencia) de la funci´on de utilidad esperada, dado un valor q fijo. En particular, las l´ınea azules s´olidas son las asociadas al m´aximo nivel de utilidad esperada que puede alcanzar el jugador, mientras que las punteadas muestran c´omo otras estrategias distintas a las ´optimas entregan una menor utilidad esperada. p1 p2 1 1 (a) u1(A, q) > u1(B, q) p1 p2 1 1 (b) u1(A, q) < u1(B, q) p1 p2 1 1 (c) u1(A, q) = u1(B, q) Figura 1.15: Optimizaci´on bajo estrategias mixtas en un juego de 2 × 2 As´ı, se observa que dependiendo de la relaci´on u1(A, q) u1(B, q), se tendr´a que el valor ´optimo de p ser´a una soluci´on esquina -como en los paneles (a) y (b)-, excepto cuando la pendiente de la curva de indiferencia es igual a (-1) -como en el panel (c)-, en cuyo caso el individuo est´a indiferente entre cualquier par (p1, p2). Observaci´on. Un punto que se deriva de la discusi´on anterior, y que conviene tener presente al momento de computar equilibrio en este tipo de juegos porque puede resultar un poco contra-intuitivo, es que de la condici´on de indiferencia de un individuo se obtiene la estrategia de equilibrio del otro. Por ejemplo, cuando planteamos la condici´on u1(A, q) = u1(B, q), lo que podremos despejar ser´a un valor ¯q. Del mismo modo, la condici´on de indiferencia del jugador 2 nos permitir´a despejar un valor ¯p. As´ı, la estrategia de cada jugador no ser´a relevante para s´ı mismo, porque de hecho cada individuo estar´a indiferente entre cualquiera de sus estrategias factibles. Sin embargo, la indiferencia nos permi- te proponer que, bajo ese par de estrategias en particular, no existir´an incentivos unilaterales a desviarse. Dominancia en estrategias mixtas Una ´ultima dimensi´on de las estrategias mixtas que mencionaremos, dice relaci´on con el concepto de dominancia estudiado anteriormente. Consideremos el juego abstracto planteado en la matriz de la figura 1.16. Omitimos los pagos del jugador 2, porque no ser´an relevantes para el ejemplo. En este caso, para el jugador 1 no existe ninguna estrategia dominada, al menos en el sentido que Microeconom´ıa II
  • 20. Facultad de Econom´ıa y Negocios - Universidad de Chile 19 Jugador 2 D I Jugador 1 A 3, 0, M 0, 3, B 1, 1, Figura 1.16: Dominancia en estrategias mixtas estudiamos anteriormente. Sin embargo, si consideramos estrategias mixtas en nuestro an´alisis, parece razonable pensar que una combinaci´on de las estrategias A y M puede resultar mejor que la estrategia B. En efecto, si tomamos la estrategia mixta p = (1/2, 1/2, 0) se tiene que la utilidad esperada del jugador 1 ser´a igual a 1.5, sin importar la estrategia que siga el jugador 2. As´ı, esta estrategia mixta domina a la estrategia pura D. Recordemos que las estrategias puras son un caso particular de estrategia mixta, que en este caso ser´ıa ˜p = (0, 0, 1). As´ı, aunque en estrategias puras no exista dominancia, s´ı puede existir dominancia en estrategias mixtas. 1.6. Juegos secuenciales Todos los juegos que hemos estudiado en las secciones anteriores corresponden, de acuerdo a la tipolog´ıa mencionada en la introducci´on, a juegos est´aticos de informaci´on completa. Pero muchas si- tuaciones de inter´es econ´omico que involucran interacci´on estrat´egica tienen una dimensi´on din´amica relevante, que no es capturada por el marco te´orico que manejamos hasta el momento. Pensemos, por ejemplo, en una industria como el retail donde compiten pocas empresas de gran tama˜no. Es natural pensar que si una de las firmas observa las decisiones de sus competidoras antes de tomar su propia decisi´on, entonces su comportamiento ser´a diferente de aquel que seguir´ıa si las decisiones se tomaran de forma simult´anea. Al mismo tiempo, si una de las firmas sabe que las dem´as observar´an su decisi´on antes de actuar, entonces tendr´a en cuenta c´omo este elemento afecta lo que har´an sus competidoras y tendr´a un efecto sobre su propia decisi´on. Por lo anterior, nuestro siguiente objetivo ser´a el estudio de juegos din´amicos de informaci´on com- pleta. Es decir, incorporaremos la dimensi´on temporal en el an´alisis de diferente situaciones estrat´egicas, pero siempre manteni´endonos bajo el supuesto de que las funciones de pago son conocidas por todos (esto es lo que llamamos informaci´on completa en la introducci´on). Esto implica que cada jugador tiene perfecto conocimiento de los intereses que tienen los dem´as sobre los distintos resultados del juego, y por lo tanto, que las decisiones observadas no entregan informaci´on adicional a este respecto.12 Como mencionamos anteriormente, la forma extensiva de un juego resultar´a m´as conveniente e intui- tiva cuando nos interesemos en juegos din´amicos. Pero antes de introducir este concepto formalmente, analizaremos algunos ejemplos donde se observa cu´ales son los principales conceptos que se tienen en mente al estudiar este tipo de situaciones. Pensemos que dos pa´ıses, A y B, se enfrentan en un conflicto armado, en el cual A est´a decidiendo si invade o no a B. Si el primero decide invadir, entonces el se- gundo debe decidir entre batallar para defenderse o rendirse. Esta din´amica se resume en el ´arbol de la figura 1.17, donde los c´ırculos negros corresponden a nodos de decisi´on y las ramas que nacen de cada uno de ellos indican el conjunto de decisiones disponibles en ese nodo. Por su parte, los c´ırculos grises corresponden a nodos terminales, cada uno de los cuales es un resultado particular del juego, al que se llegar´a o no dependiendo de las decisiones de los jugadores. 12La revelaci´on de informaci´on privada a trav´es de las decisiones -y la interacci´on estrat´egica que esto implica- es una caracter´ıstica fundamental de los juegos de informaci´on incompleta, como veremos en los modelos estudiados en el cap´ıtulo de econom´ıa de la informaci´on. Microeconom´ıa II
  • 21. Facultad de Econom´ıa y Negocios - Universidad de Chile 20 A B (7,2) (9,6) (8,8) Invadir No invadir Pelear Rendirse Figura 1.17: ´Arbol de un juego din´amico Es importante notar que cada nodo de decisi´on tiene una etiqueta que indica qui´en decide en ese nodo (o a qui´en le corresponde jugar), mientras que cada rama tiene una etiqueta que indica la acci´on a la cual est´a asociada. Por su parte, cada nodo terminal tiene una etiqueta con los pagos asociados a ese resultado particular del juego. En nuestro ejemplo, los pagos indican que el pa´ıs A prefiere la situaci´on en la que invade y su enemigo se rinde, luego aquella en la que no invade, y finalmente aquella en la que invade y su enemigo se defiende. Por su parte, el pa´ıs B prefiere no ser invadido, pero en caso de ser invadido prefiere rendirse antes que pelear. ¿Qu´e resultado podemos esperar en este juego? Para tener una primera aproximaci´on, escribiremos el juego en su forma normal, lo que para este caso es sencillo ya que cada jugador solo enfrenta un nodo de decisi´on, con dos posibles acciones cada uno (por lo tanto, queda como una matriz de 2 × 2). Esto nos permitir´a encontrar los EN del juego tal como lo hemos venido haciendo hasta ahora. Pa´ıs B Pelear Rendirse Pa´ıs A Invadir 7,2 9,6 No invadir 8,8 8,8 Figura 1.18: Juego de invasi´on en forma normal Observemos que existen dos EN en este juego, dados por los perfiles (No invadir, Pelear) e (Invadir, Rendirse). El primero es un EN porque si el pa´ıs B est´a dispuesto a pelear, entonces el A prefiere no invadir y nadie tiene incentivos a desviarse. El segundo es EN porque cuando el pa´ıs A invade el B prefiere rendirse, y dado esto, ocurre que ninguno querr´a desviarse. Al escribir el juego en forma normal estamos haciendo abstracci´on de la dimensi´on din´amica del problema, y conviene preguntarnos si esto tiene implicancias sobre la precisi´on del an´alisis que esto nos permite hacer. Analicemos, en particular, el equilibrio (No invadir, Pelear): es claro que el pa´ıs A no tiene incentivos a desviarse, porque el resultado en el que terminan batallando es el menos preferido para ´el. Sin embargo, ese argumento se basa en una estrategia poco cre´ıble de parte del pa´ıs B: Pelear. Si observamos el ´arbol, salta a la vista que antes una invasi´on, la mejor respuesta del pa´ıs B es Rendirse. Por lo tanto, parece natural mostrarse esc´eptico si alguien propone que (No invadir, Pelear) es un resultado predecible para este juego. Por su parte, el EN dado por el perfil (Invadir, Rendirse) no presenta este problema, puesto que como ya hemos dicho, cuando el pa´ıs A ataca lo racional para el pa´ıs B es rendirse, y nadie tiene incentivos a desviarse. Entonces surge la pregunta, ¿es este equilibrio de alguna manera “mejor” que el equilibrio (No invadir, Pelear)?. La respuesta es s´ı: aunque ambos son equilibrios de Nash del juego, el perfil (Invadir, Rendirse) es, adem´as, un Equilibrio Perfecto en Subjuegos (EPS). Aunque este nombre parece extra˜no dado que aun no hemos definido lo que es un subjuego, lo clave respecto del concepto es lo que observamos en el ejemplo: el equilibrio no est´a basado en amenazas no cre´ıbles. Microeconom´ıa II
  • 22. Facultad de Econom´ıa y Negocios - Universidad de Chile 21 Inducci´on hacia atr´as Dada la discusi´on de los p´arrafos anteriores, surge la pregunta de c´omo diferenciar un EN de un EPS. Afortunadamente existe un m´etodo muy sencillo para encontrar los EPS de los juegos en los que estaremos interesados, conocido como inducci´on hacia atr´as. Este consiste, como su nombre lo indica, en comenzar por los nodos de decisi´on finales y analizar qu´e har´ıan los jugadores en cada uno de ellos. Una vez que se tiene la respuesta ´optima, se avanza hacia los nodos predecesores, y en cada uno de ellos se analiza cu´al es la estrategia m´as conveniente dado que en los nodos sucesores cada jugador elegir´a su estrategia ´optima. Veamos c´omo funciona en el ejemplo anterior. El an´alisis comienza en el nodo donde decide el pa´ıs B, y consiste en definir la acci´on ´optima si le tocase jugar en ese nodo en particular: esta acci´on ser´a Rendirse, dado que el pago asociado a esta decisi´on (6) es mayor que el pago de Pelear (2). El siguiente paso es ir al nodo de decisi´on precedente (en el cual decide A), y determinar la acci´on ´optima dado que el pa´ıs B elegir´a Rendirse en caso de llegar al nodo en el cual debe decidir. Como el pago de 8 asociado a No Invadir es menor que el de 9 asociado a Invadir (el que a su vez est´a determinado por la acci´on ´optima Rendirse), entonces nos quedamos con la acci´on de Invadir. As´ı, el EPS de este juego viene dado por el perfil (Invadir, Rendirse), tal como hab´ıamos propuesto anteriormente. Para enriquecer el entendimiento de la inducci´on hacia atr´as, consideremos un ejemplo un poco m´as elaborado. Un sujeto entra a un banco, se acerca a un cajero y le dice que si no le entregan el dinero de la b´oveda har´a explotar una bomba que lleva consigo. La situaci´on que nos interesa modelar en este caso es din´amica, pues nos enfocamos en la decisi´on del cajero de entregar o no entregar el dinero, y dado esto, la decisi´on del asaltante de explotar o no la bomba. El ´arbol del juego se presenta en la figura 1.19. IIa(Asaltante) Bomba No Bomba Entregar No Entregar No BombaBomba I (Cajero) IIb (Asaltante) uc = −1 ua = −1 uc = 1 ua = 1 uc = −1 ua = −1 uc = 2 ua = 0 Figura 1.19: Asalto a un banco Los pagos representan la idea de que, sea cual sea la decisi´on del cajero, el resultado en el cual el asaltante explota la bomba es el menos preferido para ambos. Respecto a los resultados en los cuales no explota la bomba, el cajero prefiere aquel en el que no entrega el dinero, mientras que el asaltante -obviamente- prefiere aquel en el cual le entregan su bot´ın. Resolvamos el juego por inducci´on hacia atr´as. Si el asaltante se ubica en el nodo en el que le entregan el dinero, entonces su decisi´on ´optima es No Bomba. Ahora, si lo ubicamos en el nodo en el cual no le entregan el dinero, su decisi´on ´optima tambi´en ser´a No Bomba (aqu´ı est´a la clave para la existencia de una amenaza no cre´ıble). A continuaci´on analizamos la decisi´on del cajero, dadas las decisiones ´optimas del asaltante: si entrega el dinero recibir´a un pago de 1, mientras que si no lo entrega recibir´a un pago de 2. Por lo tanto, la decisi´on ´optima del cajero ser´a No Entregar. Por lo tanto, el resultado del juego seg´un el m´etodo de inducci´on hacia atr´as ser´a que el cajero no entrega el dinero y el asaltante no entrega la bomba. Microeconom´ıa II
  • 23. Facultad de Econom´ıa y Negocios - Universidad de Chile 22 Estrategias en un juego din´amico Es importante notar que en el p´arrafo anterior no hemos dicho que el EPS del juego sea (No Entregar, No Bomba), porque aquello ser´ıa -en rigor- incorrecto. La raz´on de ello es que (No Entregar, No Bomba) no es un perfil de estrategia por el simple hecho de que “No Bomba” no constituye una estrategia para el asaltante. Esto nos lleva a la siguiente discusi´on, sobre qu´e es lo que entenderemos por estrategia en un juego din´amico. En el juego reci´en expuesto, por ejemplo, es natural pensar que las estrategias que puede seguir el asaltante son “bomba” y “no bomba”, cuando en realidad ´estas son simplemente acciones que puede seguir en determinados nodos. En un juego en forma extensiva, una estrategia ser´a un plan de acci´on que indique qu´e acci´on seguir´a el jugador en cada nodo en los cuales le puede tocar jugar. As´ı, una estrategia posible para el asaltante ser´ıa no explotar la bomba si le entregan el dinero, y s´ı explotarla en caso que no se lo entreguen. Una forma c´omoda de describir esta estrategia es de la forma (No Bomba, Bomba), donde el primer elemento del par indica la acci´on que seguir´a si se encuentra en el nodo IIa, mientras que el segundo indica la acci´on ejecutada en el nodo IIb. Con lo anterior, tenemos que el conjunto completo de estrategias posibles para el asaltante ser´a {(B,B), (B,NB), (NB,B), (NB, NB)}. Por su parte, el cajero solo tiene que tomar una decisi´on en un nodo, por lo que las acciones de las que dispone coinciden con su espacio de estrategias {Entregar, No entregar}. Esta forma de entender las estrategias en un juego en forma extensiva facilita ver la equivalencia que existe con la forma normal de un juego. En efecto, si lo que tiene que decidir el asaltante es un plan de acci´on para cada posible situaci´on en la que le toque jugar, entonces podemos entender el juego desde una perspectiva est´atica, donde cada jugador debe tomar solo una decisi´on: cu´al ser´a su plan de acci´on. Para aclarar esta idea, en la matriz de la figura 1.20 se muestra el juego en su forma normal. Asaltante (B,B) (B,NB) (NB,B) (NB,NB) Cajero Entregar -1, -1 -1, -1 1, 1 1, 1 No Entregar -1, -1 2, 0 -1, -1 2, 0 Figura 1.20: Asalto a un banco en forma normal Esta matriz de pagos contiene exactamente la misma informaci´on que el ´arbol del juego. Considere- mos por ejemplo la segunda columna de pagos, en la cual la estrategia del asaltante (B,NB) nos indica que ´este explotar´a la bomba si le entregan el dinero y no la explotar´a en caso contrario.13 Si el cajero sigue la estrategia “entregar”, entonces la estrategia del asaltante (B,NB) indica que explotar´a la bomba, con lo que se obtiene los pagos de (-1, -1) indicados en la celda correspondiente. Si en cambio el cajero no entrega el dinero, el plan de acci´on indica no explotar la bomba, con lo cual los pagos son de 2 para el cajero y 0 para el asaltante, tal como se indica en la celda. De forma an´aloga se obtienen las dem´as columnas de la matriz. Al computar los EN del juego en la matriz de pagos, se observa que existen tres perfiles bajo los cuales no existen incentivos a desviarse: (No Entregar, (B,NB)), (Entregar, (NB,B)) y (No Entregar, (NB,NB)). De acuerdo al an´alisis bajo inducci´on hacia atr´as, concluimos que la estrategia ´optima para el asaltante es (NB,NB), porque para ´el siempre era peor explotar la bomba. As´ı, el ´unico EN que es a la vez EPS viene dado por el perfil (No Entregar, (NB,NB)). Notar que lo clave para que este perfil sea EPS es que la estrategia del asaltante es ´optima en cada uno en el que le podr´ıa tocar jugar. El perfil (No Entregar, (B,NB)) implica el mismo resultado del juego que el perfil (No Entregar, (NB,NB)), sin 13Es posible que esta estrategia parezca no tener sentido en el contexto que se le ha dado al juego. Sin embargo, es una posibilidad para el asaltante y como tal podemos analizarla. Microeconom´ıa II
  • 24. Facultad de Econom´ıa y Negocios - Universidad de Chile 23 embargo no constituye un EPS porque el asaltante est´a siguiendo una estrategia sub´optima en el nodo IIa. Notar que tambi´en es un EN el perfil (Entregar, (NB,B)), seg´un el cual el resultado del juego es que el cajero entrega el dinero al asaltante. Sin embargo, el hecho de que en este perfil el cajero no tenga incentivos a desviarse, se basa en la amenaza no cre´ıble de que en el nodo IIb el asaltante explotar´ıa la bomba. As´ı, observamos que en este contexto el EN por s´ı solo puede ser un criterio poco satisfactorio, pues no considera la din´amica temporal del problema. El EPS aparece entonces como un refinamiento ´util que nos permite quedarnos con un equilibrio m´as cre´ıble, y en alg´un sentido m´as racional. Dentro y fuera de la senda de equilibrio En la discusi´on previa se plantea que un perfil de estrategias -y por lo tanto un equilibrio- constituye un plan de acci´on completo para cada jugador, y por lo tanto no basta con definir cu´al ser´a el resultado del juego sino que es necesario definir cu´ales son las acciones que se llevar´ıan a cabo en cada nodo, aun cuando estos no ocurran seg´un nuestra predicci´on de equilibrio. Esto no es solo una cuesti´on formal, sino que es fundamental para el an´alisis completo del juego porque las decisiones de cada jugador est´an a su vez condicionadas por lo que espera este que har´an los dem´as si se llegasen a encontrar en determinadas coyunturas. M´as concretamente, si pensamos en una partida de ajedrez, es claro que antes de decidir una jugada el ajedrecista analiza cu´al ser´a la respuesta de su oponente ante las distintas movidas que est´a tanteando en un determinado momento. En terminolog´ıa de juegos, si tenemos un perfil de equilibrio, aquellos nodos que seg´un las estrategias definidas efectivamente ocurrir´an se dice que est´an en la senda de equilibrio. De modo similar, los nodos que no ocurren se dice que est´an fuera de la senda de equilibrio. En el ejemplo del asalto al banco, el nodo los nodos I y IIb est´an en la senda de equilibrio, mientras que IIa est´a fuera. Entonces, la idea del p´arrafo anterior se puede resumir en que un equilibrio no se constituye solo por las acciones que ocurren en la senda de equilibrio, sino tambi´en por aquellas que se tomar´ıan fuera de esta (aun cuando nunca se concreten seg´un nuestra predicci´on del resultado del juego). Para observar la relevancia de las estrategias fuera de la senda de equilibrio en la determinaci´on del mismo, analizaremos una extensi´on del juego de invasi´on, cuyo ´arbol se muestra en la figura 1.21. En esta versi´on, agregamos un nodo en el cual el pa´ıs bajo amenaza tiene la posibilidad de constituir un ej´ercito peque˜no o grande antes de que el potencial invasor decida si ataca o no. Adem´as, en el nodo inicial el pa´ıs A puede elegir entre firmar un tratado de paz y terminar el conflicto o no hacerlo. As´ı, los nodos Ai y Bi corresponden a aquellos donde juega A y B, respectivamente. De los pagos se desprende la idea de que, en contraste con la versi´on original del juego, si el pa´ıs B constituye un ej´ercito grande entonces ante una invasi´on preferir´a defenderse que rendirse. El caso en el que constituye un ej´ercito peque˜no es igual al juego original, por lo que preferir´a rendirse en caso de ser invadido. Es decir, al realizar el an´alisis de inducci´on hacia atr´as, se tiene que en los nodos B2 y B3 las decisiones ´optimas son Rendirse y Pelear, respectivamente. Dado esto, en los nodos A2 y A3 las decisiones ´optimas para el pa´ıs A son Invadir y No invadir, respectivamente. El siguiente paso es preguntarse qu´e decidir´a B en el nodo B1; si constituye un ej´ercito peque˜no, entonces el pago que recibir´a -dadas las decisiones ´optimas subsecuentes- ser´a de 6, mientras que si juega “Ej´ercito Grande” el nodo final al que se llega tiene asociado un pago de 7. Por lo tanto, en el nodo B1 la decisi´on ´optima ser´a Ej´ercito Grande. Finalmente, en el nodo A1 la decisi´on ´optima del pa´ıs A ser´a firmar el tratado, ya que con eso recibe un pago de 8, en comparaci´on a los 7 que recibir´ıa si decide no firmar, y el juego se desarrolla seg´un las decisiones ´optimas ya discutidas. En resumen, el EPS del juego vendr´a dados por la estrategia (Tratado, Invadir, No invadir) para el pa´ıs A, y (Ej´ercito grande, Rendirse, Pelear) para el pa´ıs B (donde las acciones est´an ordenadas siguiendo la numeraci´on de los nodos para cada jugador). Por lo tanto, el resultado que parece razonable en este caso es que los pa´ıses firmar´an el tratado de paz y el juego se acaba luego del primer nodo. Lo fundamental Microeconom´ıa II
  • 25. Facultad de Econom´ıa y Negocios - Universidad de Chile 24 A2 B2 A3 B3 A1 B1 (7,2) (9,6) (8,8) (3,6) (8,5) (7,7) (8,8) Invadir No inv. Pelear Rendirse Invadir No inv. Pelear Rendirse Ej´ercito Peque˜no Ej´ercito Grande No firmar trat. Firmar tratado Figura 1.21: Juego de invasi´on extendido del ejemplo, es que este resultado se sostiene gracias a lo que ocurrir´a fuera de la senda de equilibrio seg´un las estrategias propuestas. En efecto, el mejor escenario para el pa´ıs A ser´ıa aquel en el que invade contra un ej´ercito peque˜no y el pa´ıs B se rinde, pero la raz´on por la que firma el tratado y no intenta llegar a ese nodo es que sabe que si B tiene la oportunidad para armarse, entonces constituir´a un ej´ercito grande.14 As´ı, el resultado que observamos en la senda de equilibrio es consecuencia de las decisiones que se tomar´ıan en aquellos nodos que finalmente no ocurren. Estrategias continuas Al igual que en el caso de los juegos est´aticos, en los juegos din´amicos podemos analizar y encontrar equilibrios de juegos con espacios de estrategias continuos utilizando las herramientas de c´alculo diferen- cial. A modo de ejemplo, consideremos un modelo de duopolio denominado competencia a la Stackelberg. Suponemos que hay dos firmas que compiten en cantidades, pero a diferencia del modelo de Cournot, existe una firma que elige su nivel de producci´on q1 primero, denominada “l´ıder”. La segunda firma, llamada “seguidora”, observa esta cantidad y luego elige su propia producci´on q2. Suponiendo la misma funci´on de demanda utilizada anteriormente, P(Q) = A − Q, resolveremos el modelo por inducci´on hacia atr´as. Para ello, resolvemos el problema de la firma seguidora, el cual consiste en maximizar sus beneficios, dado el nivel de q1 observado. m´ax q2 (A − q1 − q2)q2 − cq2 De la CPO se tiene que q2(q1) = A−q1−c 2 . Esta funci´on coincide con la respuesta ´optima de la firma en el modelo de Cournot, pues el problema que resuelve es el mismo. Sin embargo, la interpretaci´on es diferente, ya que en este caso se trata de la estrategia de la firma seguidora. En efecto, esta funci´on resume un plan contingente a cada posible cantidad q1 que pueda observar. El siguiente paso de la inducci´on hacia atr´as es resolver el problema de la firma l´ıder, teniendo en cuenta la estrategia ´optima de la seguidora. Esto es, la l´ıder elige q1 tomando en cuenta que la 14Del mismo modo que en el asalto al banco, el cajero sab´ıa que llegado el momento el asaltante no explotar´ıa la bomba. Microeconom´ıa II
  • 26. Facultad de Econom´ıa y Negocios - Universidad de Chile 25 seguidora reaccionar´a de acuerdo a la funci´on q2(q1) = A−q1−c 2 . Esto es completamente an´alogo a lo que hemos hecho con los juegos din´amicos hasta ahora, donde para encontrar la acci´on ´optima de un jugador tomamos en cuenta las acciones subsecuentes que resultan ´optimas. Por lo tanto, el problema que resuelve la l´ıder es m´ax q1 (A − q1 − q2(q1))q1 − cq1 donde escribimos q2(q1) para explicitar que en su decisi´on est´a tomando en cuenta que la seguidora reaccionar´a de forma ´optima al nivel de producci´on elegido. Al resolver la CPO se obtiene que: qS 1 = A − c 2 As´ı, el perfil de estrategias de EPS viene dado por (qS 1 = A−c 2 , q2(q1) = A−q1−c 2 ), donde tal como en el juego de invasi´on definimos la estrategia de la firma seguidora como un plan de acci´on contingente, y no como una cantidad en particular. Sin embargo, con esto en la mano podemos calcular cu´al es el resultado asociado al equilibrio. En efecto, basta con reemplazar la cantidad ´optima qS 1 en la funci´on que define la estrategia de la seguidora para obtener qS 2 (qS 1 ) = A − c 4 Es decir, en la senda de equilibrio se observar´a q1 = A−c 2 y q2 = A−c 4 . Entonces la predicci´on del EPS es que la firma l´ıder produce m´as que en el modelo de Cournot, mientras que la seguidora produce menos. Es f´acil verificar, reemplazando estas cantidades en la funci´on de beneficios, que la firma l´ıder est´a mejor que en el modelo de Cournot y que la seguidora est´a peor. A partir de esta ´ultima observaci´on surge la pregunta de qu´e ocurre si la firma seguidora elige la estrategia q2(q1) = A−c 3 , esto es, su plan consiste en producir la cantidad de Cournot independiente de cu´al sea la cantidad producida por q1. Si la firma l´ıder toma esa estrategia como fija, entonces su estrategia ´optima tambi´en ser´a la cantidad de Cournot. As´ı, el perfil de estrategias (q1 = A−c 3 , q2(q1) = A−c 3 ) constituye un EN puesto que aun cuando la firma seguidora reconsiderara su estrategia “r´ıgida” de siempre producir la cantidad de Cournot, observaremos que no tendr´a incentivos a cambiar su plan de acci´on. Sin embargo, este equilibrio se basa en una “amenaza” no cre´ıble de parte de la firma seguidora, la cual es que si la l´ıder produce la cantidad de Stackelberg, qS 1 , de todos modos la seguidora responder´a con la cantidad de Cournot a pesar de que ´esta no es ´optima. En efecto, a partir de la inducci´on hacia atr´as sabemos que cuando la l´ıder produce qS 1 la seguidora prefiere responder con qS 2 , de modo que cuando dice que producir´a la cantidad de Cournot es lo mismo que cuando el asaltante de banco dec´ıa que de no recibir el dinero entonces explotar´ıa la bomba. 1.6.1. Informaci´on perfecta e imperfecta Una dimensi´on de los juegos din´amicos que hemos ignorado hasta ahora dice relaci´on con el conoci- miento que tienen los jugadores respecto de c´omo se ha desarrollado el juego hasta el momento en el que les toca jugar. Esto es, podemos permitir que en ciertas situaciones le corresponda mover a un jugador, sin que este sepa con precisi´on qu´e es lo que ha hecho su contraparte previamente. Cuando ocurra esto, hablaremos de juegos de informaci´on imperfecta. 15 Un caso sencillo de un juego de informaci´on imperfecta corresponde al ejemplo de matching pennies, tal como lo hemos visto en las secciones anteriores. Aunque hasta ahora lo hemos descrito como un juego 15Recordemos que informaci´on completa se refer´ıa al hecho de que las funciones de pago de cada jugador (o sus prefe- rencias) son de conocimiento p´ublico. Esto nada dice respecto de la capacidad de observar la jugada del otro, por lo que un juego puede ser de informaci´on completa pero imperfecta. Microeconom´ıa II
  • 27. Facultad de Econom´ıa y Negocios - Universidad de Chile 26 est´atico, tambi´en podemos entenderlo como un juego din´amico, donde un jugador elige primero un lado de la moneda, y luego el otro elige el suyo sin observar la moneda del primero. La forma extensiva del juego se representa en la figura1.22, donde la l´ınea punteadas denota el hecho de que cuando al jugador 2 le corresponde mover, no sabe si se encuentra en el nodo IIa ´o en el IIb. IIa(Jugador 2) C S C S SC I(Jugador 1) IIb(Jugador 2) u1 = 1 u2 = −1 u1 = −1 u2 = 1 u1 = −1 u2 = 1 u1 = 1 u2 = −1 Figura 1.22: Matching pennies en forma extensiva Resulta claro que el hecho de que uno de los jugadores mueva primero no tiene implicancias es- trat´egicas sobre la decisi´on del otro, ya que al no observar la moneda el juego es equivalente al caso en el que muestran las monedas simult´aneamente. De hecho cualquier juego est´atico puede ser entendido como un juego din´amico de informaci´on incompleta, donde uno de los jugadores mueve primero pero el otro no observa la jugada. Lo importante en t´erminos estrat´egicos no es si un jugador mueve primero que el otro, sino que aquel que mueve despu´es pueda observar la jugada del primero. Por lo tanto, no hay nada nuevo que decir sobre el equilibrio en este caso, pues tal como estudiamos en el contexto de juegos est´aticos, el ´unico EN es aquel en estrategias mixtas donde cada uno elige probabilidad 0,5. En la terminolog´ıa de juegos, cuando a un jugador le corresponde jugar y no sabe con precisi´on lo que ha ocurrido antes, el conjunto de nodos en los cu´ales podr´ıa estar ubicado lo llamaremos conjunto de informaci´on. En particular, cuando s´ı sabe la historia del juego (y por lo tanto el nodo en el cual est´a ubicado) el conjunto de informaci´on tiene un ´unico elemento. Por ejemplo, en la figura 1.22 obser- vamos dos conjuntos de informaci´on: el que contiene al nodo I y el que contiene a los nodos IIa y IIb. As´ı, en este ejemplo cada jugador tiene un conjunto de informaci´on. Consideremos, en cambio, una versi´on de informaci´on completa del mismo juego. Es decir, un jugador muestra primero su moneda, y el otro juega una vez que la observa. Esta versi´on del juego est´a represen- tada en la figura 1.23, donde la ´unica diferencia en t´erminos del dibujo es que no est´a la l´ınea punteada que une los nodos IIa y IIb. Por lo tanto, el jugador 2 ahora tiene dos conjuntos de informaci´on, aquel que contiene solo al nodo IIa y el que contiene solo el IIb. IIa(Jugador 2) C S C S SC I(Jugador 1) IIb(Jugador 2) u1 = 1 u2 = −1 u1 = −1 u2 = 1 u1 = −1 u2 = 1 u1 = 1 u2 = −1 Figura 1.23: Matching pennies con informaci´on perfecta En este caso, igual que en los juegos de informaci´on perfecta analizados anteriormente, una estrategia corresponde a un plan de acci´on ante cada posible coyuntura en la que tenga que mover. As´ı, el conjunto de estrategias factibles para el jugador 2 viene dado por {(C, C), (C, S), (S, C), (S, C)}, mientras que el Microeconom´ıa II
  • 28. Facultad de Econom´ıa y Negocios - Universidad de Chile 27 del jugador 1 es {C, S}. En el caso de informaci´on incompleta, en cambio, el jugador 2 debe tomar una ´unica decisi´on porque no sabe en cu´al nodo se ubicar´a. Dicho de otro modo, en los juegos de informaci´on imperfecta, una “coyuntura” en la cual le corresponde mover a un jugador no es un nodo, sino que un conjunto de informaci´on. As´ı, para generalizar la noci´on de estrategia desarrollada en la secci´on anterior, diremos que en juegos din´amicos una estrategia es un plan que indica qu´e acci´on tomar´a el jugador en cada posible conjunto de informaci´on en el cual le puede tocar jugar. 1.7. Definici´on de juego en forma extensiva, subjuego y EPS Con el concepto de conjunto de informaci´on explicado en la secci´on anterior ya tenemos todo lo necesario para definir la forma extensiva de un juego, adem´as de aclarar qu´e es un subjuego y por lo tanto un EPS. En los ejemplos vistos hasta ahora hemos observado cu´ales son los elementos que son necesarios determinar para definir de forma completa un juego din´amico. Estos los resumimos en la siguiente definici´on, Definici´on 6. Un juego en forma extensiva viene dado por: 1. Una lista de n ≥ 1 jugadores, indizados por i, i = 1, 2, ..., n. (conjunto de jugadores) 2. a. Cu´ando le corresponde mover a cada jugador (nodos asociados con los respectivos jugadores) b. Acciones disponibles al momento de mover (ramas que nacen a partir de cada nodo) c. Qu´e es lo que el jugador sabe cuando mueve (conjuntos de informaci´on) 3. Los pagos que reciben en cada nodo terminal los jugadores (funciones de utilidad) Tal como planteamos en la secci´on 1.2, para analizar una situaci´on estrat´egica desde la teor´ıa de juegos resulta necesario definir de forma clara y concreta ciertos aspectos del problema, los que para el caso de un juego din´amico se resumen en la definici´on de juego en forma extensiva reci´en entregada. Por su parte, un subjuego corresponde a cada juego cuyo nodo inicial es un conjunto de informaci´on del juego original con un ´unico elemento. En t´erminos del ´arbol de un juego, corresponde al conjunto de nodos y ramas que nacen en los conjuntos de informaci´on con un ´unico elemento y que pueden ser entendidos como un juego “m´as peque˜no”. Cabe destacar que el juego original es un subjuego en s´ı mismo. Por ejemplo: El juego de la figura 1.17 tiene 2 subjuegos: aquel que nace en el nodo B, y el juego original que nace en el nodo A. El juego de la figura 1.19 tiene 3 subjuegos, los cuales nacen de cada uno de los nodos del juego. El juego de la figura 1.21 tiene 6 subjuegos: los sub-´arboles que nacen en cada uno de sus nodos. De estos tres ejemplos ya debiese quedar claro que para juegos de informaci´on perfecta, la cantidad de subjuegos coincide con la cantidad de nodos, pues cada nodo es un conjunto de informaci´on con un ´unico elemento. (y por lo tanto, cada nodo corresponde al nodo inicial de un subjuego). El juego de la figura 1.22 tiene un ´unico subjuego: el juego completo. La raz´on por la cual los nodos IIa y IIb con sus respectivas ramas no constituyen un subjuego, es que ambos pertenecen a un conjunto de informaci´on mayor, lo que contradice la definici´on de subjuego. De los ejemplos anteriores salta a la vista que un subjuego no es m´as que lo que queda de un juego una vez que se ha alcanzado cierto nodo decisi´on. Esta definici´on resulta sencilla y pareciera que Microeconom´ıa II
  • 29. Facultad de Econom´ıa y Negocios - Universidad de Chile 28 pudimos haberla entregado antes para explicar concretamente qu´e es un EPS. Sin embargo, es importante entender que los nodos que no son un conjunto de informaci´on en si mismo no son el nacimiento de un subjuego, y para ello primero ten´ıamos que conocer el concepto de informaci´on imperfecta. Ahora que hemos aclarado este punto, podemos definir formalmente un EPS. Definici´on 7. Un equilibrio de Nash perfecto en subjuegos es un EN tal que las acciones definidas por el perfil de estrategias son, a su vez, equilibrios de Nash de cada subjuego. Es decir, el EPS se diferencia de los dem´as EN del juego en el hecho de que si analizamos los subjuegos, las decisiones de cada jugador siguen siendo satisfactorias en el sentido de que son una respuesta ´optima. Por ejemplo, recordemos que en el juego del asalto al banco el perfil (Entregar,(NB,B)) era un EN del juego. Sin embargo, si observamos el subjuego que comienza en el nodo IIb, el cual consiste en una simple decisi´on entre las alternativas {B,NB}, la estrategia B no es ´optima, y por lo tanto no es un EN del subjuego. Se puede verificar que el equilibrio que encontramos haciendo inducci´on hacia atr´as s´ı verifica la definici´on reci´en planteada. Microeconom´ıa II
  • 30. Cap´ıtulo 2 Informaci´on incompleta Como ya mencionamos en la introducci´on, una de las dimensiones m´as importantes a considerar en muchas situaciones estrat´egicas es qu´e es lo que saben los jugadores respecto de las caracter´ısticas de los dem´as. En efecto, si en los conceptos de equilibrio que hemos desarrollado hasta ahora se observa que la estrategia de cada jugador depende de las estrategias de otros jugadores, resulta natural cuestionarse qu´e ocurre cuando cierta informaci´on (como las preferencias o alguna otra caracter´ıstica) no es de conocimiento p´ublico. El objetivo de este cap´ıtulo es introducir los conceptos necesarios para analizar este tipo de situaciones, bas´andonos fundamentalmente en ejemplos sencillos que nos permitir´an resaltar los puntos relevantes a tener en consideraci´on. 2.1. Juegos est´aticos de informaci´on incompleta Para comenzar, revisitemos un ejemplo que ya hemos analizado en distintos contextos: la competencia a la Cournot. Tenemos la estructura ya familiar en la que existen dos firmas, denotadas por i = {1, 2}, y la demanda inversa del mercado en el que compiten viene dada por P(Q) = A−Q. Supongamos que la firma 1 tiene un costo marginal c fijo y conocido por ambas firmas. En cambio, la firma 2 tiene informaci´on privada sobre su costo, el cual puede ser alto (ca) o bajo (cb). Concretamente, supondremos que la firma 1 solo sabe que con probabilidad α se trata de una firma con costo alto y con probabilidad (1−α), de costo bajo. Recordemos que para el caso de informaci´on completa la funci´on de reacci´on de cada firma depend´ıa de los costos de su contraparte. Por lo tanto, el hecho de que la firma 1 enfrente incertidumbre respecto de los costos de la 2 deja en evidencia que se requiere agregar elementos adicionales al an´alisis. En particular, para obtener una noci´on de equilibrio satisfactoria en un contexto de informaci´on incompleta ser´a necesario replantearnos la forma en la que analizamos el comportamiento de los individuos. Analicemos primero la decisi´on de la firma 2. Dado que ´esta conoce su costo con certeza, entonces es natural pensar que su decisi´on ´optima ser´a distinta seg´un cu´al sea el costo que efectivamente enfrente. En efecto, si fijamos la cantidad que produce la firma 1 en alg´un valor q1, la funci´on objetivo de la firma 2 viene dada por πa = (A − q1 − q2)q2 − caq2 si enfrenta costos altos. En cambio, si el costo verdadero de la firma es bajo (cb), su funci´on de beneficios ser´a πB = (A − q1 − q2)q2 − cbq2. Si maximizamos cada una de estas funciones respecto de q2 obtendremos que la respuesta ´optima de la firma 2 en funci´on de su costo, se puede escribir como: q∗ 2(ca) = A − q1 − ca 2 q∗ 2(cb) = A − q1 − cb 2 29
  • 31. Facultad de Econom´ıa y Negocios - Universidad de Chile 30 Podemos notar que corresponde a la misma funci´on de reacci´on que obtuvimos en el caso de informa- ci´on completa. La diferencia clave es que la firma puede encontrarse en 2 situaciones diferentes, y su comportamiento ´optimo variar´a seg´un ocurra una o la otra. Consideremos ahora la situaci´on que enfrenta la firma 1. Como ya se plante´o, nuestro supuesto es que ´esta no sabe si la firma 2 enfrenta costos altos o bajos, pero s´ı sabe que existen solo dos valores posibles (ca y cb) y asigna cierta probabilidad a la ocurrencia de cada uno. Adem´as, seguimos suponiendo que cada jugador entiende que el otro act´ua de forma racional y buscando maximizar su ganancia, lo que en este caso se traduce en que la firma 1 sabe que la 2 seguir´a una estrategia distinta seg´un sus costos efectivos sean altos o bajos. Todas estas ideas se resumen en el hecho de que la estrategia ´optima de la firma 1, dadas ciertas cantidades q2(ca) y q2(cb) fijas, es aquella que maximiza su ganancia esperada: π1 = α [(A − q1 − q2(ca))q1 − cq1] + (1 − α) [(A − q1 − q2(cb))q1 − cq1] Al derivar respecto de q1 y despejar obtenemos que la respuesta ´optima de la firma 1, a cualquier par de cantidades q2(ca) y q2(cb), viene dada por: q∗ 1 = α (A − q2(ca) − c) + (1 − α) (A − q2(cb) − c) 2 As´ı, para proponer un equilibrio para este juego, hemos seguido hasta ahora el mismo camino que para el caso de informaci´on completa: computar las funciones de reacci´on. Las diferencias fundamentales que se evidencian a partir del ejemplo son que: (1) hay que encontrar una funci´on de reacci´on para cada caso en el que se pueda encontrar un jugador (costo alto o bajo en el ejemplo), y (2) la funci´on objetivo relevante toma en cuenta la incertidumbre que tienen los jugadores respecto de las caracter´ısticas de los dem´as. Una vez que hemos tenido en consideraci´on estas cuestiones, encontrar el equilibrio del juego se reduce a calcular el perfil de estrategias en el cual las funciones de reacci´on se intersectan. De la discusi´on anterior se deduce que un perfil viene dado por las cantidades q1, q2(ca) y q2(cb). Las tres funciones de reacci´on ya planteadas constituyen un sistema que nos permiten calcular estas inc´ognitas. En efecto, al despejar se obtienen los siguientes resultados: qN 1 = A − 2c + αca + (1 − α)cb 3 qN 2 (ca) = A − 2ca + c 3 + (1 − α)(ca − cb) 6 qN 2 (cb) = A − 2cb + c 3 − α(ca − cb) 6 El supra´ındice N hace referencia a Nash, pero en juegos de informaci´on incompleta muchas veces se denomina equilibrio de Bayes-Nash. Aunque este ´ultimo concepto tiene una definici´on formal que da cuenta de las diferencias con el EN, lo importante para nuestros prop´ositos lo podemos observar a partir del ejemplo: el perfil de estrategias define una acci´on para cada posible “realizaci´on” de la firma 2 (ya que como discutimos esta actuar´a diferente seg´un los costos que enfrente) y la funci´on objetivo relevante da cuenta de la incertidumbre que implica la informaci´on incompleta (en este caso se trata de la ganancia esperada dada la probabilidad α). Una subasta a sobre cerrado Una situaci´on de inter´es que naturalmente debe ser estudiada como un juego de informaci´on in- completa son las subastas. Esto, porque la valoraci´on que tiene cada postor o posible comprador es Microeconom´ıa II