Segura 2013 -- equilibrio de nash - 28 abril 2013

Teoría de los Juegos – Equilibrio de Nash //
@JackFlash
Conceptos Solución: El Equilibrio de Nash
J.C.Segura Ms.Sc.
Universidad de La Salle
Facultad de Ciencias Económicas y Sociales
Escuela Colombiana de Ingeniería
Facultad de Economía
jcsegura@lasalle.edu.co / juan.segura@escuelaing.edu.co / j.c.segura@gmail.com
URL: http://microeconomica.googlepages.com / twitter: @JackFlash
Bogotá, D.C., Abril de 2013

@JackFlash

@JackFlash
Presentación
La Noción de Equilibrio de Nash es la pieza central, el criterio de solución nuclear en la Teoría
Clásica de los Juegos. Su relevancia tiene que ver con la potencia de este criterio en el momento de
encontrar soluciones a juegos, conflictos en los que los individuos involucrados actúan
estratégicamente, una potencia que muchas veces se echa de menos cuando se aplican otros criterios
esenciales como aquél asociado a los nombres de Von Neumann y Morgenstern (MinMax) o aquel
otro de la eliminación iterada de estrategias estrictamente dominadas.
La mayoría de los juegos pueden no ser resueltos mediante el principio de dominancia estricta
iterada. En la otra mano, el concepto solución de Nash supone una posibilidad para una gran
variedad de juegos [ Fundenberg & Tirole (1991): 11) ]
En efecto, el reconocer que en un equilibrio de un juego no cooperativo de N personas en el cual
no es necesario limitarse al principio de common knowledge1 y ningún jugador tiene nada que ganar al
cambiar su estrategia en forma unilateral, i.e., si un jugador ha elegido una estrategia y ningún
jugador puede beneficiarse del cambio de estrategia, mientras los demás permanecen en sus
estrategias elegidas, el concepto de solución así definido termina capturando soluciones que los
otros criterios suelen normalmente omitir.
1
“El conocimiento común de los pagos de un juego no es condición ni necesaria ni suficiente para justificar un Equilibrio de Nash. En particular, en algunas justificaciones es
suficiente que los jugadores simplemente conozcan su propios pagos” [ Fundenberg and Tirole (1992): 5 ]

@JackFlash
Definición. Estrategias Mixtas [ Fundenberg & Tirole (1992): 5 ]
Una estrategia mixta, notada con 𝜎𝑖 es una distribución de probabilidades sobre las estrategias puras de un
jugador. La aleatorización de cada jugador es independiente de la de sus oponentes y el pago
correspondiente a un perfil de estrategias mixtas es el valor esperado de los pagos correspondientes a
cada estrategia pura.
El espacio de estrategias mixtas del i-ésimo jugador se representa mediante Σ𝑖 y 𝜎𝑖( 𝑠𝑖) es la probabilidad
𝜎𝑖 que se le asigna a 𝑠𝑖. El espacio de perfiles de estrategias mixtas se nota con Σ = ∏ Σ𝑖𝑖 . El pago
correspondiente al perfil 𝜎 del jugador 𝑖 está dado por:
𝑢𝑖( 𝜎) ≡ ∑ (∏ 𝜎𝑗(𝑠𝑗)
𝐼
𝑗=1
) 𝑢𝑖( 𝑠)
𝑠∈𝑆

@JackFlash
Definición. Utilidad Esperada [ Manrique et. al. (1999:180) ]
La utilidad esperada de un jugador es el pago que podría recibir como resultado de las distintas loterías
que sobre estrategias puras pueda enfrentar un jugador, i.e. cuando se introduce aleatoriedad en el
comportamiento del individuo. Con base en la definición anterior ( Estrategia Mixta ), dada por ejemplo
𝜎 = (𝜎1, 𝜎2, … , 𝜎 𝑁) ∈ ∏ Δ𝑖
𝑁
𝑖=1
𝑢𝑖( 𝜎) ≡ ∑ (∏ 𝜎𝑗(𝑠𝑗)
𝐼
𝑗=1
) 𝑢𝑖( 𝑠)
𝑠∈𝑆

@JackFlash
Ejemplo [ Manrique et. al. Tirole (1999:180) ]
Considere el siguiente Juego:
Jugador 2
x2 y2
Jugador 1
x1 3, 2 5, 1
y2 4, 1 2, 3
Suponga que no hay certeza para ningún jugador acerca de lo que su contraparte hará. En este caso cada
jugador aleatoriza sus decisiones asignando probabilidades de acuerdo con sus estimaciones. Si p 𝑇
=
( 𝑝1, 𝑝2) y q 𝑇
= ( 𝑞1, 𝑞2) son estrategias mixtas para los jugadores 1 y 2, respectivamente, entonces, las
utilidades esperadas por jugador son como sigue:
 Jugador 1: 𝑢1( 𝜎) = 𝑝1(3𝑞1 + 5𝑞2) + 𝑝2(4𝑞1 + 2𝑞2)
 Jugador 2: 𝑢2( 𝜎) = 𝑞1(2𝑝1 + 𝑝2) + 𝑞2( 𝑝1 + 3𝑝2)

@JackFlash
Ejemplo [ Fundenberg and Tirole (1992:5) ]:
Considere el siguiente juego:
Columna
L M R
Fila
U 4, 3 5, 1 6, 2
M 2, 1 8, 4 3, 6
D 3, 0 9, 6 2, 8
Suponga que una estrategia mixta para el jugador 1 es un vector (𝜎1( 𝑈), 𝜎1( 𝑀), 𝜎1( 𝐷)) con
probabilidades todas mayores que cero y tales que 𝜎1( 𝑈) + 𝜎1( 𝑀) + 𝜎1( 𝐷) = 1. Por otra parte, una
estrategia mixta para el jugador 2 es un vector (𝜎2( 𝐿), 𝜎2( 𝑀), 𝜎2( 𝑅)) con probabilidades todas mayores
que cero y tales que 𝜎2( 𝐿) + 𝜎2( 𝑀) + 𝜎2( 𝑅) = 1. Entonces los pagos para los perfiles 𝜎1 = (1
3
, 1
3
, 1
3
) y
𝜎2 = (0, 1
2
, 1
2
) son:
𝑢1( 𝜎1) =
1
3
(0 ∙ 4 +
1
2
∙ 5 +
1
2
∙ 6) +
1
3
(0 ∙ 2 +
1
2
∙ 8 +
1
2
∙ 3) +
1
3
(0 ∙ 3 +
1
2
∙ 9 +
1
2
∙ 2) =
11
2
𝑢2( 𝜎2) = 0 (
1
3
∙ 3 +
1
3
∙ 1 +
1
3
∙ 0) +
1
2
(
1
3
∙ 1 +
1
3
∙ 4 +
1
3
∙ 6) +
1
2
(
1
3
∙ 2 +
1
3
∙ 6 +
1
3
∙ 8) =
27
6

@JackFlash
Ejemplo: La Batalla de los Sexos [ (sic) Varian (1993:313) ]
Felisa Fila y Carlos Columna no saben si estudiar microeconomía o macroeconomía este semestre. Felisa
obtiene la utilidad 2 y Carlos la utilidad 1 si ambos estudian micro; las ganancias son inversas si ambos
estudian macro. Si asisten a cursos diferentes, ambos obtienen utilidad 0. El juego, puesto en forma
estratégica adquiere la siguiente forma:
Carlos
Micro Macro
Felisa
Micro 2, 1 0, 0
Macro 0, 0 1, 2
Si Carlos cree que Felisa elegirá estudiar micro, obtendrá 1 eligiendo Micro y 0 escogiendo Macro: Micro
es la mejor respuesta de Carlos a la elección de Felisa cuando ella elige Micro. Al mismo tiempo, si
Carlos elige Micro, lo óptimo para Felisa es elegir también Micro.

@JackFlash
El problema es susceptible de ponerse y resolverse como un problema de optimización. Sean ( 𝑝 𝑎, 𝑝 𝑏)
las probabilidades de que Felisa elija “Micro” y “Macro” respectivamente y sean ( 𝑝𝑖, 𝑝 𝑑) las
probabilidades de que Carlos elija “Micro” y “Macro” respectivamente.
El problema de Felisa es:
max
(𝑝 𝑎,𝑝 𝑏)
𝑝 𝑎[ 𝑝𝑖2 + 𝑝 𝑑0] + 𝑝 𝑏[ 𝑝𝑖0 + 𝑝 𝑑1] 𝑠. 𝑎. {
𝑝 𝑎 + 𝑝 𝑏 = 1
𝑝 𝑎 ≥ 0
𝑝 𝑏 ≥ 0
La función de Lagrange es:
Φ( 𝑝 𝑎, 𝑝 𝑏; 𝜆, 𝜇 𝑎, 𝜇 𝑏) = 2𝑝 𝑎 𝑝𝑖 + 𝑝 𝑏 𝑝 𝑑 − 𝜆( 𝑝 𝑎 + 𝑝 𝑏 − 1) − 𝜇 𝑎 𝑝 𝑎 − 𝜇 𝑏 𝑝 𝑏
Las condiciones de Kuhn-Tucker son:
[ 𝑝 𝑎]: 2𝑝𝑖 − 𝜆 − 𝜇 𝑎 = 0
[ 𝑝 𝑏]: 𝑝 𝑑 − 𝜆 − 𝜇 𝑏 = 0
Supondremos 𝑝 𝑎 > 0, 𝑝 𝑏 > 0 luego 𝜇 𝑎 = 𝜇 𝑏 = 0 por tanto igualando las CPO:
2𝑝𝑖 = 𝑝 𝑑

@JackFlash
Y dado 𝑝𝑖 + 𝑝 𝑑 = 1
𝑝𝑖 + 2𝑝𝑖 = 1 ∴ ( 𝑝𝑖
∗
, 𝑝 𝑑
∗ ) = (
1
3
,
2
3
) ∎
En el caso de Felisa se obtiene ( 𝑝 𝑎
∗
, 𝑝 𝑏
∗) = (2
3
, 1
3
). Reemplazando estos valores en su función objetivo:
2𝑝 𝑎
∗
𝑝𝑖
∗
+ 𝑝 𝑏
∗
𝑝 𝑑
∗
= 2 × (
2
3
×
1
3
) + (
1
3
×
2
3
) =
2
3
Que representa la ganancia esperada tanto para Carlos como para Felisa: “Obsérvese que cada uno de ellos
preferiría los equilibrios de la estrategia pura a la estrategia mixta, ya que las ganancias son mayores para los dos jugadores”
[ Varian (1993): 315 ].

@JackFlash
Definición. Dominancia Estricta en Estrategias Mixtas
Considere el juego finito en forma normal Γ = [𝑁, ( 𝐶𝑖)𝑖=1
𝑁
, ( 𝑢𝑖)𝑖=1
𝑁
]. Se dice que una estrategia mixta
𝜎𝑖 ∈ ∆𝑖 es estrictamente dominante si y solo si existe otra estrategia mixta 𝜎𝑖
′
∈ ∆𝑖 tal que:
𝑢𝑖( 𝜎𝑖, 𝜎−𝑖) > 𝑢𝑖( 𝜎𝑖
′
, 𝜎−𝑖) para toda 𝜎−𝑖 ∈ ∆−𝑖
En este caso, la estrategia 𝜎𝑖
′
∈ ∆𝑖 es una estrategia estrictamente dominada.
* * *

@JackFlash
Proposición 1
Una estrategia mixta de un jugador que asigna una probabilidad no negativa a una estrategia pura
estrictamente dominada, también es estrictamente dominada. En otros términos: si una estrategia pura
es eliminada por ser estrictamente dominada, esta no puede hacer parte de ninguna estrategia mixta
estrictamente dominante.
Demostración [Según Manrique et. al. (1999: 183)]: Sean 𝑁 = {1,2}, 𝐶1 = {𝐴, 𝐵}, 𝐶2 = {𝐶, 𝐷}. Suponga
que 𝐴 ≻1 𝐵. Sean además las estrategias mixtas 𝜎1 = ( 𝑝, 1 − 𝑝) siendo 𝑝 la probabilidad asociada a la
estrategia 𝐵, y 𝜎2 = ( 𝑞, 1 − 𝑞), donde 𝑞 es la probabilidad asociada a la estrategia 𝐷. En este caso:
𝑢1( 𝜎1, 𝜎2) = 𝑝𝐸( 𝐵) + (1 − 𝑝) 𝐸( 𝐴) donde: {
𝐸( 𝐵) = 𝑞 ∙ 𝑢1( 𝐵, 𝐷) + (1 − 𝑞) ∙ 𝑢1( 𝐵, 𝐶)
𝐸( 𝐴) = 𝑞 ∙ 𝑢1( 𝐴, 𝐷) + (1 − 𝑞) ∙ 𝑢1( 𝐴, 𝐶)
Puesto que 𝑢1( 𝐴, ∗) > 𝑢1( 𝐵, ∗) → 𝐸( 𝐴) > 𝐸( 𝐵). Entonces:
𝑢1( 𝜎1, 𝜎2) = 𝑝𝐸( 𝐵) + (1 − 𝑝) 𝐸( 𝐴) < 𝑝𝐸( 𝐴) + (1 − 𝑝) 𝐸( 𝐴)
∴ 𝑢1( 𝜎1, 𝜎2) = 𝑝𝐸( 𝐵) + (1 − 𝑝) 𝐸( 𝐴) < 𝐸( 𝐴) = [0 ∙ 𝐸( 𝐵) + 1 ∙ 𝐸( 𝐴)] = 𝑢1( 𝜎1
′
, 𝜎2)
Siendo 𝜎1
′
= (0,1) ≻1 ( 𝑝, 1 − 𝑝) = 𝜎1. En este caso 𝜎1
′
es estrategia (mixta) fuertemente dominante∎

@JackFlash
El Equilibrio de Nash
El concepto solución del Equilibrio de Nash se basa en el postulado según el cual “la combinación de
estrategias que los jugadores predeciblemente escogerán es aquella en la cual ningún jugador podría mejorar su pago escogiendo
unilateralmante una estrategia diferente, si supone que los otros continuarán jugando la estrategia previamente escogida”
[Manrique, Villa, Junca, Monsalve (1999:184)]. En consecuencia un equilibrio de Nash constituye un
perfil de estrategias tal que cada una de las estrategias de los jugadores involucrados es una respuesta
óptima a las estrategia de los otros jugadores. [ Fundenberg & Tirole (1991): 11 ]
Equilibrio de Nash en Estrategias Puras2
(Manrique et.al. (1999): 184)
En un juego en forma estrategia Γ = [𝑁, ( 𝐶𝑖)𝑖=1
𝑁
, ( 𝑢𝑖)𝑖=1
𝑁
] se dice que un Equilibrio de Nash en
estrategias puras para el juego finito Γ es una estrategia 𝑐∗
= ( 𝑐𝑖
∗
)𝑖=1
𝑁
siempre que
𝑢𝑖( 𝑐1
∗
, … , 𝒄𝒊
∗
, … , 𝑐 𝑁
∗ ) ≥ 𝑢𝑖( 𝑐1
∗
, … , 𝒄𝒊, … , 𝑐 𝑁
∗ ) toda 𝑐𝑖, todo 𝑖 = 1, … , 𝑁
2
Cfr. Manrique et al (1999:184), Fundenberg and Tirole (1991:11), Monsalve y Arévalo (2005:55) y Barron (2008:111) entre otros.

@JackFlash
Ejemplo [Manrique et. al. (1999:185)]
En el juego a continuación hay un único Equilibrio de Nash en estrategias puras constituido por el par
(m,t) con pagos 𝑢𝑖 = (5,5) en el cual ningún jugador tiene incentivos para desviarse de dicha estrategia:
II
t s
I
k 3, 1 1, 3
m 5, 5 4, 2
i. En efecto, si II piensa que el I jugará m su mejor respuesta es jugar t. Si II juega t, no tiene incentivo
para desviarse a la estrategia s, caso en el cual recibiría un pago menor e igual a $4.
ii. Si, el Jugador I piensa que el Jugador II ha de jugar t su mejor respuesta es jugar m que implica un
pago de $5 respecto de la alternativa (k), que le reportaría un pago de $3: en este caso, el Jugador I
no ve atractivo elegir otra estrategia, dadas los menores retornos asociados.
iii. Considere sin embargo el par (s, m) que supone los pagos (4,2). Si el Jugador I piensa que II jugará
s estará bien quedarse en m; sin embargo si el Jugador II piensa que I jugará m, entonces su mejor
respuesta sería moverse a t, caso en el cual recibiría $3 más. No es un Equilibrio de Nash
iv. Considere además el par (k, t) que reporta pagos (3,2). Empezando con II, note que si supone que
I jugará k, entonces tendrá incentivo para moverse a s (+$2). En la otra mano, si I supone que II
jugará t lo mejor para él sería moverse a m (+$2). Tampoco es un Equilibrio de Nash.

@JackFlash
Ejemplo [Manrique et. al. (1999: 185)]:
En el juego a continuación hay dos (2) Equilibrios de Nash en estrategias puras: ( 𝐴, 𝐶) y ( 𝐵, 𝐷)
II
C D
I
A 10, 10 0, 0
B 0, 0 1, 1
Observaciones:
 Note que si bien 𝑂1 = ( 𝐴, 𝐶) y 𝑂2 = ( 𝐵, 𝐷) son Equilibrios de Nash estos observan una relación
de dominancia específica: 𝑂1 ≻𝑖 𝑂2 , es decir, 𝑂1 es Pareto Superior a 𝑂2 ∀𝑖 = {𝐼, 𝐼𝐼} y cabría
esperarse (en el mundo real) alguna suerte de cooperación entre los dos jugadores, para alcanzar
dicho resultado.
 Se dice entonces que 𝑂1 = ( 𝐴, 𝐶) es un “Equilibrio Focal” pues resulta naturalmente preferido a los
demás equilibrios.
 Note además que la Focalidad del Equilibrio no supone que un equilibrio que pueda caracterizarse así,
sea efectivamente la solución del juego. [e.g. TexPLORE vs. Clampett ]

@JackFlash
Ejemplo Peatón y Conductor [Manrique et. al. (1999: 177)]
Conductor
sc ac Cc
Peatón
sc 50, -3 -99, -2 -100, -3
ac -2, -99 -51, -51 -101, -3
c -50, -100 -3, -101 -3, -3
 El Peatón no presenta estrategias estricta (o aún débilmente) dominantes. Para el Conductor “cc” domina
[ débilmente ] “sc”. Su eliminación deja al juego de la siguiente forma:
ac cc
sc -99, -2 -100, -3
ac -51, -51 -101, -3
cc -3, -101 -3, -3
 En la siguiente ronda, la estrategia “cc” del peatón domina estrictamente a las demás. Eliminando las
estrategias restantes, el único resultado viable es (cc,cc), que es un equilibrio de Nash (por qué?)
ac cc
c -3, -101 -3, -3

@JackFlash
Ejemplo: Caza del Ciervo [ Pérez, Jimeno, Cerdá (2004: 66, 93) ]
Dos cazadores acuerdan salir a buscar presa. Cada individuo enfrenta la disyuntiva de permanecer en el
puesto de observación asignado (convenido) con el objetivo de cazar un ciervo ( 𝑉), o bien intentar cazar
el ciervo pero estar atento a las liebres que ocasionalmente salen (𝑊). Los dos cazadores serán capaces
de cazar un ciervo si permanecen en el puesto asignado, ignorando las liebres. Si uno de los cazadores
no coopera en el objetivo de cazar el ciervo, no podrá por sí mismo cazarlo. Los dos cazadores prefieren
el ciervo a las liebres y las liebres a nada. La matriz de pagos es:
Cazador II
Cooperar Buscar Liebre
Cazador I
Cooperar V, V 0, 2W
Buscar Liebre 2W, 0 W, W
Siendo V >2W, W>0. Hay dos equilibrios de Nash en estrategias puras, ( 𝑉, 𝑉) y ( 𝑊, 𝑊) [ Discuta ]

@JackFlash
Ejemplo: El Juego de la Gallina
Dos jóvenes de los años de 1950 arrancan sus carros, acelerando cada uno en dirección del otro. Las
alternativas que cada conductor tiene son “Continuar” (𝐶) o “Quitarse” (𝑄). Si los dos continúan, reciben
un pago negativo dado el choque que se suscita en este caso. Si uno de ellos elige quitarse del camino
mientras el otro continúa, es un “gallina” y recibe un pago de cero en tanto que el otro recibe un pago
positivo. Si los dos se retiran, los dos son considerados gallinas. 𝑁 = {1,2}, 𝑆𝑖 = { 𝐶, 𝑄} ∀𝑖
II
C Q
I
C -1, -1 1, 0
Q 0, 1 0, 0
Hay dos equilibrios de Nash en estrategias puras, ( 𝐶, 𝑄) y ( 𝑄, 𝐶).

@JackFlash
Ejemplo: Una Matriz no Cuadrada de Pagos
Considere la siguiente matriz de pagos:
No hay estrategias estrictamente dominadas para ningún jugador y hay dos (2) equilibrios de Nash: (𝑆, 𝐻)
y (𝐷, 𝐹).
H F
S 5,2 1,1
D 1,1 5,2
W 2,3 2,3

@JackFlash
Correspondencia de Respuesta Óptima (Correspondencias de Reacción)
[ Ver Pérez, Jimeno & Cerdá, (JCP) (2004: 95~) ]
Es siempre útil definir en forma sistemática el conjunto de acciones disponibles para un jugador que le
garantizan el mejor pago posible, dada la acción conjunta de los demás individuos en el juego (Monsalve,
Arévalo, 2006: 72), i.e., calcular las estrategias óptimas que el jugador podría elegir como respuesta a
cualquier combinación de estrategias por parte de los otros jugadores.
En el caso del i-ésimo jugador se busca un conjunto de estrategias que supongan la mejor respuesta del
jugador i a las estrategias de los –i restantes individuos. A esta relación se le denomina Correspondencia de
Respuesta Óptima (Correspondencia de Reacción) y se nota 𝑅𝑖( 𝑠𝑖)

@JackFlash
Correspondencia de Respuesta Óptima
Definición [Correspondencia de Respuesta Óptima ]: Considere el juego finito en forma normal
Γ = [𝑁, ( 𝑠𝑖)𝑖=1
𝑁
, ( 𝑢𝑖)𝑖=1
𝑁
]
Entonces, para cada uno de los 𝑖 = 1,2, … , 𝑁 jugadores, se llama Correspondencia de Respuesta Óptima o
Correspondencia de Mejor Respuesta o Correspondencia de Reacción a la regla que a cada combinación de
estrategias
𝑠−𝑖 = ( 𝑠1, 𝑠2, … , 𝑠𝑖−1, 𝑠𝑖+1, … , 𝑠 𝑁)
asigna el conjunto 𝑅𝑖( 𝑠−𝑖), siempre que y si y sólo si resulta que:
𝑢𝑖( 𝑠1, 𝑠2, … , 𝑠𝑖−1, 𝑠𝑖
′
, 𝑠𝑖+1, … , 𝑠 𝑁) ≥ 𝑢𝑖( 𝑠1, 𝑠2, … , 𝑠𝑖−1, 𝑠𝑖, 𝑠𝑖+1, … , 𝑠 𝑁)
∀𝑠𝑖 ∈ 𝑆𝑖

@JackFlash
Correspondencia de Respuesta Óptima
Teorema [Correspondencia de Respuesta Óptima y Equilibrio de Nash]: Considere el juego finito en forma
estratégica:
Γ = [𝑁, ( 𝑠𝑖)𝑖=1
𝑁
, ( 𝑢𝑖)𝑖=1
𝑁
]
Entonces el perfil de estrategias:
𝑠∗
= ( 𝑠1
∗
, 𝑠2
∗
, … , 𝑠𝑖−1
∗
, 𝑠𝑖
∗
, 𝑠𝑖+1
∗
, … , 𝑠𝑖
∗
)
Es un equilibrio de Nash si y sólo si:
𝑠𝑖
∗
∈ 𝑅𝑖( 𝑠−𝑖
∗ )
Prueba: Ver Fundenberg and Tirole, 1992.—

@JackFlash
Ejemplo: Juego de la Mayor Diferencia
Sea 𝑁 ≔ 2. El juego consiste en que los dos jugadores escriben al mismo tiempo un número 𝑥𝑖 ∈ [0,1]
y los pagos están constituidos por la diferencia entre cada uno de los números escritos de acuerdo con
la siguiente regla:
𝑢1( 𝑠1, 𝑠2) = 𝑢2( 𝑠1, 𝑠2) = ( 𝑠1 − 𝑠2)2
Si 𝑠2 = 3
4
entonces la respuesta óptima de 𝑠1 = 0
Si 𝑠1 = 1
4
entonces la respuesta óptima de 𝑠2 = 1, etc.
Las correspondencias de respuesta óptimas de cada jugador, 𝑅𝑖( 𝑠−𝑖) en este caso son:
Jugador 1 Jugador 2
𝑅1( 𝑠2) =
{
0 ⟷ 𝑠2 >
1
2
1 ⟷ 𝑠2 <
1
2
0 ó 1 ⟷ 𝑠2 =
1
2
𝑅2( 𝑠1) =
{
0 ⟷ 𝑠1 >
1
2
1 ⟷ 𝑠1 <
1
2
0 ó 1 ⟷ 𝑠1 =
1
2

@JackFlash
Ejemplo: Juego del Reparto (Nash Calls)
El juego consiste en repartirse un valor. El reparto se hace con las siguientes reglas. Cada jugador escribe
un número entre 0 y 1 que representa la fracción del activo que desean que se les entregue. Si la suma de
los dos números es menor o igual que 1, a cada jugador se le entrega lo que pidió. Si la suma de los dos
números es mayor que 1, ninguno de los jugadores recibe nada. En forma normal, el juego adquiere la
siguiente forma.
𝑖 = {1,2}, 𝑠𝑖 = [0, 1] ∀𝑖 = 1,2
Pagos (Juego Infinito)
Jugador 1 Jugador 2
𝑢1( 𝑠1, 𝑠2) {
𝑠1 ⟷ ( 𝑠1 + 𝑠2) ≤ 1
0 ⟷ 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑢2( 𝑠1, 𝑠2) {
𝑠2 ⟷ ( 𝑠1 + 𝑠2) ≤ 1
0 ⟷ 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
 Si, por ejemplo, el Jugador 2 juega 𝑠2 = 1
2
la respuesta óptima de 1 es 𝑠1
∗
= 1
2
= 1 − 𝑠2
 Si, por ejemplo, el Jugador 1 juega 𝑠1 = 4
5
la respuesta óptima de 2 es 𝑠1
∗
= 1
5
= 1 − 𝑠1

@JackFlash
Por lo tanto, las correspondencias de respuesta óptima para cada uno de los jugadores son:
Jugador 1 Jugador 2
𝑅1( 𝑠2) = {
1 − 𝑠2 ⟷ 𝑠2 < 1
[0, 1] ⟷ 𝑠2 = 1
𝑅2( 𝑠1) = {
1 − 𝑠1 ⟷ 𝑠1 < 1
[0, 1] ⟷ 𝑠1 = 1

@JackFlash
Ejemplo: Juego Simple de Cournot [Pérez, Jimeno & Cerdá, (2004:98) ]
Dos jugadores escriben al mismo tiempo un número 𝑞𝑖 ∈ [0,1]. Los pagos correspondientes a cada uno
de los jugadores son los siguientes:
𝜋𝑖 = {
𝜋1 = 𝑞1(1 − 𝑞1 − 𝑞2)
𝜋2 = 𝑞2(1 − 𝑞1 − 𝑞2)
Para el Jugador 1, la correspondencia de respuesta óptima se obtiene resolviendo para todo 𝑞2 ∈ [0,1]:
max
𝑞1
𝜋1 = 𝑞1(1 − 𝑞1 − 𝑞2) 𝑠. 𝑎. ∶ 0 ≤ 𝑞1 ≤ 1
Las CPO son:
𝜕𝜋1
𝑞1
= (1 − 𝑞1 − 𝑞2) − 𝑞1 = 1 − 2𝑞1 − 𝑞2 = 0
∴ 𝑞1
0
= 𝑅1( 𝑞2) =
1 − 𝑞2
2
∈ [0,1]

@JackFlash
Para el Jugador 1, la correspondencia de respuesta óptima se obtiene resolviendo:
max
𝑞2
𝜋1 = 𝑞2(1 − 𝑞1 − 𝑞2) 𝑠. 𝑎. ∶ 0 ≤ 𝑞2 ≤ 1
Las CPO son:
𝜕𝜋2
𝑞2
= 1 − 𝑞1 − 2𝑞2 = 0
∴ 𝑞2
0
= 𝑅2( 𝑞1) =
1 − 𝑞1
2
∈ [0,1]
El(los) equilibrio(s) de Nash se encuentra en el lugar en el cual cada estrategia es una respuesta óptima a la(s)
otra(s). Esto es, el(los) equilibrio(s) de Nash se encuentran en el punto en el cual
𝑞1
0
= 𝑅1( 𝑞2) =
1 − 𝑞2
2
=
1 − 𝑞1
2
= 𝑅2( 𝑞1) = 𝑞2
0

@JackFlash
Es decir, debe resolverse el sistema:
𝑠𝑦𝑠𝑒𝑞( 𝑞1, 𝑞2) == {
𝑞1 =
1 − 𝑞2
2
[1]
𝑞2 =
1 − 𝑞1
2
[2]
De la ecuación [1]:
2𝑞1 = 1 − 𝑞2 → 𝑞2 = 1 − 2𝑞1
Reemplazando en [2]:
1 − 2𝑞1 =
1 − 𝑞1
2
2 − 4𝑞1 = 1 − 𝑞1
∴ 𝑞1
∗
=
1
3

@JackFlash
Reemplazando de nuevo en [2]
2𝑞2 =
2
3
=
2
6
=
1
3
= 𝑞2
∗
Es decir, el conjunto de los Equilibrios de Nash es el perfil de estrategias: ( 𝑞1
∗
, 𝑞2
∗) = (1
3
, 1
3
)

@JackFlash
Equilibrios de Nash (Estrategias Puras):
 El concepto de Equilibrio de Nash es ampliamente atractivo por la versatilidad relativa que ofrece al
en la búsqueda de equilibrio para una amplísima variedad de juegos.
 Es conveniente notar que, en general los conjuntos de equilibrios estudiados bajo los distintos
conceptos-solución al momento son tales que: ED ⊆ EID ⊆ EN
 En general, los equilibrios de Nash dan lugar a pagos que son al menos tan preferibles como los pagos
mínimos garantizados (MinMax) aun cuando en general las estrategias de seguridad no son Equilibrios
de Nash.
 La conducta de seguridad y el comportamiento no cooperativo solo coinciden en juegos
estrictamente competitivos [ Montet & Serra, 2008:66 ]. No obstante, debe esperarse que no
siempre existan equilibrios de Nash en estrategias puras.
 Para probar que un juego tiene al menos un Equilibrio de Nash buscaremos mostrar que el perfil
de estrategias 𝑠∗
= ( 𝑠1
∗
, 𝑠2
∗
, … , 𝑠𝑖−1
∗
, 𝑠𝑖
∗
, 𝑠𝑖+1
∗
, … , 𝑠𝑖
∗) es un equilibrio de Nash si y sólo si 𝑠𝑖
∗
∈
𝑅𝑖( 𝑠−𝑖
∗
), es decir, probar que existe al menos un equilibrio de Nash equivale a probar que existe un
𝑠𝑖
∗
tal que 𝑠𝑖
∗
∈ 𝑅𝑖( 𝑠−𝑖
∗
).

@JackFlash
Existencia de Equilibrios de Nash (Estrategias Puras)
Considere la correspondencia 𝑅: 𝑆 ⇉ 𝑆 definida por el producto cartesiano de los espacios de estrategias
de los 𝑁 jugadores (Cfr. Fundenberg & Tirole, (1992: 6)]
𝑅( 𝑠) = ∏ 𝑅𝑖( 𝑠−𝑖
∗ )
𝑁
𝑖=1
Siendo 𝑆 = ∏ 𝑆𝑖
𝑁
𝑖=1 . En términos vectoriales, esto equivale a poner:
𝑠∗
∈ 𝑅( 𝑠∗)
Es decir, un juego tendrá un Equilibrio de Nash siempre que 𝑅 tenga un punto fijo. Dado que la relación
supra plantea un mapeo punto-conjunto (set to point mapping), el Teorema de Punto Fijo de Kakutani,
que es el instrumento analítico utilizado por JohnNash para mostrar la existencia de este tipo de
equilibrios, es justamente el instrumento a utilizar a los efectos descritos. Una definición detallada de
estos contenidos aparece en [6.], [8.], [11.] y [12]. El teorema de existencia de EN se presenta a
continuación.

@JackFlash
Teorema [Existencia de un Equilibrio de Nash ]: Considere el juego en forma estratégica,
Γ = [𝑁, ( 𝑠𝑖)𝑖=1
𝑁
, ( 𝑢𝑖)𝑖=1
𝑁
]
Se dice que el juego Γ tiene al menos un Equilibrio de Nash si, para todos y cada uno de los 𝑖 = 1, ⋯ , 𝑁
jugadores en el juego:
 El conjunto 𝑆𝑖 de estrategias es un subconjunto compacto y convexo de un Espacio Euclidiano;
 La función de retorno 𝑢𝑖 es continua y estrictamente cuasi-concava en 𝑠𝑖
Demostración: Para todo 𝑖 ∈ 𝑁
 El conjunto 𝑅𝑖( 𝑠−𝑖
∗ ) es no vacío puesto que 𝑢𝑖 es continua y 𝑆𝑖 es compacto;
 Al mismo tiempo, se puede garantizar que 𝑅𝑖( 𝑠−𝑖
∗
) es convexo puesto que 𝑢𝑖 es cuasi cóncava en
𝑆𝑖;
 𝑅 = ∏ 𝑅𝑖𝑖 es hemi-continua superior puesto que 𝑢𝑖 es continua, ∀𝑖 = 1, … , 𝑁
Entonces, por el teorema de Punto Fijo de Kakutani, 𝑅 tiene un punto fijo∎

@JackFlash
Ejemplo: El Duopolio de Cournot
El mercado de una mercancía homogénea está habitado por 𝑛 = 2 firmas que compiten en cantidades.
Sea 𝑞𝑗 la cantidad de mercancía que produce la j-ésima firma. Considere los siguientes supuestos:
 La función inversa de demanda3
correspondiente a la j-ésima firma es decreciente y lineal para todo
𝑞 𝑗 ∈ [0, 𝑎 𝑏⁄ ]
 El coste marginal de la firma 𝑗 es constante y tal que 𝐶𝑀𝑔𝑗 < 𝑎 ∀𝑗 = 1, … , 𝑛
 No hay costos fijos;
 El mercado absorbe cualquier oferta de las firmas.
 En general, el precio de mercado, es tal que
𝑃( 𝑄) = {
𝑎 − 𝑏𝑄 ⟷ 𝑎 > 𝑏𝑄
0 ⟷ 𝑎 ≤ 𝑏𝑄
Donde 𝑏 > 0 y ∑ 𝑞𝑗 = 𝑞1 + 𝑞2 = 𝑄𝑗
3
La función inversa de demanda no es el recíproco de la función de demanda; el termino “inversa” alude al concepto analítico de función inversa. Por consiguiente, dada 𝑞 =
𝑓(𝑝), la función inversa de demanda, que relaciona la cantidad de mercancía 𝑘-ésima con el precio de mercado, 𝑝 𝑘 se expresa como 𝑝 = 𝑓−1(𝑞)∎

@JackFlash
Las funciones de costes relevantes son:
𝐶𝑗(𝑞𝑗) = 𝑐𝑞𝑗, 𝑐 < 𝑎
Mientras que la función de beneficio correspondiente a la firma j viene dada por:
𝜋𝑗(𝑞𝑗, 𝑞−𝑗) = 𝑞 𝑗( 𝑎 − 𝑏𝑄) − 𝑐𝑞𝑗
Esto es:
{
𝜋1( 𝑞1, 𝑞2) = 𝑞1( 𝑎 − 𝑏𝑞1 − 𝑏𝑞2) − 𝑐𝑞1 = 𝑞1( 𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐)
𝜋2( 𝑞1, 𝑞2) = 𝑞2( 𝑎 − 𝑏𝑞1 − 𝑏𝑞2) − 𝑐𝑞2 = 𝑞2( 𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐)
En forma normal, el juego de Cournot cuenta con 𝑁 = 2 jugadores con espacios de estrategias 𝑆1 =
𝑆2 = [0, 𝑎 𝑏⁄ ] y con funciones de pago:
𝑢𝑗(𝑞 𝑗, 𝑞−𝑗) = 𝑞𝑗[𝑎 − (𝑏 ∑ 𝑞𝑗
𝑁
𝑗=1 ) − 𝑐] todo 𝑗 = 1,2

@JackFlash
Para computar el(los) equilibrio(s) de Nash, téngase en cuenta que la respuesta óptima de cada actor a
una acción del otro actor, 𝑅𝑗(𝑠−𝑗), se obtiene de la solución del problema:
max
𝑞 𝑗
𝑢𝑗(𝑞𝑗, 𝑞−𝑗) = 𝑞𝑗[𝑎 − (𝑏 ∑ 𝑞𝑗
𝑁
𝑗=1 ) − 𝑐] sujeta a: 0 ≤ 𝑞𝑗 ≤ 𝑎 𝑏⁄
En el caso de la firma 1:
max
𝑞1
𝑢1( 𝑞1, 𝑞2) = 𝑞1[ 𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] sujeta a: 0 ≤ 𝑞1 ≤ 𝑎 𝑏⁄
CPO:
𝜕𝑢1( 𝑞1, 𝑞2)
𝜕𝑞1
= [ 𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] + 𝑞1(−𝑏) = 0
Esto es,
𝑞1
∗
=
𝑎 − 𝑐 − 𝑏𝑞2
2𝑏
Note que para este problema las C2O: 𝜕2
𝑢1(∙) 𝜕𝑞1
2
= −2𝑏 < 0⁄ por lo que 𝑞1
∗
corresponde a un
máximo, y por tanto, para la firma 1,
𝑞1
∗
≡ 𝑅1( 𝑞2) =
𝑎 − 𝑐 − 𝑏𝑞2
2𝑏

@JackFlash
En lo que respecta a la firma 2, el problema es:
max
𝑞2
𝑢2( 𝑞1, 𝑞2) = 𝑞2[ 𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] sujeta a: 0 ≤ 𝑞2 ≤ 𝑎 𝑏⁄
CPO:
𝜕𝑢2( 𝑞1, 𝑞2)
𝜕𝑞2
= [ 𝑎 − 𝑏𝑞1 − 𝑏𝑞2 − 𝑐] + 𝑞2(−𝑏) = 0
Esto es,
𝑞2
∗
≡ 𝑅2( 𝑞1) =
𝑎 − 𝑐 − 𝑏𝑞1
2𝑏
Suponga que el par ( 𝑞1
∗
, 𝑞2
∗) es un Equilibrio de Nash. Entonces, por el teorema de existencia presentado
supra, 𝑞1
∗
≡ 𝑅1( 𝑞2) y 𝑞2
∗
≡ 𝑅2( 𝑞1). Es decir, es la solución del sistema de ecuaciones:
{
𝑞1
∗
=
𝑎 − 𝑐 − 𝑏𝑞2
2𝑏
𝑞2
∗
=
𝑎 − 𝑐 − 𝑏𝑞1
2𝑏

@JackFlash
Reemplazando la expresión para 𝑞2
∗
en 𝑞1
∗
:
𝑞1
∗
=
𝑎 − 𝑐 − 𝑏 (
𝑎 − 𝑐 − 𝑏𝑞1
2𝑏
)
2𝑏
De donde,
𝑞1
∗
=
𝑎 − 𝑐
3𝑏
Bajo el mismo razonamiento,
𝑞2
∗
=
𝑎 − 𝑐
3𝑏
Y, el conjunto de puntos de equilibrio (de Nash) vendrá dado por:
𝑆 𝐸𝑁
≡ [𝑞1
∗
=
𝑎 − 𝑐
3𝑏
, 𝑞2
∗
=
𝑎 − 𝑐
3𝑏
]

@JackFlash
Dado que la cantidad total de equilibrio ∑ 𝑞𝑗 = 𝑞1 + 𝑞2 = 𝑄𝑗
𝑄∗
= 𝑞1
∗
+ 𝑞2
∗
= 2 ∙
𝑎 − 𝑐
3𝑏
En tanto que el precio de equilibrio viene dado por:
𝑃( 𝑄∗) = 𝑎 − 𝑏𝑄∗
= 𝑎 − 𝑏 (2 ∙
𝑎 − 𝑐
3𝑏
) =
𝑎 + 2𝑐
3
Recuerde que la función de beneficio de la firma j está dada por 𝜋𝑗 = 𝑞𝑗[𝑎 − (𝑏 ∑ 𝑞𝑗
𝑁
𝑗=1 ) − 𝑐]. Luego en el óptimo,
fijando j=1 (el mismo procedimiento aplica a la otra empresa),
𝜋1
∗
= 𝑢1
∗( 𝑞1
∗
, 𝑞2
∗) = 𝑞1
∗
[𝑎 − 𝑏 (
𝑎 − 𝑐
3𝑏
) − 𝑏 (
𝑎 − 𝑐
3𝑏
) − 𝑐] = 𝑞1
∗
[𝑎 −
𝑎 − 𝑐
3
−
𝑎 − 𝑐
3
− 𝑐]
∴ 𝜋1
∗
=
( 𝑎 − 𝑐)2
9𝑏
= 𝜋2
∗
Y el beneficio total en la industria,
Π∗
= 𝜋1
∗
+ 𝜋2
∗
=
( 𝑎 − 𝑐)2
9𝑏
+
( 𝑎 − 𝑐)2
9𝑏
= 2 [
( 𝑎 − 𝑐)2
9𝑏
]
En resumen, el equilibrio en esta industria viene dado por una tupla:
[𝑃∗(𝑄∗); 𝑄∗
(𝑞𝑗
∗
); Π∗
(𝜋𝑗
∗
)]
𝑗=1
𝑁=2
= [(
𝑎 + 2𝑐
3
) ; (
2(𝑎 − 𝑐)
3𝑏
) ; (
2(𝑎 − 𝑐)2
9𝑏
) ]

@JackFlash
Ejemplo: El Oligopolio de Cournot
Extendamos el resultado de Cournot a un número 𝑗 = 1, … , 𝑛 de firmas cada una con un nivel de
producción, 𝑞𝑗. La función inversa de demanda es, como en el caso anterior,
𝑃( 𝑄) = {
𝑎 − 𝑏𝑄 ⟷ 𝑎 > 𝑏𝑄
0 ⟷ 𝑎 ≤ 𝑏𝑄
Con 𝑏 > 0 y ∑ 𝑞𝑗 = 𝑞1 + 𝑞2+, … , +𝑞 𝑛−1 + 𝑞 𝑛 = 𝑄𝑗
La función de costos de la firma j viene dada por:
𝐶𝑗(𝑞𝑗) = 𝑐𝑞 𝑗 𝑐 < 𝑎 ∀𝑗
El beneficio de la firma j es:
𝜋𝑗 = 𝑞𝑗 𝑃( 𝑄) − 𝐶𝑗(𝑞𝑗) = 𝑞𝑗 𝑃(𝑞𝑗 + 𝑄−𝑗) − 𝐶𝑗(𝑞𝑗) = 𝑞𝑗[𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗)] − 𝑐𝑞𝑗
𝜋𝑗 = 𝑞𝑗[𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗) − 𝑐]

@JackFlash
La respuesta óptima de la firma j a una combinación de acciones 𝑞−𝑗 = (𝑞1, … , 𝑞𝑗−1, 𝑞𝑗+1, … , 𝑞 𝑛) es la
solución de
max
𝑞 𝑗
𝜋𝑗 = 𝑞𝑗[𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗) − 𝑐] sujeta a: 𝑞𝑗 ∈ [0, 𝑎
𝑏
]
Las condiciones relevantes para óptimo son:
𝜕𝜋𝑗(𝑞𝑗, 𝑞−𝑗)
𝜕𝑞𝑗
= [𝑎 − 𝑏(𝑞𝑗 + 𝑄−𝑗) − 𝑐] − 𝑏𝑞𝑗 = 0
∴ 𝑎 − 2𝑏𝑞𝑗 − 𝑏𝑄−𝑗 − 𝑐 = 0
La C2O permite verificar la cuasi concavidad (estricta) de 𝜋𝑗 por lo que CPO supone un máximo.
El vector 𝑞∗
= (𝑞1
∗
, 𝑞2
∗
, … , 𝑞 𝑗−1
∗
, 𝑞𝑗
∗
, 𝑞𝑗+1
∗
, … , 𝑞 𝑛
∗
) caracteriza a un Equilibrio de Nash si se verifican:
𝑎 − 2𝑏𝑞𝑗
∗
− 𝑏𝑄−𝑗
∗
− 𝑐 = 0 todo 𝑗 = 1, … , 𝑛

@JackFlash
Es claro (simetría) que 𝑞𝑗
∗
= 𝑞𝑖
∗
, 𝑖 ≠ 𝑗. Además se notará que 𝑏𝑄−𝑗
∗
= 𝑏( 𝑛 − 1) 𝑞𝑗
∗
. Ergo,
∗
− 𝑏𝑄−𝑗
∗
− 𝑐 =
∗
− 𝑏( 𝑛 − 1) 𝑞𝑗
∗
− 𝑐 = 0
2𝑏𝑞𝑗
∗
+ 𝑏( 𝑛 − 1) 𝑞𝑗
∗
= 𝑎 − 𝑐
𝑞𝑗
∗
(2𝑏 + 𝑏( 𝑛 − 1)) = 𝑎 − 𝑐
∴ 𝑞𝑗
∗
=
𝑎 − 𝑐
𝑏( 𝑛 + 1)
∀𝑗
El equilibrio de Nash es el n-vector:
[𝑞1
∗
=
𝑎 − 𝑐
𝑏( 𝑛 + 1)
, … , 𝑞𝑗
∗
=
𝑎 − 𝑐
𝑏( 𝑛 + 1)
, … , 𝑞 𝑛
∗
=
𝑎 − 𝑐
𝑏( 𝑛 + 1)
]

@JackFlash
La cantidad total de mercancía en el equilibrio, es:
𝑄∗
= ∑ (
𝑎 − 𝑐
𝑏( 𝑛 + 1)
)
𝑛
𝑗=1
= 𝑛 (
𝑎 − 𝑐
𝑏( 𝑛 + 1)
)
Los precios de equilibrio,
𝑃( 𝑄∗) = 𝑎 − 𝑏 [𝑛 (
𝑎 − 𝑐
𝑏( 𝑛 + 1)
)] =
𝑎 + 𝑛𝑐
𝑛 + 1
El beneficio individual de equilibrio:
𝜋𝑗
∗
≡ 𝑢𝑗
∗
= 𝑞𝑗
∗
(𝑎 − 𝑏(𝑞𝑗
∗
+ 𝑄−𝑗
∗
) − 𝑐)
= 𝑞𝑗
∗
(𝑎 − 𝑏 (𝑛 (
𝑎 − 𝑐
𝑏( 𝑛 + 1)
)) − 𝑐) = 𝑞𝑗
∗
(𝑎 − 𝑛
𝑎 − 𝑐
𝑛 + 1
− 𝑐)
∴ 𝜋𝑗
∗
=
( 𝑎 − 𝑐)2
𝑏( 𝑛 + 1)2
∀= 1, … , 𝑛
Y el beneficio de equilibrio agregado,
Π∗
= ∑ 𝜋𝑗
∗
𝑛
𝑗=1
= ∑
( 𝑎 − 𝑐)2
𝑏( 𝑛 + 1)2
= 𝑛 [
( 𝑎 − 𝑐)2
𝑏( 𝑛 + 1)2
]
𝑛
𝑗=1
∎

@JackFlash
Ejemplo: El Modelo de Bertrand - Productos Homogéneos4
Contrario a la opinión de Agustín Cournot, el matemático francés Joseph Louis François Bertrand (1822-
1900) creía que las firmas utilizaban precios (en lugar de cantidades) para ajustar a la demanda de
mercado.
En el modelo de Bertrand las firmas compiten en precios y venden toda la producción que puedan poner
en el mercado y que los demandantes quieran comprar a ese precio.
Considere una economía con j = {1, 2} firmas que producen un cierto bien y cuya estrategia de
competencia es la modificación de los precios a los que participan en el mercado relevante.
Sea 𝑞( 𝑝) la función de demanda de mercado del producto. Entonces:
 El consumidor compra al precio más bajo siendo indiferente entre quienes venden el producto si
las firmas tienen el mismo precio;
 𝑞( 𝑝) es monótona decreciente en 𝑝 ∈ [0, 𝑝𝑐)
 𝑞( 𝑝) = 0 si 𝑝 ≥ 𝑝𝑐
 El proceso fabril de las dos firmas se caracteriza por funciones de costes idénticas (sin coste fijo) y
con costes marginales constantes 𝑐
 Sea 𝑝 𝑀 el precio de monopolio de la mercancía. Entonces vale 0 < 𝑐 < 𝑝 𝑀 < 𝑝𝑐
4
Cfr. Pérez, Jimeno & Cerdá (2004): 119-122.

@JackFlash
La demanda que enfrenta la j-ésima firma está segmentada en función de la relación que mantiene el
precio ofrecido por ella con el precio de la firma rival.
𝑞𝑗(𝑝𝑗, 𝑝𝑖) =
{
0 ⟷ 𝑝𝑗 > 𝑝𝑖
𝑞(𝑝𝑗) ⟷ 𝑝𝑗 < 𝑝𝑖
𝑞(𝑝𝑗) 2⁄ ⟷ 𝑝𝑗 = 𝑝𝑖
Las funciones de costes son:
𝐶𝑗(𝑞𝑗) = 𝑐𝑞𝑗 ∀𝑗
Y los beneficios:
𝜋𝑗(𝑝𝑗, 𝑝𝑖) =
{
0 ⟷ 𝑝𝑗 > 𝑝𝑖
(𝑝𝑗 − 𝑐) ∙ 𝑞(𝑝𝑗) ⟷ 𝑝𝑗 > 𝑝𝑖
(𝑝𝑗 − 𝑐) ∙ 𝑞(𝑝𝑗) 2⁄ ⟷ 𝑝𝑗 = 𝑝𝑖

@JackFlash
En el modelo de Bertrand, un Equilibrio de Nash es un vector de precios 𝑝∗
= (𝑝𝑗
∗
, 𝑝𝑖
∗
) al cual el precio
fijado por la j-ésima firma es la reporta el mayor beneficio, dado el precio de la firma rival, i.e.,
𝑢𝑗(𝑝𝑗
∗
, 𝑝𝑖
∗
) ≥ 𝑢𝑗(𝑝𝑗, 𝑝𝑖
∗
) ∀𝑗 = 1,2; ∀𝑝𝑗 ∈ 𝑆𝑗
La discontinuidad de la demanda de mercado es heredada por la función de beneficio de cada una de las
firmas razón por la cual, las funciones de respuesta óptima 𝑅𝑗(𝑠−𝑗) no pueden ser derivadas usando el
cálculo.
A la sazón una caracterización del equilibrio para este juego consiste en estudiar diferentes puntos
candidatos a equilibrio y estudiar su estabilidad relativa, i.e., “considerar todas las situaciones (de equilibrio)
posibles y descartar aquellas que no cumplan con nuestra definición(es decir descartar aquellas situaciones en las que alguna
empresa pudiera conseguir un beneficio mayor alterando la situación mediante el cambio de su precio)” (Pérez, Jimeno
& Cerdá, 2008: 120). Las situaciones a las que las firmas involucradas se enfrentan, son las siguientes:
i. 𝑝𝑗
∗
> 𝑝𝑖
∗
= 𝑐. El precio de las firmas es diferente; el precio de la firma rival se fija al coste marginal;
ii. 𝑝𝑗
∗
> 𝑝𝑖
∗
> 𝑐. El precio de las firma es distinto y mayor que el coste marginal;
iii. 𝑝𝑗
∗
= 𝑝𝑖
∗
> 𝑐. Los precios de las dos firmas son iguales y mayores que el coste marginal;
iv. 𝑝𝑗
∗
= 𝑝𝑖
∗
= 𝑐. Los precios de las dos firmas son iguales e iguales al coste marginal;

@JackFlash
De acuerdo con estas posibilidades, valórense los beneficios de las firmas, según el caso:
Caso i: 𝑝𝑗
∗
> 𝑝𝑖
∗
= 𝑐. En este caso, los beneficios son:
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = {
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 𝑞( 𝑝𝑖
∗)( 𝑝𝑖
∗
− 𝑐) = 𝑞( 𝑐)( 𝑐 − 𝑐) = 0
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 0
Suponga, sin embargo, que la firma i elige un precio distinto y superior al costo marginal 𝑐 pero aún
inferior al precio de la otra firma, e.g. 𝑝𝑖
′
= 𝑝𝑗
∗
− 𝜖 > 𝑐. En este caso, los beneficios de la firma i son:
𝑢𝑖(𝑝𝑖
′
, 𝑝𝑗
∗
) = 𝑞( 𝑝𝑖
′
)( 𝑝𝑖
′
− 𝑐) > 0
i.e.., La firma tiene incentivos para desviarse de la situación inicial propuesta y, consecuentemente este
caso no constituye un Equilibrio de Nash.

@JackFlash
Caso ii: 𝑝𝑗
∗
> 𝑝𝑖
∗
> 𝑐. El precio de las firmas es distinto y mayor que el coste marginal. En este escenario
los beneficios de las firmas son
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = {
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 𝑞( 𝑝𝑖
∗)( 𝑝𝑖
∗
− 𝑐) = 𝑞( 𝑝𝑖
∗)( 𝑝𝑖
∗
− 𝑐) > 0
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 0
Puesto que 𝑝𝑗
∗
> 𝑝𝑖
∗
, el beneficio para la firma j es cero. No obstante suponga que esta firma reduce su
precio en una cantidad 𝜖 de modo que el nuevo precio sea igual al precio de la otra firma, menos una
cantidad determinada 𝑝𝑗
′
= ( 𝑝𝑖
∗
− 𝜖) > 𝑐, entonces, el beneficio para esta firma es:
𝑢𝑗(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 𝑞(𝑝𝑗
′
)(𝑝𝑗
′
− 𝑐) = 𝑞(𝑝𝑗
′
) (𝑝𝑖
∗
− 𝜖⏟
>𝑐
− 𝑐) > 0
Al adoptar esta estrategia la firma j obtendría beneficio positivo, situación que involucra un incentivo
para desviarse de esta situación y, por tanto, no constituye un Equilibrio de Nash.

@JackFlash
Caso iii: Los precios de las dos firmas son iguales y mayores que el coste marginal, i.e. 𝑝𝑗
∗
= 𝑝𝑖
∗
> 𝑐. Los
beneficios de las firmas, en esta situación, son:
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = {
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 𝑞( 𝑝𝑖
∗
)( 𝑝𝑖
∗
− 𝑐) 2⁄ > 0
𝑢𝑗(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 𝑞(𝑝𝑗
∗
)(𝑝𝑗
∗
− 𝑐) 2⁄ > 0
En este caso, las firmas obtienen un beneficio estrictamente positivo si bien se reparten el mercado entre
los dos. Note además que si cualquier firma reduce su precio por debajo del de la otra firma, se queda
con todo el mercado duplicando prácticamente su beneficio. En efecto, suponga que:
𝑝𝑖
′
= 𝑝𝑖
∗
− 𝜖 < 𝑝𝑗
∗
con 𝑝𝑖
′
> 𝑐
En este caso,
𝑢𝑖(𝑝𝑖
′
, 𝑝𝑗
∗
) = 𝑞( 𝑝𝑖
∗
− 𝜖)( 𝑝𝑖
∗
− 𝜖 − 𝑐) ≈ 2𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) > 𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
)
Por consiguiente, cualquiera de las dos firmas tiene incentivos para fijar un precio inferior al de su rival,
siendo este un equilibrio inestable, i.e., una situación de no Equilibrio de Nash.

@JackFlash
Caso iv: 𝑝𝑗
∗
= 𝑝𝑖
∗
= 𝑐. Los precios de las dos firmas son iguales entre si e iguales al coste marginal. En
este caso, los beneficios de las firmas son:
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = {
𝑢𝑖(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 𝑞( 𝑝𝑖
∗
)( 𝑝𝑖
∗
− 𝑐) = 𝑞( 𝑐)( 𝑐 − 𝑐) = 0
𝑢𝑗(𝑝𝑖
∗
, 𝑝𝑗
∗
) = 𝑞(𝑝𝑗
∗
)(𝑝𝑗
∗
− 𝑐) = 𝑞( 𝑐)( 𝑐 − 𝑐) = 0
Esto es, ninguna de las firmas observa rentas no competitivas y ninguna de ellas tiene incentivo para
desviarse de esta situación (compruebe que es así) que se constituye en el Equilibrio de Nash.

@JackFlash
En términos de funciones de reacción (correspondencias de respuesta óptima):
 Si el precio fijado por la firma i, 𝑝𝑖 es menor que el costo marginal, 𝑐 cualquier respuesta 𝑝𝑗 > 𝑝𝑖
es óptima pues implica beneficios nulos, en contraste con respuestas 𝑝𝑗 ≤ 𝑝𝑖 , que implican
beneficio negativo (pérdida).
 Si el precio fijado por la firma i, 𝑝𝑖 es igual al costo marginal, 𝑐 cualquier respuesta 𝑝𝑗 ≥ 𝑝𝑖 es
óptima pues implica beneficios nulos, en contraste con respuestas 𝑝𝑗 < 𝑐, que implican beneficio
negativo (pérdida).
 Si el precio fijado por la firma i, 𝑝𝑖 es igual al costo marginal, 𝑐 pero menor o igual al precio de
monopolio 𝑝 𝑀 no existe una respuesta 𝑝𝑗 óptima a la estrategia 𝑝𝑖:
o Mientras 𝑝𝑗 se aproxima desde abajo a 𝑝𝑖, el beneficio de la firma j se aproxima a la que supone
el precio de monopolio 𝑝 𝑀.
o Sin embargo, cuando 𝑝𝑗=𝑝𝑖, el beneficio salta a la mitad (los dos individuos se reparten el
mercado),
o Si, 𝑝𝑗 sigue aumentando por encima de 𝑝𝑖, el beneficio salta a cero.
Claramente, dado el precio de la otra firma, siempre es mejor fijar un precio ligeramente inferior, pero
nunca óptimo.
 Si el precio fijado por la firma i, 𝑝𝑖 es mayor que el precio de monopolio, 𝑝 𝑀, la respuesta 𝑝𝑗 = 𝑝 𝑀
es la única respuesta óptima, pues proporciona el máximo beneficio.

@JackFlash
Adaptado de PJC (2004: 123)

@JackFlash
Final Remark (Bertrand)
La solución para el juego de Bertrand es un equilibrio de Nash que coincide con un equilibrio en
estrategias débilmente dominadas.
Para la firma j-ésima la estrategia 𝑝𝑗
∗
= 𝑐 está débilmente dominada por cualquier otra estrategia 𝑝𝑗
∗
> 𝑐
tal que 𝑞(𝑝𝑗
∗
) > 0 pues:
 Daría lugar a beneficios estrictamente positivos si 𝑝𝑖
∗
≥ 𝑝𝑗
∗
, pero
 Daría lugar a beneficios nulos si 𝑝𝑖
∗
< 𝑝𝑗
∗

@JackFlash
Equilibrios de Nash (Estrategias Mixtas):
No todo juego finito tiene un Equilibrio de Nash por Solución. Considere, por ejemplo, el Juego del
Lanzamiento de las Monedas:
Jugador 2
Cara Sello
Jugador 1
Cara 1, -1 -1, 1
Sello -1, 1 1, -1
Considerando correspondencias de respuesta óptima, al Jugador 1 le resulta conveniente responder a
cualquier estrategia del Jugador 2 con la misma estrategia en tanto que al Jugador 2, le resulta más
rentable, dada cualquier estrategia del Jugador 1, elegir la estrategia opuesta. Las correspondencias de
respuesta óptima son,
 Jugador 1: 𝑅1( 𝑠2) = 𝑠2, i.e., 𝑅1( 𝐶𝑎𝑟𝑎) = 𝐶𝑎𝑟𝑎 ; 𝑅2( 𝑆𝑒𝑙𝑙𝑜) = 𝑆𝑒𝑙𝑙𝑜
 Jugador 2: 𝑅2( 𝑠1) = −𝑠1, i.e., 𝑅2( 𝐶𝑎𝑟𝑎) = 𝑆𝑒𝑙𝑙𝑜 ; 𝑅2( 𝑆𝑒𝑙𝑙𝑜) = 𝐶𝑎𝑟𝑎
Es decir, no hay perfiles de estrategias puras en las que cada una de ella sea respuesta óptima de la otra.

@JackFlash
Equilibrios de Nash (Estrategias Mixtas):
El juego de las monedas, se sabe que tiene una solución MaxiMin (Von Neumann-Morgenstern) en
estrategias mixtas, dada una aleatorización de la conducta del jugador que ahora se representa como un
individuo que no elige únicamente estrategias puras, sino loterías sobre los conjuntos de estrategias
(puras) que pueden generar para él un perfil dado de estrategias: En el juego de las monedas el Jugador
1 puede Jugar Cara con probabilidad 0.25 y Jugar Sello con probabilidad 0.75.
Definición. Estrategias Mixtas (PJCerdá [2006]: 146)
Volvamos sobre la definición de Estrategias Mixtas presentada en la p.4 supra:
Sea 𝑆𝑖 = {𝑠𝑖
1
, 𝑠𝑖
2
, ⋯ , 𝑠𝑖
𝑘
} el conjunto de estrategias puras del i-ésimo jugador. Entonces, una estrategia
mixta para este jugador es una lotería —es decir una distribución de probabilidades—, 𝜎𝑖 =
(𝜎𝑖
1
, 𝜎𝑖
2
, ⋯ , 𝜎𝑖
𝑘
) sobre los elementos de 𝑆𝑖 esto es, a cada distribución de probabilidades sobre 𝑆𝑖 =
{𝑠𝑖
1
, 𝑠𝑖
2
, ⋯ , 𝑠𝑖
𝑘
}, donde los elementos de 𝜎𝑖 son todos no negativos y suman 1

@JackFlash
Al conjunto de las estrategias mixtas del i-ésimo jugador se notará con Δ( 𝑆𝑖) que se define como:
Δ( 𝑆𝑖) = {𝜎𝑖 = (𝜎𝑖
1
, 𝜎𝑖
2
, ⋯ , 𝜎𝑖
𝑘
): 𝜎𝑖
𝑗
≥ 0, ∀𝑗 = 1,2,3, … , 𝑘 𝑦 ∑ 𝜎𝑖
𝑗
= 1
𝑘
𝑗=1
}
 Toda estrategia pura es una estrategia mixta: Bajo este tipo de definición una estrategia mixta da
probabilidad 1 a una única estrategia y cero a las demás. La estrategia pura 𝑠𝑖
𝑗
es entonces
susceptible de ser identificada con la estrategia mixta 𝜎𝑖 = (0, 0, ⋯ ,1, ⋯ ,0,0) siendo 1 la j-ésima
estrategia pura.
 Para cada estrategia mixta es posible identificar y distinguir al conjunto de estrategias puras que
reciben probabilidad estrictamente positiva. Este subconjunto recibe el nombre de Soporte de dicha
estrategia (mixta).

@JackFlash
Definición.— Soporte de una Estrategia Mixta
Sea 𝑆𝑖 = {𝑠𝑖
1
, 𝑠𝑖
2
, ⋯ , 𝑠𝑖
𝑘
} el conjunto de estrategias puras del i-ésimo jugador. Entonces, el soporte de
una estrategia mixta 𝜎𝑖 es el subconjunto de estrategias puras, al cual 𝜎𝑖 asigna probabilidades
positivas, i.e.
𝑠𝑢𝑝𝑝( 𝜎𝑖 ) = {𝑠𝑖
𝑘
∈ 𝑆𝑖 ∶ 𝜎𝑖(𝑠𝑖
𝑘
) > 0 }
 El soporte de una estrategia mixta 𝜎𝑖, 𝑠𝑢𝑝𝑝( 𝜎𝑖 ) ⊆ 𝑆𝑖 tal que 𝑠𝑖
𝑗
∈ 𝑠𝑢𝑝𝑝( 𝜎𝑖 ) ⟷ 𝜎𝑖
𝑗
> 0.
 Se dirá que la estrategia mixta 𝜎𝑖 es una estrategia mixta completa si dicha estrategia coincide con
el conjunto de estrategias puras del jugador, es decir, 𝑠𝑢𝑝𝑝( 𝜎𝑖 ) = 𝑆𝑖.
 Una estrategia mixta es completa si asigna una probabilidad estrictamente positiva a cada estrategia
pura de 𝑆𝑖
 Toda estrategia pura es una estrategia mixta de soporte unitario, i.e., un soporte de un único
elemento.
 Toda estrategia mixta no pura (de soporte no unitario) se denomina estrategia mixta propia.

@JackFlash
Ejemplo ( PJC: 147 ) Sea el siguiente juego:
Jugador 2
Izquierda Derecha
Jugador 1
Arriba 3, 2 1, 4
Centro 1, 3 2, 1
Abajo 2, 2 2, 0
 Los conjuntos de estrategias puras son: {
𝑆1 = [ 𝐴, 𝐶, 𝐵]
𝑆2 = [ 𝐼, 𝐷]
 Una estrategia mixta para el Jugador 1 puede ser una distribución 𝜎1 = { 𝑝, 𝑞, 1 − 𝑝 − 𝑞} donde 𝑝
es la probabilidad de elegir Arriba, 𝑞 es la probabilidad de elegir C, y Abajo se elige con probabilidad
1 − 𝑝 − 𝑞.
 Una estrategia mixta para el Jugador 2 puede ser una distribución 𝜎2 = { 𝑟, 1 − 𝑟} con 𝑟 siendo la
probabilidad de jugar Izquierda mientras que la estrategia Derecha se juega con probabilidad (1 − 𝑟).

@JackFlash
 Para el Jugador 1, toda estrategia mixta en la que 𝑝 > 0, 𝑞 > 0, 1 − 𝑝 − 𝑞 > 0 tendrá un conjunto
soporte 𝑠𝑢𝑝𝑝( 𝜎1 ) igual al número de estrategias puras siendo así una estrategia mixta completa.
 Una estrategia mixta completa para este jugador es (1
2
, 1
4
,
1
4
), en donde jugar 𝐴 tiene probabilidad 1
2
,
jugar 𝐶 tiene probabilidad 1
4
, y jugar 𝐵 tiene probabilidad 1
4
tiene un conjunto soporte que coincide
con el conjunto de estrategias puras, 𝑆1: 𝑠𝑢𝑝𝑝(1
2
, 1
4
,
1
4
).
 En contraste, si una estrategia mixta para el jugador 1 es una lotería (0, 1
3
,
2
3
) esta no puede entenderse
como una estrategia mixta completa porque asigna probabilidad 0 a la estrategia pura 𝐴, y su
soporte es un subconjunto propio de 𝑆1: 𝑠𝑢𝑝𝑝(0, 1
3
,
2
3
) = { 𝐵, 𝐶};
 Las estrategias puras { 𝐴, 𝐵, 𝐶} pueden entenderse como las estrategias mixtas:
(1,0,0), (0,1,0), (0,0,1).
 Bajo estrategias mixtas las funciones de pago dejan de ser determinísticas para tornarse en aleatorias;
 Bajo estrategias mixtas, las funciones de pago dejan de ser ordinales.

@JackFlash
Ejemplo: Matching Pennies.— Suponga de nuevo el juego de las monedas. En este caso 𝑆1 = 𝑆2 =
( 𝐶𝑎𝑟𝑎 𝑆𝑒𝑙𝑙𝑜) con pagos:
Jugador 2
Cara Sello
Jugador 1
Cara 1, -1 -1, 1
Sello -1, 1 1, -1
Sean 𝜎1 = ( 𝑝, 1 − 𝑝) y 𝜎2 = ( 𝑞, 1 − 𝑞). Entonces, los pagos esperados para cada jugador son:
 𝑈1(( 𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑝𝑢1( 𝐶𝑎𝑟𝑎, 𝐶𝑎𝑟𝑎) + (1 − 𝑝) 𝑢1( 𝑆𝑒𝑙𝑙𝑜, 𝐶𝑎𝑟𝑎) = 𝑝(1) + (1 −
𝑝)(−1) = 𝑝 − 1 + 𝑝 = 2𝑝 − 1
 𝑈2(( 𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑝𝑢2( 𝐶𝑎𝑟𝑎, 𝐶𝑎𝑟𝑎) + (1 − 𝑝) 𝑢2( 𝑆𝑒𝑙𝑙𝑜, 𝐶𝑎𝑟𝑎) = 𝑝(−1) + (1 −
𝑝)(1) = −𝑝 + 1 − 𝑝 = 1 − 2𝑝
En tanto que:
 𝑈1(( 𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) = 𝑝𝑢1( 𝐶𝑎𝑟𝑎, 𝑆𝑒𝑙𝑙𝑜) + (1 − 𝑝) 𝑢1( 𝑆𝑒𝑙𝑙𝑜, 𝑆𝑒𝑙𝑙𝑜) = 𝑝(−1) + (1 −
𝑝)(1) = −𝑝 + 1 − 𝑝 = 1 − 2𝑝
 𝑈2(( 𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) = 𝑝𝑢2( 𝐶𝑎𝑟𝑎, 𝑆𝑒𝑙𝑙𝑜) + (1 − 𝑝) 𝑢2( 𝑆𝑒𝑙𝑙𝑜, 𝑆𝑒𝑙𝑙𝑜) = 𝑝(1) + (1 −
𝑝)(−1) = 𝑝 + 1 + 𝑝 = 2𝑝 − 1

@JackFlash
Los pagos esperados al combinar las dos estrategias mixtas son:
𝑈1[ 𝜎1, 𝜎2] = 𝑈1[( 𝑝, 1 − 𝑝) , ( 𝑞, 1 − 𝑞)] = 𝑞𝑈1(( 𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) + (1 − 𝑞) 𝑈1(( 𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜)
= 𝑞(2𝑝 − 1) + (1 − 𝑞)(1 − 2𝑝) = 1 − 2𝑝 − 2𝑞 + 4𝑝𝑞
𝑈2[ 𝜎1, 𝜎2] = 𝑈2[( 𝑝, 1 − 𝑝) , ( 𝑞, 1 − 𝑞)]
= 𝑝 ∙ 𝑞(−1) + (1 − 𝑝) ∙ 𝑞 ∙ (1) + 𝑝 ∙ (1 − 𝑞)(1) + (1 − 𝑝) ∙ (1 − 𝑞)(−1)
= −1 + 2𝑝 + 2𝑞 − 4𝑝𝑞
Suponga ex post que se tienen los siguientes pares de estrategias: ((1 3⁄ , 2 3⁄ ), 𝐶𝑎𝑟𝑎) y
((1 3⁄ , 2 3⁄ ), (4 5⁄ , 1 5⁄ ))
Ejercicio: Cuáles son las ganancias esperadas de los jugadores 1¸y 2 en cada caso?

@JackFlash
Utilidad Esperada en Juegos Bi-persona
Sea Γ un juego con dos jugadores cuyos conjuntos de estrategias puras son:
𝑆1 = { 𝑠1
1
, 𝑠1
2
, … , 𝑠1
𝑚} y 𝑆2 = { 𝑠2
1
, 𝑠2
2
, … , 𝑠2
𝑛}
Sea además la estrategia mixta: 𝜎2 = { 𝜎2
1
, 𝜎2
2
, … , 𝜎2
𝑛}
Si el jugador 1 juega 𝑠1
𝑖
y el jugador 2 juega 𝜎2 las ganancias esperadas para cada jugador serán:
𝑈1(𝑠1
𝑖
, 𝜎2) = 𝜎2
1
𝑢1(𝑠1
𝑖
, 𝑠2
1
) + 𝜎2
2
𝑢1(𝑠1
𝑖
, 𝑠2
2
) + ⋯ + 𝜎2
𝑛
𝑢1(𝑠1
𝑖
, 𝑠2
𝑛
) = ∑ 𝜎2
𝑗
𝑢1(𝑠1
𝑖
, 𝑠2
𝑗
)
𝑛
𝑗=1
𝑈2(𝑠1
𝑖
, 𝜎2) = 𝜎2
1
𝑢2(𝑠1
𝑖
, 𝑠2
1
) + 𝜎2
2
𝑢2(𝑠1
𝑖
, 𝑠2
2
) + ⋯ + 𝜎2
𝑛
𝑢2(𝑠1
𝑖
, 𝑠2
𝑛
) = ∑ 𝜎2
𝑗
𝑢2(𝑠1
𝑖
, 𝑠2
𝑗
)
𝑛
𝑗=1

@JackFlash
Suponga que el jugador 1 ahora juega 𝜎1 = { 𝜎1
1
, 𝜎1
2
, … , 𝜎1
𝑚} y el jugador 2 juega 𝜎2 = { 𝜎2
1
, 𝜎2
2
, … , 𝜎2
𝑛},
las ganancias esperadas serán:
𝑈1( 𝜎1, 𝜎2) = 𝜎1
1
𝑈1( 𝑠1
1
, 𝜎2) + 𝜎1
2
𝑈1( 𝑠1
2
, 𝜎2) + ⋯ + 𝜎1
𝑚
𝑈1( 𝑠1
𝑚
, 𝜎2) =
= 𝜎1
1
∑ 𝜎2
𝑗
𝑢1(𝑠1
1
, 𝑠2
𝑗
)
𝑛
𝑗=1
+ 𝜎1
2
∑ 𝜎2
𝑗
𝑢1(𝑠1
2
, 𝑠2
𝑗
)
𝑛
𝑗=1
+ ⋯ + 𝜎1
𝑚
∑ 𝜎2
𝑗
𝑢1(𝑠1
𝑚
, 𝑠2
𝑗
)
𝑛
𝑗=1
= ∑ 𝜎1
𝑖
(∑ 𝜎2
𝑗
𝑢1(𝑠1
𝑖
, 𝑠2
𝑗
)
𝑛
𝑗=1
)
𝑚
𝑖=1
= ∑ ∑ 𝜎1
𝑖
𝜎2
𝑗
𝑢1(𝑠1
𝑖
, 𝑠2
𝑗
)
𝑛
𝑗=1
𝑚
𝑖=1
En tanto que para el Jugador 2:
𝑈2( 𝜎1, 𝜎2) = 𝜎1
1
𝑈2( 𝑠1
1
, 𝜎2) + 𝜎1
2
𝑈2( 𝑠1
2
, 𝜎2) + ⋯ + 𝜎1
𝑚
𝑈2( 𝑠1
𝑚
, 𝜎2) =
= 𝜎1
1
∑ 𝜎2
𝑗
𝑢1(𝑠1
1
, 𝑠2
𝑗
)
𝑛
𝑗=1
+ 𝜎1
2
∑ 𝜎2
𝑗
𝑢2(𝑠1
2
, 𝑠2
𝑗
)
𝑛
𝑗=1
+ ⋯ + 𝜎1
𝑚
∑ 𝜎2
𝑗
𝑢2(𝑠1
𝑚
, 𝑠2
𝑗
)
𝑛
𝑗=1
= ∑ 𝜎1
𝑖
(∑ 𝜎2
𝑗
𝑢2(𝑠1
𝑖
, 𝑠2
𝑗
)
𝑛
𝑗=1
)
𝑚
𝑖=1
= ∑ ∑ 𝜎1
𝑖
𝜎2
𝑗
𝑢2(𝑠1
𝑖
, 𝑠2
𝑗
)
𝑛
𝑗=1
𝑚
𝑖=1

@JackFlash
Las Ganancias Esperadas en Forma Matricial:
Considere un juego Γ con estrategias puras 𝑆1 = { 𝑠1
1
, 𝑠1
2
, … , 𝑠1
𝑚} y 𝑆2 = { 𝑠2
1
, 𝑠2
2
, … , 𝑠2
𝑛} , y con
estrategias mixtas 𝜎1 = { 𝜎1
1
, 𝜎1
2
, … , 𝜎1
𝑚} y 𝜎2 = { 𝜎2
1
, 𝜎2
2
, … , 𝜎2
𝑛}. En tonces, la representación en forma
estratégicas es:
Jugador 2
𝑠2
1
𝑠2
1 … 𝑠2
𝑛
Jugador 1 𝑠1
1
𝑢1(𝑠1
1
, 𝑠2
1), 𝑢2(𝑠1
1
, 𝑠2
1) 𝑢1(𝑠1
1
, 𝑠2
2), 𝑢2(𝑠1
1
, 𝑠2
2) … 𝑢1(𝑠1
1
, 𝑠2
𝑛), 𝑢2(𝑠1
1
, 𝑠2
𝑛)
𝑠1
2
𝑢1(𝑠1
2
, 𝑠2
1), 𝑢2(𝑠1
2
, 𝑠2
1) 𝑢1(𝑠1
´2
, 𝑠2
2
), 𝑢2(𝑠1
2
, 𝑠2
2) … 𝑢1(𝑠1
2
, 𝑠2
𝑛), 𝑢2(𝑠1
2
, 𝑠2
𝑛)
… … … … …
𝑠1
𝑚
𝑢1(𝑠1
𝑚
, 𝑠2
1), 𝑢2(𝑠1
𝑚
, 𝑠2
1) 𝑢1(𝑠1
𝑚
, 𝑠2
2), 𝑢2(𝑠1
𝑚
, 𝑠2
2) … 𝑢1(𝑠1
𝑚
, 𝑠2
𝑛), 𝑢2(𝑠1
𝑚
, 𝑠2
𝑛)
Sean: 𝐴1 = ( 𝑢1( 𝑠1
𝑖
, 𝑠2
𝑗
)) y 𝐴2 = ( 𝑢2( 𝑠1
𝑖
, 𝑠2
𝑗
)), que corresponden respectivamente a las submatrices de
ganancias del Jugador 1 y del Jugador 2. Entonces, la ganancia esperada de cada jugador, dadas las
estrategias mixtas 𝜎1 y 𝜎2, son:
𝑈1 = 𝜎1 𝐴1 𝜎2 y 𝑈2=𝜎1 𝐴2 𝜎2
Donde las matrices involucradas son todas conformables para multiplicación.

@JackFlash
Ejemplo (PJC, 2004: 150~): Considere de nuevo el juego,
Jugador 2
Izquierda Derecha
Jugador 1
Arriba 3, 2 1, 4
Centro 1, 3 2, 1
Abajo 2, 2 2, 0
i. Sean 𝜎1 = {2 3⁄ , 1 6⁄ , 1 6⁄ } y 𝜎2 = {1 3⁄ , 2 3⁄ }. Entonces, dadas:
𝐴1 = (
3 1
1 2
2 2
) y 𝐴2 = (
2 4
3 1
2 0
)
Las ganancias esperadas de jugar las estrategias mixtas propuestas para cada jugador son:
𝑈1 = 𝜎1 𝐴1 𝜎2
𝑇
= (2 3⁄ , 1 6⁄ , 1 6⁄ ) (
3 1
1 2
2 2
) (
1 3⁄
1 3⁄
) = 31 18⁄

@JackFlash
𝑈2 = 𝜎1 𝐴2 𝜎2
𝑇
= (2 3⁄ , 1 6⁄ , 1 6⁄ ) (
2 4
3 1
2 0
) (
1 3⁄
1 3⁄
) = 47 18⁄
ii. Considere ahora el siguiente par de estrategias: 𝜎1 = (2 3⁄ , 1 6⁄ , 1 6⁄ ) y 𝑠2 = 𝐼𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎.
¿Cuáles son las utilidades esperadas de los Jugadores?
𝑈1( 𝜎1, 𝜎2) = 𝜎1 𝐴1 𝜎2
𝑇
= (2 3⁄ , 1 6⁄ , 1 6⁄ ) (
3 1
1 2
2 2
) (
1
0
) = (5 2⁄ 4 3⁄ ) (
1
0
) = 5 2⁄
𝑈2( 𝜎1, 𝜎2) = 𝜎1 𝐴2 𝜎2
𝑇
= (2 3⁄ , 1 6⁄ , 1 6⁄ ) (
2 4
3 1
2 0
) (
1
0
) = (13 6⁄ 17 6⁄ ) (
1
0
) = 31 6⁄

@JackFlash
Definición: Equilibrio de Nash en Estrategias Mixtas:
Sea el Juego Γ = [ 𝑁; 𝑆1, … , 𝑆 𝑁; 𝑢1, … , 𝑢 𝑁]. Entonces, se dice que el perfil de estrategias mixtas 𝜎∗
=
( 𝜎1
∗
, … , 𝜎𝑖
∗
, … , 𝜎 𝑁
∗ ) es un Equilibrio de Nash (en estrategias mixtas), si para todo 𝑖 = 1,2, … , 𝑁
𝑈𝑖( 𝜎1
∗
, … , 𝜎𝑖−1
∗
, 𝜎𝑖
∗
, 𝜎𝑖+1
∗
, … , 𝜎 𝑁
∗ ) ≥ 𝑈𝑖( 𝜎1
∗
, … , 𝜎𝑖−1
∗
, 𝜎𝑖, 𝜎𝑖+1
∗
, … , 𝜎 𝑁
∗ )
Para todo 𝜎𝑖 ∈ Δ( 𝑆𝑖) = {𝜎𝑖 = (𝜎𝑖
1
, 𝜎𝑖
2
, ⋯ , 𝜎𝑖
𝑘
): 𝜎𝑖
𝑗
≥ 0, ∀𝑗 = 1,2,3, … , 𝑘 𝑦 ∑ 𝜎𝑖
𝑗
= 1𝑘
𝑗=1 }
Esto es, si para todo 𝑖 = 1,2, … , 𝑁 resulta que:
𝜎𝑖
∗
= argmax
𝜎𝑖
{ 𝑈𝑖( 𝜎1
∗
, … , 𝜎𝑖−1
∗
, 𝜎𝑖, 𝜎𝑖+1
∗
, … , 𝜎 𝑁
∗ )}
O sea, cuando para cada uno de los 𝑖 = 1,2, … , 𝑁 jugadores 𝜎𝑖
∗
es respuesta óptima a 𝜎−𝑖
∗
Observación: El pago esperado de una estrategia mixta de un jugador, dadas las estrategias de los demás
jugadores, es una combinación convexa de los pagos de las estrategias puras soporte de esa estrategia mixta:
luego la ganancia esperada de una estrategia mixta debe estar entre las ganancias máxima y mínima de las
estrategias puras soporte del jugador.

@JackFlash
Teorema: Equilibrio de Nash (Ampliado)
Sea el Juego Γ = [ 𝑁; 𝑆1, … , 𝑆 𝑁; 𝑢1, … , 𝑢 𝑁] . Se dice que el perfil de estrategias mixtas 𝜎∗
=
( 𝜎1
∗
, … , 𝜎𝑖
∗
, … , 𝜎 𝑁
∗ ) es un Equilibrio de Nash si y solo si para todo 𝑖 = 1,2, … , 𝑁 con estrategia mixta
𝜎𝑖
∗
= (𝜎𝑖
1∗
, 𝜎𝑖
2∗
, … , 𝜎𝑖
𝑗∗
, … ) el hecho de que 𝜎𝑖
𝑗∗
> 0 implica que 𝑠𝑖
𝑗
es una respuesta óptima a 𝜎−𝑖
∗
=
( 𝜎𝑖
∗
, … , 𝜎𝑖−1
∗
, 𝜎𝑖+1
∗
… , 𝜎 𝑛
∗ ).
Demostración: Ver Fundenberg and Tirole (1992)

@JackFlash
Ejemplo (PJC, 2004: 155~): Considere de nuevo el juego,
Jugador 2
Izquierda Derecha
Jugador 1
Arriba (A) 3, 2 1, 4
Centro (C) 1, 3 2, 1
Abajo (B) 2, 2 2, 0
El juego tiene un único Equilibrio de Nash en estrategias mixtas bajo el perfil [(1 2⁄ , 0, 1 2⁄ ), (1 2⁄ , 1 2⁄ )]:
Cualquier estrategia del Jugador 1 con soporte contenido en el conjunto { 𝐴, 𝐵} incluidas las estrategias puras 𝐴 y 𝐵 es
respuesta óptima a la estrategia mixta del jugador 2, 𝜎2
∗
= (1 2⁄ , 1 2⁄ ). Al mismo tiempo, cualquier estrategia, pura
o mixta del jugador 2 es respuesta óptima a la estrategia , 𝜎1
∗
= (1 2⁄ , 0, 1 2⁄ ) del Jugador 1.

@JackFlash
i. Dada la estrategia 𝜎2
∗
= (1 2⁄ , 1 2⁄ ) del jugador 2, el jugador 1 obtiene las mismas ganancias al
utilizar distintas estrategias con soporte { 𝐴, 𝐵}. En efecto,
𝑈1( 𝜎1, 𝜎2) = 𝜎1 𝐴1 𝜎2
𝑇
= (1 2⁄ , 0, 1 2⁄ ) (
3 1
1 2
2 2
) (
1 2⁄
1 2⁄
) = (5 2⁄ , 3 2⁄ ) (
1 2⁄
1 2⁄
) = 2
𝑈1( 𝐴, 𝜎2) = (1, 0,0) (
3 1
1 2
2 2
) (
1 2⁄
1 2⁄
) = (3,1) (
1 2⁄
1 2⁄
) = 2
𝑈1( 𝐵, 𝜎2) = (0, 0,1) (
3 1
1 2
2 2
) (
1 2⁄
1 2⁄
) = (2,2) (
1 2⁄
1 2⁄
) = 2
𝑈1((1 3⁄ , 0, 2 3⁄ ), 𝜎2) = (1 3⁄ , 0, 2 3⁄ ) (
3 1
1 2
2 2
) (
1 2⁄
1 2⁄
) = (7 3⁄ , 5 3⁄ ) (
1 2⁄
1 2⁄
) = 2
En general, dada 𝜎2
∗
cualquier estrategia 𝜎1 = (𝑝1
𝑘
, 0, 1 − 𝑝1
𝑘
) de soporte { 𝐴, 𝐵} genera ganancia
2 para el jugador 1. Compruebe que:
𝑈1 ((𝑝1
𝑘
, 0, 1 − 𝑝1
𝑘
), 𝜎2) = ((𝑝1
𝑘
, 0, 1 − 𝑝1
𝑘
)) (
3 1
1 2
2 2
) (
1 2⁄
1 2⁄
) = (2 + 𝑝1
𝑘
, 2 − 𝑝1
𝑘
) (
1 2⁄
1 2⁄
) = 2

@JackFlash
ii. Dada la estrategia 𝜎1
∗
= (1 2⁄ , 0, 1 2⁄ ) las ganancias para el jugador 2 serán:
𝑈2( 𝜎1
∗
, 𝜎2) = 𝜎1 𝐴2 𝜎2
𝑇
= (1 2⁄ , 0, 1 2⁄ ) (
2 4
3 1
2 0
) (
1 2⁄
1 2⁄
) = (2, 2) (
1 2⁄
1 2⁄
) = 2
𝑈2( 𝜎1
∗
, 𝐼) = 𝜎1 𝐴2 𝜎2
𝑇
= (1 2⁄ , 0, 1 2⁄ ) (
2 4
3 1
2 0
) (
1
0
) = (2, 2) (
1
0
) = 2
𝑈2( 𝜎1
∗
, 𝐷) = 𝜎1 𝐴2 𝜎2
𝑇
= (1 2⁄ , 0, 1 2⁄ ) (
2 4
3 1
2 0
) (
0
1
) = (2, 2) (
0
1
) = 2
𝑈2(𝜎1
∗
, (4 5⁄ , 1 5⁄ )) = 𝜎1 𝐴2 𝜎2
𝑇
= (1 2⁄ , 0, 1 2⁄ ) (
2 4
3 1
2 0
) (
4 5⁄
1 5⁄
) = (2, 2) (
4 5⁄
1 5⁄
) = 2
𝑈2(𝜎1
∗
, ( 𝑝2
1
, 1 − 𝑝2
1)) = 𝜎1 𝐴2 𝜎2
𝑇
= (1 2⁄ , 0, 1 2⁄ ) (
2 4
3 1
2 0
) (
𝑝2
1
1 − 𝑝2
1) = (2, 2) (
𝑝2
1
1 − 𝑝2
1) = 2

@JackFlash
Equilibrios de Nash en Estrategias Mixtas en Juegos 2 × 2
Para calcular los Equilibrios de Nash en juegos 2 × 2 se usa la siguiente propiedad de las estrategias
mixtas:
Una estrategia mixta es respuesta óptima a otra estrategia pura o mixta determinada, si y solo si sus estrategias puras
soporte son respuesta óptima. Como consecuencia tales estrategias puras producen ganancias iguales y máximas, dada la
estrategia del otro jugador (PJC, 2004: 158).
El procedimiento para obtener gráficamente los Equilibrios de Nash se resume a continuación (PJC, id.):
i. Fíjense estrategias mixtas genéricas ( 𝑝, 1 − 𝑝) y ( 𝑞, 1 − 𝑞);
ii. Calcúlese la utilidad esperada que obtiene el jugador 1 de cada estrategia pura cuando la estrategia
del jugador 2 es ( 𝑞, 1 − 𝑞);
iii. Seguidamente, calcúlese la correspondencia de respuesta óptima del Jugador 1, 𝑅1( 𝑞);
iv. Procédase con el Jugador 2, calculando la utilidad esperada de cada una de las estrategias puras
cuando la estrategia del jugador 1 es ( 𝑝, 1 − 𝑝).
v. Calcule a continuación la correspondencia de respuesta óptima del jugador 2, 𝑅2( 𝑝);

@JackFlash
vi. Represente gráficamente las correspondencias 𝑅𝑖(∙) en el plano 𝑝, 𝑞. Los Equilibrios de Nash se
encuentran en los puntos en los que 𝑅1( 𝑞) y 𝑅2( 𝑝) se intersecan.
Ejemplo (PJC, 2004: 158~): Matching Pennies. Considere de nuevo el siguiente juego:
Jugador 2
Cara Sello
Jugador 1
Cara 1, -1 -1, 1
Sello -1, 1 1, 1
i. Sean 𝜎1 = ( 𝑝, 1 − 𝑝) y 𝜎2 = ( 𝑞, 1 − 𝑞)
ii. Fije ( 𝑞, 1 − 𝑞). En el caso del Jugador 1 se tiene:
𝑈1(𝐶𝑎𝑟𝑎, ( 𝑞, 1 − 𝑞)) = 𝑞(1) + (1 − 𝑞)(−1) = 2𝑞 − 1
𝑈1(𝑆𝑒𝑙𝑙𝑜, ( 𝑞, 1 − 𝑞)) = 𝑞(−1) + (1 − 𝑞)(1) = 1 − 2𝑞
iii. Se tienen las siguientes situaciones:
𝑈1(𝐶𝑎𝑟𝑎, ( 𝑞, 1 − 𝑞)) > 𝑈1(𝑆𝑒𝑙𝑙𝑜, ( 𝑞, 1 − 𝑞)) ⟷ 2𝑞 − 1 > 1 − 2𝑞 ⟷ 𝑞 > 1 2⁄
𝑈1(𝐶𝑎𝑟𝑎, ( 𝑞, 1 − 𝑞)) < 𝑈1(𝑆𝑒𝑙𝑙𝑜, ( 𝑞, 1 − 𝑞)) ⟷ 2𝑞 − 1 < 1 − 2𝑞 ⟷ 𝑞 < 1 2⁄

@JackFlash
𝑈1(𝐶𝑎𝑟𝑎, ( 𝑞, 1 − 𝑞)) = 𝑈1(𝑆𝑒𝑙𝑙𝑜, ( 𝑞, 1 − 𝑞)) ⟷ 2𝑞 − 1 = 1 − 2𝑞 ⟷ 𝑞 = 1 2⁄
En consecuencia,
 La respuesta óptima del jugador 1 a cualquier ( 𝑞, 1 − 𝑞) será Cara si 𝑞 > 1 2⁄ ;
 La respuesta óptima del jugador 1 a cualquier ( 𝑞, 1 − 𝑞) será Sello si 𝑞 < 1 2⁄ ;
 La respuesta óptima del jugador 1 a cualquier ( 𝑞, 1 − 𝑞) será Cara o Sello si 𝑞 = 1 2⁄ ;
𝑅1( 𝑞) = {
𝑝 = 0( 𝐽𝑢𝑔𝑎𝑟 𝑆𝑒𝑙𝑙𝑜) ↔ 𝑞 < 1 2⁄
𝑝 = 1( 𝐽𝑢𝑔𝑎𝑟 𝐶𝑎𝑟𝑎) ↔ 𝑞 > 1 2⁄
𝑝 ∈ [0,1] ↔ 𝑞 = 1 2⁄

@JackFlash
iv. Fije ahora ( 𝑝, 1 − 𝑝) para el Jugador 1. Calcule los pagos esperados para el Jugador 2. En este
caso,
𝑈2(( 𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑝(−1) + (1 − 𝑝)(1) = 1 − 2𝑝
𝑈2(( 𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) = 𝑝(1) + (1 − 𝑝)(−1) = 2𝑝 − 1
Se tienen las siguientes situaciones:
 𝑈2(( 𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) > 𝑈2(( 𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) ⟷ 1 − 2𝑝 > 2𝑝 − 1 ⟷ 𝑝 < 1 2⁄
 𝑈2(( 𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) < 𝑈2(( 𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) ⟷ 1 − 2𝑝 < 2𝑝 − 1 ⟷ 𝑝 > 1 2⁄
 𝑈2(( 𝑝, 1 − 𝑝), 𝐶𝑎𝑟𝑎) = 𝑈2(( 𝑝, 1 − 𝑝), 𝑆𝑒𝑙𝑙𝑜) ⟷ 1 − 2𝑝 = 2𝑝 − 1 ⟷ 𝑝 = 1 2⁄
En este caso, la correspondencia de respuesta óptima del Jugador 2 es:
𝑅2( 𝑝) = {
𝑞 = 0( 𝐽𝑢𝑔𝑎𝑟 𝑆𝑒𝑙𝑙𝑜) ↔ 𝑝 > 1 2⁄
𝑞 = 1( 𝐽𝑢𝑔𝑎𝑟 𝐶𝑎𝑟𝑎) ↔ 𝑝 < 1 2⁄
𝑞 ∈ [0,1] ↔ 𝑝 = 1 2⁄

@JackFlash
En términos gráficos, la Correspondencia de Respuesta Óptima del Jugador 2:

@JackFlash
Combinando los gráficos de 𝑅1( 𝑞) y 𝑅2( 𝑝) en el espacio 𝑝, 𝑞:

@JackFlash
Ejemplo: La Batalla de los Sexos (otra vez!)
Los pagos en este juego son los que aparecen en seguida:
Jugador 2
Cine Fútbol
Jugador 1 Cine 1, 2 0, 0
Fútbol 0, 0 2, 1
El juego tiene dos equilibrios de Nash en estrategias puras. Considere para el jugador 2 la estrategia mixta
𝜎2 = ( 𝑞, 1 − 𝑞). El jugador 1 obtiene los siguientes niveles de utilidad para cada una de sus estrategias
puras así:
𝑈1( 𝐶𝑖𝑛𝑒, 𝜎2) = (1) 𝑞 + 0(1 − 𝑞) = 𝑞
𝑈1( 𝐹𝑢𝑡𝑏𝑜𝑙, 𝜎2) = (0) 𝑞 + 2(1 − 𝑞) = 2 − 2𝑞
𝑈1( 𝐶𝑖𝑛𝑒, 𝜎2) = 𝑈1( 𝐹𝑢𝑡𝑏𝑜𝑙, 𝜎2) ↔ 𝑞 = 2 − 2𝑞 → 𝑞 = 2/3
Cuando 𝑞 = 2/3, J1 es indiferente respecto de sus dos estrategias puras y por lo tanto respecto de
cualquiera de sus estrategias mixtas

@JackFlash
La correspondencia de respuesta óptima para J1 es:
𝑅1( 𝜎2) = {
𝑝 = 1 ↔ 𝑞 > 2/3
𝑝 = 0 ↔ 𝑞 < 2/3
𝑝 ∈ [0,1] ↔ 𝑞 = 2/3
Ahora considere 𝜎1 = (𝑝, 1 − 𝑝). Para J2 las ganancias esperadas serán:
𝑈2(( 𝑝, 1 − 𝑝), 𝐶𝑖𝑛𝑒) = 2𝑝 + 0(1 − 𝑝) = 2𝑝
𝑈2(( 𝑝, 1 − 𝑝), 𝐹𝑢𝑡𝑏𝑜𝑙) = 0𝑝 + 1(1 − 𝑝) = 1 − 1𝑝
𝑈2(( 𝑝, 1 − 𝑝), 𝐶𝑖𝑛𝑒) = 𝑈2(( 𝑝, 1 − 𝑝), 𝐹𝑢𝑡𝑏𝑜𝑙) ↔ 2𝑝 = 1 − 1𝑝 → 𝑝 =
1
3
𝑅2( 𝜎1) = {
𝑞 = 1 ↔ 𝑝 > 1/3
𝑞 = 0 ↔ 𝑝 < 1/3
𝑞 ∈ [0,1] ↔ 𝑝 = 1/3

@JackFlash
Gráficamente:

@JackFlash
Ejemplo: Halcón-Paloma (otra vez!)
Dos individuos pueden comportarse de manera agresiva (Halcón) o pacífica (Paloma) por la posesión de
un objeto de valor, V. Si los dos se comportan en modo agresivo, del conflicto resultante surgirán unos
costos C. Si ambos se comportan de manera conciliadora, se repartirán el objeto. Si uno se comporta en
forma pacífica y el otro no, el pacífico no obtienen nada y el agresivo se quedará con todo. Los pagos en
este juego son los que aparecen en seguida:
Jugador 2
Paloma Halcón
Jugador 1 Paloma 𝑉 2⁄ , 𝑉 2⁄ 0, 𝑉
Halcón 𝑉, 0 𝑉 2⁄ − 𝐶, 𝑉 2 − 𝐶⁄
Sean 𝑉 = 2 y 𝐶 = 4. Los pagos para este juego son:
Jugador 2
Halcón Paloma
Jugador 1 Halcón 1, 1 0, 2
Paloma 2, 0 -3, -3
El Juego presenta dos EN en estrategias puras: (Paloma, Halcón), (Halcón, Paloma).

@JackFlash
Suponga que para J1 𝜎1 = ( 𝑝, 1 − 𝑝) y que para J2 𝜎1 = ( 𝑞, 1 − 𝑞). Las utilidades esperadas serán:
𝑈1 = ( 𝑝, 1 − 𝑝) (
1 0
2 −3
) (
𝑞
1 − 1
) = 3𝑝 + 5𝑞 − 4𝑝𝑞 − 3
𝑈2 = ( 𝑝, 1 − 𝑝) (
1 2
0 −3
) (
𝑞
1 − 1
) = 5𝑝 + 3𝑞 − 4𝑝𝑞 − 3
El Jugador 1 maximiza su ganancia esperada, i.e., resuelve:
max
𝑝
𝑈1 = 3𝑝 + 5𝑞 − 4𝑝𝑞 − 3
Las condiciones relevantes para óptimo son:
𝜕𝑈1
𝜕𝑝
= 3 − 4𝑞 = 0 → ( 𝑞, 1 − 𝑞) = (3 4⁄ , 1 4⁄ )
 Note que 3 − 4𝑞 < 0 → −4𝑞 < −3. Multiplicando ambos lados por (-1) se tiene que si 𝑞 > 3/4
el beneficio máximo de J1 se torna negativo. Por lo tanto, si 𝑞 > 3/4, esto es, si J2 juega Paloma, J1
debería hacer 𝑝 = 0, esto es, deberá jugar Halcón.
 Si 3 − 4𝑞 > 0 → 𝑞 < 3/4 y J1 deberá jugar 𝑝 = 1, i.e., deberá jugar paloma.
 Cuando 3 − 4𝑞 = 0, 𝑞 = 3/4 y J1 será indiferente entre jugar Halcón o Paloma así como respecto
de cualquier otra estrategia mixta a su disposición.

@JackFlash
Por su parte, el Jugador 2 deberá resolver:
max
𝑞
𝑈2 = 5𝑝 + 3𝑞 − 4𝑝𝑞 − 3
CPO:
𝜕 𝑈2
𝜕𝑞
= 3 − 4𝑝 = 0
 El Jugador 2 deberá jugar Halcón (jugará 𝑞 = 0), siempre que J1 juegue 𝑝 > 3/4 (siempre que J1,
juegue Paloma);
 El Jugador 2 deberá jugar Paloma (jugará 𝑞 = 1) siempre que J1 juegue 𝑝 < 3/4 (i.e., siempre que
J1, juegue Halcón);
 El Jugador 2 será indiferente respecto de sus estrategias puras y de cualquier combinación lineal de
ellas, siempre que 𝑝 = 3/4

@JackFlash
Gráficamente, el juego Halcón-Paloma adquiere la siguiente manifestación:

@JackFlash
Teorema: Equilibrio de Nash (Existencia)
Sea el Juego Γ = [ 𝑁; 𝑆1, … , 𝑆 𝑁; 𝑢1, … , 𝑢 𝑁]. Suponga que se cumplen:
i. 𝑆𝑖 es subconjunto no vacío y compacto de ℝ 𝑘
ii. 𝑢𝑖 es continua en 𝑆 = ∏ 𝑆𝑖 = 𝑆1 × 𝑆2 × ⋯ × 𝑆 𝑁
𝑁
𝑖=1 y es estrictamente cuasicóncava en 𝑠𝑖
Entonces, existe al menos un Equilibrio de Nash en Estrategias Puras para Γ
Demostración: Ver Fundenberg and Tirole 1992.
Corolario (Nash, 1950):
En todo juego finito Γ = [ 𝑁; 𝑆1, … , 𝑆 𝑁; 𝑢1, … , 𝑢 𝑁], existe al menos un Equilibrio de Nash en estrategias
Mixtas bajo i. y ii.
Demostración: Ver PJC 2004: 173

@JackFlash
Apéndice: Teorema Punto Fijo [ Kakutani ]:
Sea 𝑋 un subconjunto compacto y convexo de ℝℓ
y sea 𝑇: 𝑋 ⇉ 𝑋 una correspondencia tal que:
 Para todo 𝑥 ∈ 𝑋 el conjunto 𝑇( 𝑥) es no vacío y convexo
 𝑇( 𝑥) es hemicontinuo superior
Entonces, ∃𝑥∗
∈ 𝑋 tal que 𝑥∗
∈ 𝑇( 𝑥)

@JackFlash
Referencias
 Bauman, Y. (2009): Quantum Micro, Class Notes. Whitman College.
 Barron, E.N. (2008): Game Theory. An Introduction. Hoboken (N.J.): John Wiley.
 Fundenberg, D. and J. Tirole (1992): Game Theory. Cambridge: MIT press.
 Gibbons, R. (1992): Un Primer Curso de Teoría de Juegos. Barcelona: Antoni Bosch.
 Jehle, G. and P.J. Reny (2001): Advanced Microeconomic Theory. N.Y.: Addison-Wesley.
 Lancaster, K. (2011): Mathematical Economics. N.Y.(N.Y.): Dover.
 Manrique, O., E. Villa, G. Junca y S. Monsalve (1999): Competencia Imperfecta I: Equilibrio de Nash en Juegos
Estaticos. Capítulo IV En: Monsalve, S. [ed.] (1999): Introducción a los Conceptos de Equilibrio en Economía.
Bogotá: Universidad Nacional de Colombia.
 Mas-Colell, A., M.D. Whinton and J.R.Green (1985): Microeconomic Theory. Oxford: Oxford University
Press.
 Monsalve, S. [ed.] (1999): Introducción a los Conceptos de Equilibrio en Economía. Bogotá: Universidad Nacional
de Colombia.
 Monsalve, S. y J. Arévalo [eds.] (2005): Un Curso de Teoría de Juegos Clásica. Bogotá: Universidad Externado
de Colombia.
 Montet, C. and D. Serra (2003): Game Theory & Economics. N.Y. (N.Y.): Palgrave.
 Nash, John (1950): Equilibrium points in n-person games. Proceedings of the National Academy of Sciences
36(1):48-49.
 Nash, John (1951): Non-Cooperative Games. The Annals of Mathematics 54(2):286-295.
 Takayama, A. (1985): Mathematical Economics. Cambridge: Cambridge University Press.
 Varian, H. (1993): Microeconomic Analysis. N.Y.: Norton & Co.

Segura 2013 -- equilibrio de nash - 28 abril 2013

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Segura 2013 -- equilibrio de nash - 28 abril 2013

Similar a Segura 2013 -- equilibrio de nash - 28 abril 2013 (20)

Más de Juan Segura

Más de Juan Segura (20)

Segura 2013 -- equilibrio de nash - 28 abril 2013