1. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Conceptos SoluciΓ³n: El Equilibrio de Nash
J.C.Segura Ms.Sc.
Universidad de La Salle
Facultad de Ciencias EconΓ³micas y Sociales
Escuela Colombiana de IngenierΓa
Facultad de EconomΓa
jcsegura@lasalle.edu.co / juan.segura@escuelaing.edu.co / j.c.segura@gmail.com
URL: http://microeconomica.googlepages.com / twitter: @JackFlash
BogotΓ‘, D.C., Abril de 2013
2. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
5. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
DefiniciΓ³n. Utilidad Esperada [ Manrique et. al. (1999:180) ]
La utilidad esperada de un jugador es el pago que podrΓa recibir como resultado de las distintas loterΓas
que sobre estrategias puras pueda enfrentar un jugador, i.e. cuando se introduce aleatoriedad en el
comportamiento del individuo. Con base en la definiciΓ³n anterior ( Estrategia Mixta ), dada por ejemplo
π = (π1, π2, β¦ , π π) β β Ξπ
π
π=1
π’π( π) β‘ β (β ππ(π π)
πΌ
π=1
) π’π( π )
π βπ
6. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo [ Manrique et. al. Tirole (1999:180) ]
Considere el siguiente Juego:
Jugador 2
x2 y2
Jugador 1
x1 3, 2 5, 1
y2 4, 1 2, 3
Suponga que no hay certeza para ningΓΊn jugador acerca de lo que su contraparte harΓ‘. En este caso cada
jugador aleatoriza sus decisiones asignando probabilidades de acuerdo con sus estimaciones. Si p π
=
( π1, π2) y q π
= ( π1, π2) son estrategias mixtas para los jugadores 1 y 2, respectivamente, entonces, las
utilidades esperadas por jugador son como sigue:
ο§ Jugador 1: π’1( π) = π1(3π1 + 5π2) + π2(4π1 + 2π2)
ο§ Jugador 2: π’2( π) = π1(2π1 + π2) + π2( π1 + 3π2)
7. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo [ Fundenberg and Tirole (1992:5) ]:
Considere el siguiente juego:
Columna
L M R
Fila
U 4, 3 5, 1 6, 2
M 2, 1 8, 4 3, 6
D 3, 0 9, 6 2, 8
Suponga que una estrategia mixta para el jugador 1 es un vector (π1( π), π1( π), π1( π·)) con
probabilidades todas mayores que cero y tales que π1( π) + π1( π) + π1( π·) = 1. Por otra parte, una
estrategia mixta para el jugador 2 es un vector (π2( πΏ), π2( π), π2( π )) con probabilidades todas mayores
que cero y tales que π2( πΏ) + π2( π) + π2( π ) = 1. Entonces los pagos para los perfiles π1 = (1
3
, 1
3
, 1
3
) y
π2 = (0, 1
2
, 1
2
) son:
π’1( π1) =
1
3
(0 β 4 +
1
2
β 5 +
1
2
β 6) +
1
3
(0 β 2 +
1
2
β 8 +
1
2
β 3) +
1
3
(0 β 3 +
1
2
β 9 +
1
2
β 2) =
11
2
π’2( π2) = 0 (
1
3
β 3 +
1
3
β 1 +
1
3
β 0) +
1
2
(
1
3
β 1 +
1
3
β 4 +
1
3
β 6) +
1
2
(
1
3
β 2 +
1
3
β 6 +
1
3
β 8) =
27
6
11. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
DefiniciΓ³n. Dominancia Estricta en Estrategias Mixtas
Considere el juego finito en forma normal Ξ = [π, ( πΆπ)π=1
π
, ( π’π)π=1
π
]. Se dice que una estrategia mixta
ππ β βπ es estrictamente dominante si y solo si existe otra estrategia mixta ππ
β²
β βπ tal que:
π’π( ππ, πβπ) > π’π( ππ
β²
, πβπ) para toda πβπ β ββπ
En este caso, la estrategia ππ
β²
β βπ es una estrategia estrictamente dominada.
* * *
15. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo [Manrique et. al. (1999: 185)]:
En el juego a continuaciΓ³n hay dos (2) Equilibrios de Nash en estrategias puras: ( π΄, πΆ) y ( π΅, π·)
II
C D
I
A 10, 10 0, 0
B 0, 0 1, 1
Observaciones:
ο§ Note que si bien π1 = ( π΄, πΆ) y π2 = ( π΅, π·) son Equilibrios de Nash estos observan una relaciΓ³n
de dominancia especΓfica: π1 β»π π2 , es decir, π1 es Pareto Superior a π2 βπ = {πΌ, πΌπΌ} y cabrΓa
esperarse (en el mundo real) alguna suerte de cooperaciΓ³n entre los dos jugadores, para alcanzar
dicho resultado.
ο§ Se dice entonces que π1 = ( π΄, πΆ) es un βEquilibrio Focalβ pues resulta naturalmente preferido a los
demΓ‘s equilibrios.
ο§ Note ademΓ‘s que la Focalidad del Equilibrio no supone que un equilibrio que pueda caracterizarse asΓ,
sea efectivamente la soluciΓ³n del juego. [e.g. TexPLORE vs. Clampett ]
18. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo: El Juego de la Gallina
Dos jΓ³venes de los aΓ±os de 1950 arrancan sus carros, acelerando cada uno en direcciΓ³n del otro. Las
alternativas que cada conductor tiene son βContinuarβ (πΆ) o βQuitarseβ (π). Si los dos continΓΊan, reciben
un pago negativo dado el choque que se suscita en este caso. Si uno de ellos elige quitarse del camino
mientras el otro continΓΊa, es un βgallinaβ y recibe un pago de cero en tanto que el otro recibe un pago
positivo. Si los dos se retiran, los dos son considerados gallinas. π = {1,2}, ππ = { πΆ, π} βπ
II
C Q
I
C -1, -1 1, 0
Q 0, 1 0, 0
Hay dos equilibrios de Nash en estrategias puras, ( πΆ, π) y ( π, πΆ).
19. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo: Una Matriz no Cuadrada de Pagos
Considere la siguiente matriz de pagos:
No hay estrategias estrictamente dominadas para ningΓΊn jugador y hay dos (2) equilibrios de Nash: (π, π»)
y (π·, πΉ).
H F
S 5,2 1,1
D 1,1 5,2
W 2,3 2,3
21. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Correspondencia de Respuesta Γptima
DefiniciΓ³n [Correspondencia de Respuesta Γptima ]: Considere el juego finito en forma normal
Ξ = [π, ( π π)π=1
π
, ( π’π)π=1
π
]
Entonces, para cada uno de los π = 1,2, β¦ , π jugadores, se llama Correspondencia de Respuesta Γptima o
Correspondencia de Mejor Respuesta o Correspondencia de ReacciΓ³n a la regla que a cada combinaciΓ³n de
estrategias
π βπ = ( π 1, π 2, β¦ , π πβ1, π π+1, β¦ , π π)
asigna el conjunto π π( π βπ), siempre que y si y sΓ³lo si resulta que:
π’π( π 1, π 2, β¦ , π πβ1, π π
β²
, π π+1, β¦ , π π) β₯ π’π( π 1, π 2, β¦ , π πβ1, π π, π π+1, β¦ , π π)
βπ π β ππ
23. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo: Juego de la Mayor Diferencia
Sea π β 2. El juego consiste en que los dos jugadores escriben al mismo tiempo un nΓΊmero π₯π β [0,1]
y los pagos estΓ‘n constituidos por la diferencia entre cada uno de los nΓΊmeros escritos de acuerdo con
la siguiente regla:
π’1( π 1, π 2) = π’2( π 1, π 2) = ( π 1 β π 2)2
Si π 2 = 3
4
entonces la respuesta Γ³ptima de π 1 = 0
Si π 1 = 1
4
entonces la respuesta Γ³ptima de π 2 = 1, etc.
Las correspondencias de respuesta Γ³ptimas de cada jugador, π π( π βπ) en este caso son:
Jugador 1 Jugador 2
π 1( π 2) =
{
0 β· π 2 >
1
2
1 β· π 2 <
1
2
0 Γ³ 1 β· π 2 =
1
2
π 2( π 1) =
{
0 β· π 1 >
1
2
1 β· π 1 <
1
2
0 Γ³ 1 β· π 1 =
1
2
24. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
25. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo: Juego del Reparto (Nash Calls)
El juego consiste en repartirse un valor. El reparto se hace con las siguientes reglas. Cada jugador escribe
un nΓΊmero entre 0 y 1 que representa la fracciΓ³n del activo que desean que se les entregue. Si la suma de
los dos nΓΊmeros es menor o igual que 1, a cada jugador se le entrega lo que pidiΓ³. Si la suma de los dos
nΓΊmeros es mayor que 1, ninguno de los jugadores recibe nada. En forma normal, el juego adquiere la
siguiente forma.
π = {1,2}, π π = [0, 1] βπ = 1,2
Pagos (Juego Infinito)
Jugador 1 Jugador 2
π’1( π 1, π 2) {
π 1 β· ( π 1 + π 2) β€ 1
0 β· ππ ππ‘ππ πππ π
π’2( π 1, π 2) {
π 2 β· ( π 1 + π 2) β€ 1
0 β· ππ ππ‘ππ πππ π
ο§ Si, por ejemplo, el Jugador 2 juega π 2 = 1
2
la respuesta Γ³ptima de 1 es π 1
β
= 1
2
= 1 β π 2
ο§ Si, por ejemplo, el Jugador 1 juega π 1 = 4
5
la respuesta Γ³ptima de 2 es π 1
β
= 1
5
= 1 β π 1
26. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Por lo tanto, las correspondencias de respuesta Γ³ptima para cada uno de los jugadores son:
Jugador 1 Jugador 2
π 1( π 2) = {
1 β π 2 β· π 2 < 1
[0, 1] β· π 2 = 1
π 2( π 1) = {
1 β π 1 β· π 1 < 1
[0, 1] β· π 1 = 1
28. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Para el Jugador 1, la correspondencia de respuesta Γ³ptima se obtiene resolviendo:
max
π2
π1 = π2(1 β π1 β π2) π . π. βΆ 0 β€ π2 β€ 1
Las CPO son:
ππ2
π2
= 1 β π1 β 2π2 = 0
β΄ π2
0
= π 2( π1) =
1 β π1
2
β [0,1]
El(los) equilibrio(s) de Nash se encuentra en el lugar en el cual cada estrategia es una respuesta Γ³ptima a la(s)
otra(s). Esto es, el(los) equilibrio(s) de Nash se encuentran en el punto en el cual
π1
0
= π 1( π2) =
1 β π2
2
=
1 β π1
2
= π 2( π1) = π2
0
29. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Es decir, debe resolverse el sistema:
π π¦π ππ( π1, π2) == {
π1 =
1 β π2
2
[1]
π2 =
1 β π1
2
[2]
De la ecuaciΓ³n [1]:
2π1 = 1 β π2 β π2 = 1 β 2π1
Reemplazando en [2]:
1 β 2π1 =
1 β π1
2
2 β 4π1 = 1 β π1
β΄ π1
β
=
1
3
30. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Reemplazando de nuevo en [2]
2π2 =
2
3
=
2
6
=
1
3
= π2
β
Es decir, el conjunto de los Equilibrios de Nash es el perfil de estrategias: ( π1
β
, π2
β) = (1
3
, 1
3
)
31. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Equilibrios de Nash (Estrategias Puras):
ο§ El concepto de Equilibrio de Nash es ampliamente atractivo por la versatilidad relativa que ofrece al
en la bΓΊsqueda de equilibrio para una amplΓsima variedad de juegos.
ο§ Es conveniente notar que, en general los conjuntos de equilibrios estudiados bajo los distintos
conceptos-soluciΓ³n al momento son tales que: ED β EID β EN
ο§ En general, los equilibrios de Nash dan lugar a pagos que son al menos tan preferibles como los pagos
mΓnimos garantizados (MinMax) aun cuando en general las estrategias de seguridad no son Equilibrios
de Nash.
ο§ La conducta de seguridad y el comportamiento no cooperativo solo coinciden en juegos
estrictamente competitivos [ Montet & Serra, 2008:66 ]. No obstante, debe esperarse que no
siempre existan equilibrios de Nash en estrategias puras.
ο§ Para probar que un juego tiene al menos un Equilibrio de Nash buscaremos mostrar que el perfil
de estrategias π β
= ( π 1
β
, π 2
β
, β¦ , π πβ1
β
, π π
β
, π π+1
β
, β¦ , π π
β) es un equilibrio de Nash si y sΓ³lo si π π
β
β
π π( π βπ
β
), es decir, probar que existe al menos un equilibrio de Nash equivale a probar que existe un
π π
β
tal que π π
β
β π π( π βπ
β
).
37. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
En lo que respecta a la firma 2, el problema es:
max
π2
π’2( π1, π2) = π2[ π β ππ1 β ππ2 β π] sujeta a: 0 β€ π2 β€ π πβ
CPO:
ππ’2( π1, π2)
ππ2
= [ π β ππ1 β ππ2 β π] + π2(βπ) = 0
Esto es,
π2
β
β‘ π 2( π1) =
π β π β ππ1
2π
Suponga que el par ( π1
β
, π2
β) es un Equilibrio de Nash. Entonces, por el teorema de existencia presentado
supra, π1
β
β‘ π 1( π2) y π2
β
β‘ π 2( π1). Es decir, es la soluciΓ³n del sistema de ecuaciones:
{
π1
β
=
π β π β ππ2
2π
π2
β
=
π β π β ππ1
2π
38. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Reemplazando la expresiΓ³n para π2
β
en π1
β
:
π1
β
=
π β π β π (
π β π β ππ1
2π
)
2π
De donde,
π1
β
=
π β π
3π
Bajo el mismo razonamiento,
π2
β
=
π β π
3π
Y, el conjunto de puntos de equilibrio (de Nash) vendrΓ‘ dado por:
π πΈπ
β‘ [π1
β
=
π β π
3π
, π2
β
=
π β π
3π
]
39. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Dado que la cantidad total de equilibrio β ππ = π1 + π2 = ππ
πβ
= π1
β
+ π2
β
= 2 β
π β π
3π
En tanto que el precio de equilibrio viene dado por:
π( πβ) = π β ππβ
= π β π (2 β
π β π
3π
) =
π + 2π
3
Recuerde que la funciΓ³n de beneficio de la firma j estΓ‘ dada por ππ = ππ[π β (π β ππ
π
π=1 ) β π]. Luego en el Γ³ptimo,
fijando j=1 (el mismo procedimiento aplica a la otra empresa),
π1
β
= π’1
β( π1
β
, π2
β) = π1
β
[π β π (
π β π
3π
) β π (
π β π
3π
) β π] = π1
β
[π β
π β π
3
β
π β π
3
β π]
β΄ π1
β
=
( π β π)2
9π
= π2
β
Y el beneficio total en la industria,
Ξ β
= π1
β
+ π2
β
=
( π β π)2
9π
+
( π β π)2
9π
= 2 [
( π β π)2
9π
]
En resumen, el equilibrio en esta industria viene dado por una tupla:
[πβ(πβ); πβ
(ππ
β
); Ξ β
(ππ
β
)]
π=1
π=2
= [(
π + 2π
3
) ; (
2(π β π)
3π
) ; (
2(π β π)2
9π
) ]
40. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
41. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo: El Oligopolio de Cournot
Extendamos el resultado de Cournot a un nΓΊmero π = 1, β¦ , π de firmas cada una con un nivel de
producciΓ³n, ππ. La funciΓ³n inversa de demanda es, como en el caso anterior,
π( π) = {
π β ππ β· π > ππ
0 β· π β€ ππ
Con π > 0 y β ππ = π1 + π2+, β¦ , +π πβ1 + π π = ππ
La funciΓ³n de costos de la firma j viene dada por:
πΆπ(ππ) = ππ π π < π βπ
El beneficio de la firma j es:
ππ = ππ π( π) β πΆπ(ππ) = ππ π(ππ + πβπ) β πΆπ(ππ) = ππ[π β π(ππ + πβπ)] β πππ
ππ = ππ[π β π(ππ + πβπ) β π]
42. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
La respuesta Γ³ptima de la firma j a una combinaciΓ³n de acciones πβπ = (π1, β¦ , ππβ1, ππ+1, β¦ , π π) es la
soluciΓ³n de
max
π π
ππ = ππ[π β π(ππ + πβπ) β π] sujeta a: ππ β [0, π
π
]
Las condiciones relevantes para Γ³ptimo son:
πππ(ππ, πβπ)
πππ
= [π β π(ππ + πβπ) β π] β πππ = 0
β΄ π β 2πππ β ππβπ β π = 0
La C2O permite verificar la cuasi concavidad (estricta) de ππ por lo que CPO supone un mΓ‘ximo.
El vector πβ
= (π1
β
, π2
β
, β¦ , π πβ1
β
, ππ
β
, ππ+1
β
, β¦ , π π
β
) caracteriza a un Equilibrio de Nash si se verifican:
π β 2πππ
β
β ππβπ
β
β π = 0 todo π = 1, β¦ , π
48. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
49. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
De acuerdo con estas posibilidades, valΓ³rense los beneficios de las firmas, segΓΊn el caso:
Caso i: ππ
β
> ππ
β
= π. En este caso, los beneficios son:
π’π(ππ
β
, ππ
β
) = {
π’π(ππ
β
, ππ
β
) = π( ππ
β)( ππ
β
β π) = π( π)( π β π) = 0
π’π(ππ
β
, ππ
β
) = 0
Suponga, sin embargo, que la firma i elige un precio distinto y superior al costo marginal π pero aΓΊn
inferior al precio de la otra firma, e.g. ππ
β²
= ππ
β
β π > π. En este caso, los beneficios de la firma i son:
π’π(ππ
β²
, ππ
β
) = π( ππ
β²
)( ππ
β²
β π) > 0
i.e.., La firma tiene incentivos para desviarse de la situaciΓ³n inicial propuesta y, consecuentemente este
caso no constituye un Equilibrio de Nash.
50. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Caso ii: ππ
β
> ππ
β
> π. El precio de las firmas es distinto y mayor que el coste marginal. En este escenario
los beneficios de las firmas son
π’π(ππ
β
, ππ
β
) = {
π’π(ππ
β
, ππ
β
) = π( ππ
β)( ππ
β
β π) = π( ππ
β)( ππ
β
β π) > 0
π’π(ππ
β
, ππ
β
) = 0
Puesto que ππ
β
> ππ
β
, el beneficio para la firma j es cero. No obstante suponga que esta firma reduce su
precio en una cantidad π de modo que el nuevo precio sea igual al precio de la otra firma, menos una
cantidad determinada ππ
β²
= ( ππ
β
β π) > π, entonces, el beneficio para esta firma es:
π’π(ππ
β
, ππ
β
) = π(ππ
β²
)(ππ
β²
β π) = π(ππ
β²
) (ππ
β
β πβ
>π
β π) > 0
Al adoptar esta estrategia la firma j obtendrΓa beneficio positivo, situaciΓ³n que involucra un incentivo
para desviarse de esta situaciΓ³n y, por tanto, no constituye un Equilibrio de Nash.
51. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Caso iii: Los precios de las dos firmas son iguales y mayores que el coste marginal, i.e. ππ
β
= ππ
β
> π. Los
beneficios de las firmas, en esta situaciΓ³n, son:
π’π(ππ
β
, ππ
β
) = {
π’π(ππ
β
, ππ
β
) = π( ππ
β
)( ππ
β
β π) 2β > 0
π’π(ππ
β
, ππ
β
) = π(ππ
β
)(ππ
β
β π) 2β > 0
En este caso, las firmas obtienen un beneficio estrictamente positivo si bien se reparten el mercado entre
los dos. Note ademΓ‘s que si cualquier firma reduce su precio por debajo del de la otra firma, se queda
con todo el mercado duplicando prΓ‘cticamente su beneficio. En efecto, suponga que:
ππ
β²
= ππ
β
β π < ππ
β
con ππ
β²
> π
En este caso,
π’π(ππ
β²
, ππ
β
) = π( ππ
β
β π)( ππ
β
β π β π) β 2π’π(ππ
β
, ππ
β
) > π’π(ππ
β
, ππ
β
)
Por consiguiente, cualquiera de las dos firmas tiene incentivos para fijar un precio inferior al de su rival,
siendo este un equilibrio inestable, i.e., una situaciΓ³n de no Equilibrio de Nash.
52. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Caso iv: ππ
β
= ππ
β
= π. Los precios de las dos firmas son iguales entre si e iguales al coste marginal. En
este caso, los beneficios de las firmas son:
π’π(ππ
β
, ππ
β
) = {
π’π(ππ
β
, ππ
β
) = π( ππ
β
)( ππ
β
β π) = π( π)( π β π) = 0
π’π(ππ
β
, ππ
β
) = π(ππ
β
)(ππ
β
β π) = π( π)( π β π) = 0
Esto es, ninguna de las firmas observa rentas no competitivas y ninguna de ellas tiene incentivo para
desviarse de esta situaciΓ³n (compruebe que es asΓ) que se constituye en el Equilibrio de Nash.
56. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Equilibrios de Nash (Estrategias Mixtas):
No todo juego finito tiene un Equilibrio de Nash por SoluciΓ³n. Considere, por ejemplo, el Juego del
Lanzamiento de las Monedas:
Jugador 2
Cara Sello
Jugador 1
Cara 1, -1 -1, 1
Sello -1, 1 1, -1
Considerando correspondencias de respuesta Γ³ptima, al Jugador 1 le resulta conveniente responder a
cualquier estrategia del Jugador 2 con la misma estrategia en tanto que al Jugador 2, le resulta mΓ‘s
rentable, dada cualquier estrategia del Jugador 1, elegir la estrategia opuesta. Las correspondencias de
respuesta Γ³ptima son,
ο§ Jugador 1: π 1( π 2) = π 2, i.e., π 1( πΆπππ) = πΆπππ ; π 2( πππππ) = πππππ
ο§ Jugador 2: π 2( π 1) = βπ 1, i.e., π 2( πΆπππ) = πππππ ; π 2( πππππ) = πΆπππ
Es decir, no hay perfiles de estrategias puras en las que cada una de ella sea respuesta Γ³ptima de la otra.
60. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo ( PJC: 147 ) Sea el siguiente juego:
Jugador 2
Izquierda Derecha
Jugador 1
Arriba 3, 2 1, 4
Centro 1, 3 2, 1
Abajo 2, 2 2, 0
ο§ Los conjuntos de estrategias puras son: {
π1 = [ π΄, πΆ, π΅]
π2 = [ πΌ, π·]
ο§ Una estrategia mixta para el Jugador 1 puede ser una distribuciΓ³n π1 = { π, π, 1 β π β π} donde π
es la probabilidad de elegir Arriba, π es la probabilidad de elegir C, y Abajo se elige con probabilidad
1 β π β π.
ο§ Una estrategia mixta para el Jugador 2 puede ser una distribuciΓ³n π2 = { π, 1 β π} con π siendo la
probabilidad de jugar Izquierda mientras que la estrategia Derecha se juega con probabilidad (1 β π).
61. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
ο Para el Jugador 1, toda estrategia mixta en la que π > 0, π > 0, 1 β π β π > 0 tendrΓ‘ un conjunto
soporte π π’ππ( π1 ) igual al nΓΊmero de estrategias puras siendo asΓ una estrategia mixta completa.
ο Una estrategia mixta completa para este jugador es (1
2
, 1
4
,
1
4
), en donde jugar π΄ tiene probabilidad 1
2
,
jugar πΆ tiene probabilidad 1
4
, y jugar π΅ tiene probabilidad 1
4
tiene un conjunto soporte que coincide
con el conjunto de estrategias puras, π1: π π’ππ(1
2
, 1
4
,
1
4
).
ο En contraste, si una estrategia mixta para el jugador 1 es una loterΓa (0, 1
3
,
2
3
) esta no puede entenderse
como una estrategia mixta completa porque asigna probabilidad 0 a la estrategia pura π΄, y su
soporte es un subconjunto propio de π1: π π’ππ(0, 1
3
,
2
3
) = { π΅, πΆ};
ο Las estrategias puras { π΄, π΅, πΆ} pueden entenderse como las estrategias mixtas:
(1,0,0), (0,1,0), (0,0,1).
ο Bajo estrategias mixtas las funciones de pago dejan de ser determinΓsticas para tornarse en aleatorias;
ο Bajo estrategias mixtas, las funciones de pago dejan de ser ordinales.
69. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
DefiniciΓ³n: Equilibrio de Nash en Estrategias Mixtas:
Sea el Juego Ξ = [ π; π1, β¦ , π π; π’1, β¦ , π’ π]. Entonces, se dice que el perfil de estrategias mixtas πβ
=
( π1
β
, β¦ , ππ
β
, β¦ , π π
β ) es un Equilibrio de Nash (en estrategias mixtas), si para todo π = 1,2, β¦ , π
ππ( π1
β
, β¦ , ππβ1
β
, ππ
β
, ππ+1
β
, β¦ , π π
β ) β₯ ππ( π1
β
, β¦ , ππβ1
β
, ππ, ππ+1
β
, β¦ , π π
β )
Para todo ππ β Ξ( ππ) = {ππ = (ππ
1
, ππ
2
, β― , ππ
π
): ππ
π
β₯ 0, βπ = 1,2,3, β¦ , π π¦ β ππ
π
= 1π
π=1 }
Esto es, si para todo π = 1,2, β¦ , π resulta que:
ππ
β
= argmax
ππ
{ ππ( π1
β
, β¦ , ππβ1
β
, ππ, ππ+1
β
, β¦ , π π
β )}
O sea, cuando para cada uno de los π = 1,2, β¦ , π jugadores ππ
β
es respuesta Γ³ptima a πβπ
β
ObservaciΓ³n: El pago esperado de una estrategia mixta de un jugador, dadas las estrategias de los demΓ‘s
jugadores, es una combinaciΓ³n convexa de los pagos de las estrategias puras soporte de esa estrategia mixta:
luego la ganancia esperada de una estrategia mixta debe estar entre las ganancias mΓ‘xima y mΓnima de las
estrategias puras soporte del jugador.
70. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Teorema: Equilibrio de Nash (Ampliado)
Sea el Juego Ξ = [ π; π1, β¦ , π π; π’1, β¦ , π’ π] . Se dice que el perfil de estrategias mixtas πβ
=
( π1
β
, β¦ , ππ
β
, β¦ , π π
β ) es un Equilibrio de Nash si y solo si para todo π = 1,2, β¦ , π con estrategia mixta
ππ
β
= (ππ
1β
, ππ
2β
, β¦ , ππ
πβ
, β¦ ) el hecho de que ππ
πβ
> 0 implica que π π
π
es una respuesta Γ³ptima a πβπ
β
=
( ππ
β
, β¦ , ππβ1
β
, ππ+1
β
β¦ , π π
β ).
DemostraciΓ³n: Ver Fundenberg and Tirole (1992)
71. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo (PJC, 2004: 155~): Considere de nuevo el juego,
Jugador 2
Izquierda Derecha
Jugador 1
Arriba (A) 3, 2 1, 4
Centro (C) 1, 3 2, 1
Abajo (B) 2, 2 2, 0
El juego tiene un ΓΊnico Equilibrio de Nash en estrategias mixtas bajo el perfil [(1 2β , 0, 1 2β ), (1 2β , 1 2β )]:
Cualquier estrategia del Jugador 1 con soporte contenido en el conjunto { π΄, π΅} incluidas las estrategias puras π΄ y π΅ es
respuesta Γ³ptima a la estrategia mixta del jugador 2, π2
β
= (1 2β , 1 2β ). Al mismo tiempo, cualquier estrategia, pura
o mixta del jugador 2 es respuesta Γ³ptima a la estrategia , π1
β
= (1 2β , 0, 1 2β ) del Jugador 1.
79. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Combinando los grΓ‘ficos de π 1( π) y π 2( π) en el espacio π, π:
80. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo: La Batalla de los Sexos (otra vez!)
Los pagos en este juego son los que aparecen en seguida:
Jugador 2
Cine FΓΊtbol
Jugador 1 Cine 1, 2 0, 0
FΓΊtbol 0, 0 2, 1
El juego tiene dos equilibrios de Nash en estrategias puras. Considere para el jugador 2 la estrategia mixta
π2 = ( π, 1 β π). El jugador 1 obtiene los siguientes niveles de utilidad para cada una de sus estrategias
puras asΓ:
π1( πΆπππ, π2) = (1) π + 0(1 β π) = π
π1( πΉπ’π‘πππ, π2) = (0) π + 2(1 β π) = 2 β 2π
π1( πΆπππ, π2) = π1( πΉπ’π‘πππ, π2) β π = 2 β 2π β π = 2/3
Cuando π = 2/3, J1 es indiferente respecto de sus dos estrategias puras y por lo tanto respecto de
cualquiera de sus estrategias mixtas
82. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
GrΓ‘ficamente:
83. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Ejemplo: HalcΓ³n-Paloma (otra vez!)
Dos individuos pueden comportarse de manera agresiva (HalcΓ³n) o pacΓfica (Paloma) por la posesiΓ³n de
un objeto de valor, V. Si los dos se comportan en modo agresivo, del conflicto resultante surgirΓ‘n unos
costos C. Si ambos se comportan de manera conciliadora, se repartirΓ‘n el objeto. Si uno se comporta en
forma pacΓfica y el otro no, el pacΓfico no obtienen nada y el agresivo se quedarΓ‘ con todo. Los pagos en
este juego son los que aparecen en seguida:
Jugador 2
Paloma HalcΓ³n
Jugador 1 Paloma π 2β , π 2β 0, π
HalcΓ³n π, 0 π 2β β πΆ, π 2 β πΆβ
Sean π = 2 y πΆ = 4. Los pagos para este juego son:
Jugador 2
HalcΓ³n Paloma
Jugador 1 HalcΓ³n 1, 1 0, 2
Paloma 2, 0 -3, -3
El Juego presenta dos EN en estrategias puras: (Paloma, HalcΓ³n), (HalcΓ³n, Paloma).
84. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Suponga que para J1 π1 = ( π, 1 β π) y que para J2 π1 = ( π, 1 β π). Las utilidades esperadas serΓ‘n:
π1 = ( π, 1 β π) (
1 0
2 β3
) (
π
1 β 1
) = 3π + 5π β 4ππ β 3
π2 = ( π, 1 β π) (
1 2
0 β3
) (
π
1 β 1
) = 5π + 3π β 4ππ β 3
El Jugador 1 maximiza su ganancia esperada, i.e., resuelve:
max
π
π1 = 3π + 5π β 4ππ β 3
Las condiciones relevantes para Γ³ptimo son:
ππ1
ππ
= 3 β 4π = 0 β ( π, 1 β π) = (3 4β , 1 4β )
ο§ Note que 3 β 4π < 0 β β4π < β3. Multiplicando ambos lados por (-1) se tiene que si π > 3/4
el beneficio mΓ‘ximo de J1 se torna negativo. Por lo tanto, si π > 3/4, esto es, si J2 juega Paloma, J1
deberΓa hacer π = 0, esto es, deberΓ‘ jugar HalcΓ³n.
ο§ Si 3 β 4π > 0 β π < 3/4 y J1 deberΓ‘ jugar π = 1, i.e., deberΓ‘ jugar paloma.
ο§ Cuando 3 β 4π = 0, π = 3/4 y J1 serΓ‘ indiferente entre jugar HalcΓ³n o Paloma asΓ como respecto
de cualquier otra estrategia mixta a su disposiciΓ³n.
85. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Por su parte, el Jugador 2 deberΓ‘ resolver:
max
π
π2 = 5π + 3π β 4ππ β 3
CPO:
π π2
ππ
= 3 β 4π = 0
ο§ El Jugador 2 deberΓ‘ jugar HalcΓ³n (jugarΓ‘ π = 0), siempre que J1 juegue π > 3/4 (siempre que J1,
juegue Paloma);
ο§ El Jugador 2 deberΓ‘ jugar Paloma (jugarΓ‘ π = 1) siempre que J1 juegue π < 3/4 (i.e., siempre que
J1, juegue HalcΓ³n);
ο§ El Jugador 2 serΓ‘ indiferente respecto de sus estrategias puras y de cualquier combinaciΓ³n lineal de
ellas, siempre que π = 3/4
86. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
GrΓ‘ficamente, el juego HalcΓ³n-Paloma adquiere la siguiente manifestaciΓ³n:
87. TeorΓa de los Juegos β Equilibrio de Nash //
@JackFlash
Teorema: Equilibrio de Nash (Existencia)
Sea el Juego Ξ = [ π; π1, β¦ , π π; π’1, β¦ , π’ π]. Suponga que se cumplen:
i. ππ es subconjunto no vacΓo y compacto de β π
ii. π’π es continua en π = β ππ = π1 Γ π2 Γ β― Γ π π
π
π=1 y es estrictamente cuasicΓ³ncava en π π
Entonces, existe al menos un Equilibrio de Nash en Estrategias Puras para Ξ
DemostraciΓ³n: Ver Fundenberg and Tirole 1992.
Corolario (Nash, 1950):
En todo juego finito Ξ = [ π; π1, β¦ , π π; π’1, β¦ , π’ π], existe al menos un Equilibrio de Nash en estrategias
Mixtas bajo i. y ii.
DemostraciΓ³n: Ver PJC 2004: 173