2. Teoría de juegos.
El equilibrio de Nash en juegos simples puede ser “fácil” ya que solo hay dos
jugadores y ellos solo tienen dos acciones.
3. Equilibrio de Nash para juegos de dos
jugadores / suma cero.
´ El computo de el problema del Equilibrio de Nash puede ser expresado
mediante programación lineal.
´ Así que los problemas modelados de está forma pueden ser resueltos de
forma polinómica.
5. Equilibrio de Nash para juegos de dos
jugadores / suma cero.
Variables de holgura o excedente. Son variables que se agregan a la restricción para que larelación de la restricción sea de
igualdad (representa el valor que le hace falta al lado izquierdopara ser igual al lado derecho). Ambos tipos de variables tienen que
cumplir con la restricciónde no negatividad
6. Computing Nash equilibria of two-
player, general-sum games.
´ Desafortunadamente, el problema de encontrar un Equilibrio de Nash en
un juego de dos jugadores y suma general no puede ser formulado en PL.
´ Porque los jugadores no tratan de minimizar las utilidades de sus
oponentes.
7. An LCP formulation and the Lemke–
Howson algorithm
´ El algoritmo Lemke–Howson.
´ Es el mejor algoritmo que permite encontrar el Equilibrio de Nash en un
juego de Suma general.
8. The LCP formulation.
´ Los problemas de suma general para dos jugadores no pueden ser
formulados en PL, pero pueden ser formulados como un “Problema de
Complementariedad Lineal”(LCP).
El nombre proviene de la condición xTy = 0 que se llama
condición de complementariedad ya que requiere que al
menos una de las variables del par (xj,yj) sea igual a cero en la
solución del problema, para j=1,...,n.
12. Reescribiendo…
Las formulas tienen la siguiente forma v = c + qu + T,
donde v es la variable de choque, c es una constante
(inicialmente todos ellas son 1), u es la variable de
entrada, q es un coeficiente constante, y T es una
combinación lineal de variables que no sean v o u.
La variable de choque para salir es el que está en
cuya ecuación la relación q / c es más pequeño.
15. Propiedades el algoritmo Lemke-
Howson.
´ Encuentra una muestra del Equilibrio de Nash en el juego.
´ Se puede encontrar más de una muestra del Equilibrio de Nash.
´ No garantiza encontrar un equilibrio ya que hace un recorrido por nodos
conectados.
´ No garantiza que ha encontrado todos los Equilibrios de Nash.
16. Beyond sample equilibrium
computation.
´ No solamente interesa buscar una muestra del Equilibrio de Nash; sino
encontrar un equilibrio con propiedades específicas.
´ Teorema.
´ Computar todos los equilibrios para dos jugadores, en un juego de suma
general exige el peor caso en tiempo , que es exponencial según el número de
acciones de cada jugador.
17. Computing Nash equilibria of n-player,
general-sum games
´ Para los juegos de n-jugador en el que n ≥ 3, el problema de encontrar un
equilibrio de Nash ya no puede ser representados incluso como LCP
´ Para ello existen varios enfoques.
18. Computing Nash equilibria of n-player,
general-sum games
´ En lugar de resolver el problema complementariedad no lineal exactamente, ha
habido cierto éxito en la aproximación de la solución usando una secuencia de
problemas complementariedad lineales (SLCP).
´ Cada LCP es una aproximación del problema, y su solución se utiliza para crear
la siguiente aproximación en la secuencia.
´ Aunque este método no es globalmente convergente, en la práctica, a
menudo es posible probar un número de diferentes puntos de partida, debido a
su velocidad relativa.
19. Computing maxmin and minmax strategies
for two-player, general- sum games
´ Sea G un juego arbitrario de dos jugadores G = ({1, 2}, A1 × A2, (U1, U2)).
´ Calculando maxmin para 1obtenemos: G '= ({1, 2}, A1 × A2, (u1, -u1)).
´ Por definición, la estrategia maxmin del jugador 1 es independiente de la
función de utilidad del jugador 2. Por lo tanto, la estrategia maxmin del
jugador 1 es el mismo en G y G ’.
´ Nuestro problema de encontrar una estrategia maxmin en G reduce así a
la búsqueda de un equilibrio de Nash de G '
20. Referencias.
´ Sobre el uso del problema de complementariedad lineal extendido para el
control óptimo de semáforos, S. Allende Alonso,Universidad de la Habana
(La Habana-Cuba) ,C. S. Lema Fernández ,L. P. Pedreira Andrade
´ Game Theory and Algorithms∗ Lecture 6: The Lemke-Howson Algorithm.
´ C. E. Lemke and J. J. T. Howson. Equilibrium points of bimatrix games. SIAM
Journal on Applied Mathematics, 12(2):413–423, 1964.
´ MULTIAGENT SYSTEMS ,Algorithmic, Game-Theoretic, and Logical
Foundations , Yoav Shoham.