portafolio final manco 2 1816827 portafolio de evidencias
Decisiones Optimas en Juego
1. INTRODUCCIÓN
La Teoría de Juegos estudia de manera formal y abstracta las decisiones
óptimas que deben tomar diversos adversarios en conflicto, pudiendo definirse
como el estudio de modelos matemáticos que describen el conflicto y la
cooperación entre entes inteligentes que toman decisiones. Tales decisiones se
consideran estratégicas, es decir, que los entes que participan en el juego actúan
teniendo en cuanta las acciones que tomarían los demás. Los agentes tienen
que considerar las acciones de los demás agentes ya que pueden introducir
muchos problemas al momento de encontrar la solución.
MARCO TEÓRICO
JUEGOS
La Teoría de Juegos estudia de manera formal y abstracta las decisiones
óptimas que deben tomar diversos adversarios en conflicto, pudiendo definirse
como el estudio de modelos matemáticos que describen el conflicto y la
cooperación entre entes inteligentes que toman decisiones. Tales decisiones se
consideran estratégicas, es decir, que los entes que participan en el juego actúan
teniendo en cuanta las acciones que tomarían los demás.
La teoría de juegos es capaz de ofrecer cuestiones de interés para estudiantes
de todas las ramas de las Ciencias Sociales y la Biología, así como técnicas para
tomar decisiones prácticas.
Aunque la palabra “juego” tiene connotaciones lúdicas y relativas al azar, la
teoría de juegos no tiene como principal objetivo el estudio de los juegos de
salón, aunque sí entran dentro de su dominio. Una terminología alternativa que
ilustra más claramente el objeto de la Teoría de Juegos es el “análisis
matemático de conflictos” y la “toma interactiva de decisiones”.
DECISIONES ÓPTIMAS EN JUEGO
Un juego puede definirse formalmente como una clase de problemas de
búsqueda con los componentes siguientes:
2. Estado inicial: Que incluye la posición del tablero e identifica al jugador
que mueve.
Función sucesor: Que devuelve una lista de pares (movimiento,
estado), indicando un movimiento legal y el estado que resulta.
Test terminal: Que determina cuándo se termina el juego. A los estados
donde el juego se ha terminado se les llaman estados terminales.
Función utilidad (también llamada función objetivo o función de
rentabilidad): Que da un valor numérico a los estados terminales. En el
ajedrez, el resultado es un triunfo, pérdida, o empate, con valores + 1, - 1
o 0.
El estado inicial y los movimientos legales para cada lado definen el árbol de
juegos mostrando la parte del árbol de juegos para el juego tres en raya.
Desde el estado inicial, max tiene nueve movimientos posibles. El juego alterna
entre la colocación de una X para max y la colocación de un O para min, hasta
que alcancemos nodos hoja correspondientes a estados terminales, de modo
que un jugador tenga tres en raya o todos los cuadrados estén llenos. El número
sobre cada nodo hoja indica el valor de utilidad del estado terminal desde el
punto de vista de max; se supone que los valores altos son buenos para max y
3. malos para min (por eso los nombres de los jugadores). Este trabajo de max al
usar el árbol de búsqueda (en particular la utilidad de estados terminales)
determina el mejor movimiento.
ESTRATEGIAS ÓPTIMAS
En un problema de búsqueda normal, la solución óptima sería una secuencia de
movimientos que conducen a un estado objetivo (un estado terminal que es
ganador). En un juego, por otra parte, min tiene algo que decir sobre ello. Max
por lo tanto debe encontrar una estrategia a contingente, que especifica el
movimiento de max en el estado inicial, después los movimientos de max en los
estados que resultan de cada respuesta posible de min, después los
movimientos de max en los estados que resultan de cada respuesta posible de
min de los menores movimientos, etcétera. Hablando de forma aproximada, una
estrategia óptima conduce a resultados al menos tan buenos como cualquier otra
estrategia cuando uno juega con un oponente infalible. Comenzaremos
mostrando cómo encontrar esta estrategia óptima, aunque será infactible, para
max, al calcularla en juegos más complejos que tres en raya.
Considerando un árbol de juegos, la estrategia óptima puede determinarse
examinando el valor minimax cada nodo, que escribimos como el Valor
Minimax(n). El valor minimax de un nodo es la utilidad (para max) de estar en el
estado correspondiente, asumiendo que ambos jugadores juegan óptimamente
desde allí al final del juego. Obviamente, el valor minimax de un estado terminal
es solamente su utilidad. Además, considerando una opción, max preferirá
moverse a un estado de valor máximo, mientras que min prefiere un estado de
valor mínimo.
4. Apliquemos estas definiciones al árbol de juegos de la Figura 6.2. Los nodos
terminales se etiquetan por sus valores de utilidad. El primer nodo de min,
etiquetado B, tiene tres sucesores con valores 3, 12 y 8, entonces su valor
minimax es 3. Del mismo modo, los otros dos nodos de min tienen un valor
minimax de 2. El nodo raíz es un nodo max; sus sucesores tienen valores
minimax de 3, 2 y 2; entonces tiene un valor minimax de 3.
Podemos identificar también la decisión minimax en la raíz: la acción a¡ es la
opción óptima para max porque conduce al sucesor con el valor minimax más
alto. Esta definición de juego óptimo para max supone que min también juega
óptimamente (maximiza los resultados del caso-peor para max). ¿Y si min no
juega óptimamente? Entonces es fácil demostrar (Ejercicio 6.2) que max lo hará
aún mejor. Puede haber otras estrategias contra oponentes subóptimos que lo
hagan mejor que la estrategia minimax; pero estas estrategias necesariamente
lo hacen peor contra oponentes óptimos.
EL ALGORITMO MINIMAX
En teoría de juegos, minimax es un método de decisión para minimizar la
pérdida máxima esperada en juegos con adversario y con información perfecta.
Minimax es un algoritmo recursivo.
El funcionamiento de minimax puede resumirse como elegir el mejor movimiento
para ti mismo suponiendo que tu contrincante escogerá el peor para ti.
5. Algoritmo minimax con movimientos alternativos
Pasos del algoritmo minimax:
1. Generación del árbol de juego. Se generarán todos los nodos hasta llegar
a un estado terminal.
2. Cálculo de los valores de la función de utilidad para cada nodo terminal.
3. Calcular el valor de los nodos superiores a partir del valor de los inferiores.
Según nivel si es MAX o MIN se elegirán los valores mínimos y máximos
representando los movimientos del jugador y del oponente, de ahí el
nombre de minimax.
4. Elegir la jugada valorando los valores que han llegado al nivel superior.
El algoritmo explorará los nodos del árbol asignándoles un valor numérico
mediante una función de evaluación, empezando por los nodos terminales y
subiendo hacia la raíz. La función de utilidad definirá lo buena que es la posición
para un jugador cuando la alcanza. En el caso del ajedrez los posibles valores
son (+1, 0 ,-1) que se corresponden con ganar, empatar y perder
respectivamente. En el caso del backgammon los posibles valores tendrán un
rango de [+192,-192], correspondiéndose con el valor de las fichas. Para cada
juego pueden ser diferentes.
Si minimax se enfrenta con el dilema del prisionero escogerá siempre la opción
con la cual maximiza su resultado suponiendo que el contrincante intenta
minimizarlo y hacernos perder.
6. CONCLUSIÓN
Las estrategias maximin y minimax conducen a los dos jugadores del juego a
situaciones en las que ningún jugador tiene razón o incentivo alguno para
cambiar su posición. Así mismo, se dice que un jugador posee una estrategia
dominante si una estrategia particular es preferida a cualquier otra estrategia a
disposición de él.
BIBLIOGRAFÍA
Russell, S., Norvig, P. 2008. Inteligencia Artificial Un Enfoque Moderno.
Segunda Edición. Pearson Education. España.
Fernando Fernández Rodríguez. 2005. Teoría de juegos: análisis
matemático de conflictos. Curso Interuniversitario “Sociedad, Ciencia,
Tecnología y Matemáticas”