SlideShare una empresa de Scribd logo
1 de 6
Descargar para leer sin conexión
INTRODUCCIÓN
La Teoría de Juegos estudia de manera formal y abstracta las decisiones
óptimas que deben tomar diversos adversarios en conflicto, pudiendo definirse
como el estudio de modelos matemáticos que describen el conflicto y la
cooperación entre entes inteligentes que toman decisiones. Tales decisiones se
consideran estratégicas, es decir, que los entes que participan en el juego actúan
teniendo en cuanta las acciones que tomarían los demás. Los agentes tienen
que considerar las acciones de los demás agentes ya que pueden introducir
muchos problemas al momento de encontrar la solución.
MARCO TEÓRICO
JUEGOS
La Teoría de Juegos estudia de manera formal y abstracta las decisiones
óptimas que deben tomar diversos adversarios en conflicto, pudiendo definirse
como el estudio de modelos matemáticos que describen el conflicto y la
cooperación entre entes inteligentes que toman decisiones. Tales decisiones se
consideran estratégicas, es decir, que los entes que participan en el juego actúan
teniendo en cuanta las acciones que tomarían los demás.
La teoría de juegos es capaz de ofrecer cuestiones de interés para estudiantes
de todas las ramas de las Ciencias Sociales y la Biología, así como técnicas para
tomar decisiones prácticas.
Aunque la palabra “juego” tiene connotaciones lúdicas y relativas al azar, la
teoría de juegos no tiene como principal objetivo el estudio de los juegos de
salón, aunque sí entran dentro de su dominio. Una terminología alternativa que
ilustra más claramente el objeto de la Teoría de Juegos es el “análisis
matemático de conflictos” y la “toma interactiva de decisiones”.
DECISIONES ÓPTIMAS EN JUEGO
Un juego puede definirse formalmente como una clase de problemas de
búsqueda con los componentes siguientes:
 Estado inicial: Que incluye la posición del tablero e identifica al jugador
que mueve.
 Función sucesor: Que devuelve una lista de pares (movimiento,
estado), indicando un movimiento legal y el estado que resulta.
 Test terminal: Que determina cuándo se termina el juego. A los estados
donde el juego se ha terminado se les llaman estados terminales.
 Función utilidad (también llamada función objetivo o función de
rentabilidad): Que da un valor numérico a los estados terminales. En el
ajedrez, el resultado es un triunfo, pérdida, o empate, con valores + 1, - 1
o 0.
El estado inicial y los movimientos legales para cada lado definen el árbol de
juegos mostrando la parte del árbol de juegos para el juego tres en raya.
Desde el estado inicial, max tiene nueve movimientos posibles. El juego alterna
entre la colocación de una X para max y la colocación de un O para min, hasta
que alcancemos nodos hoja correspondientes a estados terminales, de modo
que un jugador tenga tres en raya o todos los cuadrados estén llenos. El número
sobre cada nodo hoja indica el valor de utilidad del estado terminal desde el
punto de vista de max; se supone que los valores altos son buenos para max y
malos para min (por eso los nombres de los jugadores). Este trabajo de max al
usar el árbol de búsqueda (en particular la utilidad de estados terminales)
determina el mejor movimiento.
ESTRATEGIAS ÓPTIMAS
En un problema de búsqueda normal, la solución óptima sería una secuencia de
movimientos que conducen a un estado objetivo (un estado terminal que es
ganador). En un juego, por otra parte, min tiene algo que decir sobre ello. Max
por lo tanto debe encontrar una estrategia a contingente, que especifica el
movimiento de max en el estado inicial, después los movimientos de max en los
estados que resultan de cada respuesta posible de min, después los
movimientos de max en los estados que resultan de cada respuesta posible de
min de los menores movimientos, etcétera. Hablando de forma aproximada, una
estrategia óptima conduce a resultados al menos tan buenos como cualquier otra
estrategia cuando uno juega con un oponente infalible. Comenzaremos
mostrando cómo encontrar esta estrategia óptima, aunque será infactible, para
max, al calcularla en juegos más complejos que tres en raya.
Considerando un árbol de juegos, la estrategia óptima puede determinarse
examinando el valor minimax cada nodo, que escribimos como el Valor
Minimax(n). El valor minimax de un nodo es la utilidad (para max) de estar en el
estado correspondiente, asumiendo que ambos jugadores juegan óptimamente
desde allí al final del juego. Obviamente, el valor minimax de un estado terminal
es solamente su utilidad. Además, considerando una opción, max preferirá
moverse a un estado de valor máximo, mientras que min prefiere un estado de
valor mínimo.
Apliquemos estas definiciones al árbol de juegos de la Figura 6.2. Los nodos
terminales se etiquetan por sus valores de utilidad. El primer nodo de min,
etiquetado B, tiene tres sucesores con valores 3, 12 y 8, entonces su valor
minimax es 3. Del mismo modo, los otros dos nodos de min tienen un valor
minimax de 2. El nodo raíz es un nodo max; sus sucesores tienen valores
minimax de 3, 2 y 2; entonces tiene un valor minimax de 3.
Podemos identificar también la decisión minimax en la raíz: la acción a¡ es la
opción óptima para max porque conduce al sucesor con el valor minimax más
alto. Esta definición de juego óptimo para max supone que min también juega
óptimamente (maximiza los resultados del caso-peor para max). ¿Y si min no
juega óptimamente? Entonces es fácil demostrar (Ejercicio 6.2) que max lo hará
aún mejor. Puede haber otras estrategias contra oponentes subóptimos que lo
hagan mejor que la estrategia minimax; pero estas estrategias necesariamente
lo hacen peor contra oponentes óptimos.
EL ALGORITMO MINIMAX
En teoría de juegos, minimax es un método de decisión para minimizar la
pérdida máxima esperada en juegos con adversario y con información perfecta.
Minimax es un algoritmo recursivo.
El funcionamiento de minimax puede resumirse como elegir el mejor movimiento
para ti mismo suponiendo que tu contrincante escogerá el peor para ti.
Algoritmo minimax con movimientos alternativos
Pasos del algoritmo minimax:
1. Generación del árbol de juego. Se generarán todos los nodos hasta llegar
a un estado terminal.
2. Cálculo de los valores de la función de utilidad para cada nodo terminal.
3. Calcular el valor de los nodos superiores a partir del valor de los inferiores.
Según nivel si es MAX o MIN se elegirán los valores mínimos y máximos
representando los movimientos del jugador y del oponente, de ahí el
nombre de minimax.
4. Elegir la jugada valorando los valores que han llegado al nivel superior.
El algoritmo explorará los nodos del árbol asignándoles un valor numérico
mediante una función de evaluación, empezando por los nodos terminales y
subiendo hacia la raíz. La función de utilidad definirá lo buena que es la posición
para un jugador cuando la alcanza. En el caso del ajedrez los posibles valores
son (+1, 0 ,-1) que se corresponden con ganar, empatar y perder
respectivamente. En el caso del backgammon los posibles valores tendrán un
rango de [+192,-192], correspondiéndose con el valor de las fichas. Para cada
juego pueden ser diferentes.
Si minimax se enfrenta con el dilema del prisionero escogerá siempre la opción
con la cual maximiza su resultado suponiendo que el contrincante intenta
minimizarlo y hacernos perder.
CONCLUSIÓN
Las estrategias maximin y minimax conducen a los dos jugadores del juego a
situaciones en las que ningún jugador tiene razón o incentivo alguno para
cambiar su posición. Así mismo, se dice que un jugador posee una estrategia
dominante si una estrategia particular es preferida a cualquier otra estrategia a
disposición de él.
BIBLIOGRAFÍA
 Russell, S., Norvig, P. 2008. Inteligencia Artificial Un Enfoque Moderno.
Segunda Edición. Pearson Education. España.
 Fernando Fernández Rodríguez. 2005. Teoría de juegos: análisis
matemático de conflictos. Curso Interuniversitario “Sociedad, Ciencia,
Tecnología y Matemáticas”

Más contenido relacionado

La actualidad más candente

Ensayo auditoria de sistemas
Ensayo auditoria de sistemasEnsayo auditoria de sistemas
Ensayo auditoria de sistemas
kathia_mile
 
Sistema de informacion Para Ejecutivo - caso nestle
Sistema de informacion Para Ejecutivo - caso nestleSistema de informacion Para Ejecutivo - caso nestle
Sistema de informacion Para Ejecutivo - caso nestle
Eyrova
 
Redes de datos. redes internas y externas
Redes de datos. redes internas y externasRedes de datos. redes internas y externas
Redes de datos. redes internas y externas
Rodrigo Alejandro
 

La actualidad más candente (20)

Que es y como usar nmap
Que es y como usar nmapQue es y como usar nmap
Que es y como usar nmap
 
Computacion verde
Computacion verdeComputacion verde
Computacion verde
 
Cuestionario para una Auditoria Informática
Cuestionario para una Auditoria InformáticaCuestionario para una Auditoria Informática
Cuestionario para una Auditoria Informática
 
Ext2
Ext2Ext2
Ext2
 
Modelo - Metodologia HEFESTO.pdf
Modelo - Metodologia HEFESTO.pdfModelo - Metodologia HEFESTO.pdf
Modelo - Metodologia HEFESTO.pdf
 
Sistemas Distribuidos. Diseño e Implementacion
Sistemas Distribuidos. Diseño e ImplementacionSistemas Distribuidos. Diseño e Implementacion
Sistemas Distribuidos. Diseño e Implementacion
 
Seguridad linux 2011
Seguridad linux 2011Seguridad linux 2011
Seguridad linux 2011
 
Ensayo auditoria de sistemas
Ensayo auditoria de sistemasEnsayo auditoria de sistemas
Ensayo auditoria de sistemas
 
Sistema de Información, Organización y Estrategias
Sistema de Información, Organización y EstrategiasSistema de Información, Organización y Estrategias
Sistema de Información, Organización y Estrategias
 
Sistema de informacion Para Ejecutivo - caso nestle
Sistema de informacion Para Ejecutivo - caso nestleSistema de informacion Para Ejecutivo - caso nestle
Sistema de informacion Para Ejecutivo - caso nestle
 
Auditoria en un Centro de Computo
Auditoria en un Centro de ComputoAuditoria en un Centro de Computo
Auditoria en un Centro de Computo
 
Nagios
NagiosNagios
Nagios
 
Seguridad y auditoria informatica, iso 17799
Seguridad y auditoria informatica, iso 17799Seguridad y auditoria informatica, iso 17799
Seguridad y auditoria informatica, iso 17799
 
Auditoria Informatica
Auditoria InformaticaAuditoria Informatica
Auditoria Informatica
 
Dispositivos de Redes
Dispositivos de RedesDispositivos de Redes
Dispositivos de Redes
 
Sistema Operativo Distribuido
Sistema Operativo DistribuidoSistema Operativo Distribuido
Sistema Operativo Distribuido
 
Cuadro comparativo
Cuadro comparativoCuadro comparativo
Cuadro comparativo
 
Ticm10p
Ticm10pTicm10p
Ticm10p
 
Protocolos d comunicacion
Protocolos d comunicacionProtocolos d comunicacion
Protocolos d comunicacion
 
Redes de datos. redes internas y externas
Redes de datos. redes internas y externasRedes de datos. redes internas y externas
Redes de datos. redes internas y externas
 

Destacado

El trabajo de sauco[1]
El trabajo de sauco[1]El trabajo de sauco[1]
El trabajo de sauco[1]
Marilyn Daily
 
Lolium multiflorum (rye grass anual, italiano)
Lolium multiflorum (rye grass anual, italiano)Lolium multiflorum (rye grass anual, italiano)
Lolium multiflorum (rye grass anual, italiano)
DavidOrtiz90
 
Tema 2 origen del comportamiento
Tema 2 origen del comportamientoTema 2 origen del comportamiento
Tema 2 origen del comportamiento
Alvaro Javier
 
IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...
IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...
IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...
Julian Cadosch
 

Destacado (18)

COMPORTAMIENTO REPRODUCTIVO DE LOS CERDOS
COMPORTAMIENTO REPRODUCTIVO DE LOS CERDOSCOMPORTAMIENTO REPRODUCTIVO DE LOS CERDOS
COMPORTAMIENTO REPRODUCTIVO DE LOS CERDOS
 
El sauco
El saucoEl sauco
El sauco
 
El sauco
El saucoEl sauco
El sauco
 
Holcus lanatus
Holcus lanatusHolcus lanatus
Holcus lanatus
 
El trabajo de sauco[1]
El trabajo de sauco[1]El trabajo de sauco[1]
El trabajo de sauco[1]
 
PASTO LLORÓN
PASTO LLORÓNPASTO LLORÓN
PASTO LLORÓN
 
El sauco
El saucoEl sauco
El sauco
 
Pasto lloron
Pasto lloronPasto lloron
Pasto lloron
 
Pasto azul
Pasto azulPasto azul
Pasto azul
 
Ray grass perenne
Ray grass perenneRay grass perenne
Ray grass perenne
 
Lolium multiflorum (rye grass anual, italiano)
Lolium multiflorum (rye grass anual, italiano)Lolium multiflorum (rye grass anual, italiano)
Lolium multiflorum (rye grass anual, italiano)
 
CONDUCTA SEXUAL DEL MACHO
CONDUCTA SEXUAL DEL MACHOCONDUCTA SEXUAL DEL MACHO
CONDUCTA SEXUAL DEL MACHO
 
Tema 2 origen del comportamiento
Tema 2 origen del comportamientoTema 2 origen del comportamiento
Tema 2 origen del comportamiento
 
King grass pasto
King grass pastoKing grass pasto
King grass pasto
 
Proyecto tesis sauco final
Proyecto tesis sauco finalProyecto tesis sauco final
Proyecto tesis sauco final
 
Pasto king grass morado
Pasto king grass moradoPasto king grass morado
Pasto king grass morado
 
IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...
IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...
IMPLEMENTACION DE UN SISTEMA SILVOPASTORIL CON INCLUSION DE SAUCO (SAMBUCUS N...
 
Pastos y forrajes
Pastos y forrajesPastos y forrajes
Pastos y forrajes
 

Similar a Decisiones Optimas en Juego

Busqueda entre adversarios
Busqueda entre adversariosBusqueda entre adversarios
Busqueda entre adversarios
gvnyps
 
Paper
PaperPaper
Paper
Alex
 
Exp BúSqueda Entre Adversarios
Exp BúSqueda Entre AdversariosExp BúSqueda Entre Adversarios
Exp BúSqueda Entre Adversarios
Diana
 
Teoria de juegos
Teoria de juegosTeoria de juegos
Teoria de juegos
jhonflr02
 

Similar a Decisiones Optimas en Juego (20)

Arboles min max
Arboles min maxArboles min max
Arboles min max
 
Busqueda entre adversarios
Busqueda entre adversariosBusqueda entre adversarios
Busqueda entre adversarios
 
Búsqueda entre adversarios
Búsqueda entre adversariosBúsqueda entre adversarios
Búsqueda entre adversarios
 
Teoria del juego
Teoria del juegoTeoria del juego
Teoria del juego
 
Paper
PaperPaper
Paper
 
Exp BúSqueda Entre Adversarios
Exp BúSqueda Entre AdversariosExp BúSqueda Entre Adversarios
Exp BúSqueda Entre Adversarios
 
Teoria de juegos
Teoria de juegosTeoria de juegos
Teoria de juegos
 
Minimax
MinimaxMinimax
Minimax
 
Teoria de los juegos
Teoria de los juegosTeoria de los juegos
Teoria de los juegos
 
TEORIA DE JUEGOS STALIN MEZA
TEORIA DE JUEGOS STALIN MEZATEORIA DE JUEGOS STALIN MEZA
TEORIA DE JUEGOS STALIN MEZA
 
Decisiones optimas en juego
Decisiones optimas en juegoDecisiones optimas en juego
Decisiones optimas en juego
 
Teoria de juegos
Teoria de juegosTeoria de juegos
Teoria de juegos
 
MinMax
MinMaxMinMax
MinMax
 
Teoría de Juegos
Teoría de JuegosTeoría de Juegos
Teoría de Juegos
 
Revista unidad iii teoria de los juegos
Revista unidad iii teoria de los juegosRevista unidad iii teoria de los juegos
Revista unidad iii teoria de los juegos
 
Teoría de Juegos - Daniel Velásquez
Teoría de Juegos - Daniel VelásquezTeoría de Juegos - Daniel Velásquez
Teoría de Juegos - Daniel Velásquez
 
Introduccion a la teoria de juegos
Introduccion a la teoria de juegosIntroduccion a la teoria de juegos
Introduccion a la teoria de juegos
 
Teoria de juegos
Teoria de juegosTeoria de juegos
Teoria de juegos
 
Ffernandez
FfernandezFfernandez
Ffernandez
 
teoria de juegoss.pptx
teoria de juegoss.pptxteoria de juegoss.pptx
teoria de juegoss.pptx
 

Más de Karen Mendoza (10)

Ejercicios
EjerciciosEjercicios
Ejercicios
 
Estructura
Estructura Estructura
Estructura
 
Introducción
IntroducciónIntroducción
Introducción
 
Poda Alfa-Beta
Poda Alfa-BetaPoda Alfa-Beta
Poda Alfa-Beta
 
Agentes de Búsqueda Online y Ambientes Desconocidos
Agentes de Búsqueda Online y Ambientes DesconocidosAgentes de Búsqueda Online y Ambientes Desconocidos
Agentes de Búsqueda Online y Ambientes Desconocidos
 
Algoritmo Genético
Algoritmo GenéticoAlgoritmo Genético
Algoritmo Genético
 
Algoritmo Genético
Algoritmo GenéticoAlgoritmo Genético
Algoritmo Genético
 
Portada
PortadaPortada
Portada
 
Búsqueda Informada y Explorada
Búsqueda Informada y ExploradaBúsqueda Informada y Explorada
Búsqueda Informada y Explorada
 
Funciones Heurísticas
Funciones HeurísticasFunciones Heurísticas
Funciones Heurísticas
 

Último

sistema de CLORACIÓN DE AGUA POTABLE gst
sistema de CLORACIÓN DE AGUA POTABLE gstsistema de CLORACIÓN DE AGUA POTABLE gst
sistema de CLORACIÓN DE AGUA POTABLE gst
DavidRojas870673
 

Último (20)

ingenieria grafica para la carrera de ingeniera .pptx
ingenieria grafica para la carrera de ingeniera .pptxingenieria grafica para la carrera de ingeniera .pptx
ingenieria grafica para la carrera de ingeniera .pptx
 
27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt
 
sistema de CLORACIÓN DE AGUA POTABLE gst
sistema de CLORACIÓN DE AGUA POTABLE gstsistema de CLORACIÓN DE AGUA POTABLE gst
sistema de CLORACIÓN DE AGUA POTABLE gst
 
docsity-manzaneo-y-lotizacion para habilitacopm urbana
docsity-manzaneo-y-lotizacion para habilitacopm urbanadocsity-manzaneo-y-lotizacion para habilitacopm urbana
docsity-manzaneo-y-lotizacion para habilitacopm urbana
 
entropia y neguentropia en la teoria general de sistemas
entropia y neguentropia en la teoria general de sistemasentropia y neguentropia en la teoria general de sistemas
entropia y neguentropia en la teoria general de sistemas
 
“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...
“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...
“Análisis comparativo de viscosidad entre los fluidos de yogurt natural, acei...
 
3er Informe Laboratorio Quimica General (2) (1).pdf
3er Informe Laboratorio Quimica General  (2) (1).pdf3er Informe Laboratorio Quimica General  (2) (1).pdf
3er Informe Laboratorio Quimica General (2) (1).pdf
 
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
 
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.pptTippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
 
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVOESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
ESPECIFICACIONES TECNICAS COMPLEJO DEPORTIVO
 
422382393-Curso-de-Tableros-Electricos.pptx
422382393-Curso-de-Tableros-Electricos.pptx422382393-Curso-de-Tableros-Electricos.pptx
422382393-Curso-de-Tableros-Electricos.pptx
 
GUIA DE SEGURIDAD PARA VENTILACION DE MINAS-POSITIVA.pdf
GUIA DE SEGURIDAD PARA VENTILACION DE MINAS-POSITIVA.pdfGUIA DE SEGURIDAD PARA VENTILACION DE MINAS-POSITIVA.pdf
GUIA DE SEGURIDAD PARA VENTILACION DE MINAS-POSITIVA.pdf
 
CAPACITACIÓN EN AGUA Y SANEAMIENTO EN ZONAS RURALES
CAPACITACIÓN EN AGUA Y SANEAMIENTO EN ZONAS RURALESCAPACITACIÓN EN AGUA Y SANEAMIENTO EN ZONAS RURALES
CAPACITACIÓN EN AGUA Y SANEAMIENTO EN ZONAS RURALES
 
Análisis de Costos y Presupuestos CAPECO
Análisis de Costos y Presupuestos CAPECOAnálisis de Costos y Presupuestos CAPECO
Análisis de Costos y Presupuestos CAPECO
 
2. Cristaloquimica. ingenieria geologica
2. Cristaloquimica. ingenieria geologica2. Cristaloquimica. ingenieria geologica
2. Cristaloquimica. ingenieria geologica
 
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHTAPORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
APORTES A LA ARQUITECTURA DE WALTER GROPIUS Y FRANK LLOYD WRIGHT
 
ARMADURAS METODO NODOS.pptx......................
ARMADURAS METODO NODOS.pptx......................ARMADURAS METODO NODOS.pptx......................
ARMADURAS METODO NODOS.pptx......................
 
5. MATERIALES petreos para concreto.pdf.
5. MATERIALES petreos para concreto.pdf.5. MATERIALES petreos para concreto.pdf.
5. MATERIALES petreos para concreto.pdf.
 
Arquitecto cambio de uso de suelo Limache
Arquitecto cambio de uso de suelo LimacheArquitecto cambio de uso de suelo Limache
Arquitecto cambio de uso de suelo Limache
 
portafolio final manco 2 1816827 portafolio de evidencias
portafolio final manco 2 1816827 portafolio de evidenciasportafolio final manco 2 1816827 portafolio de evidencias
portafolio final manco 2 1816827 portafolio de evidencias
 

Decisiones Optimas en Juego

  • 1. INTRODUCCIÓN La Teoría de Juegos estudia de manera formal y abstracta las decisiones óptimas que deben tomar diversos adversarios en conflicto, pudiendo definirse como el estudio de modelos matemáticos que describen el conflicto y la cooperación entre entes inteligentes que toman decisiones. Tales decisiones se consideran estratégicas, es decir, que los entes que participan en el juego actúan teniendo en cuanta las acciones que tomarían los demás. Los agentes tienen que considerar las acciones de los demás agentes ya que pueden introducir muchos problemas al momento de encontrar la solución. MARCO TEÓRICO JUEGOS La Teoría de Juegos estudia de manera formal y abstracta las decisiones óptimas que deben tomar diversos adversarios en conflicto, pudiendo definirse como el estudio de modelos matemáticos que describen el conflicto y la cooperación entre entes inteligentes que toman decisiones. Tales decisiones se consideran estratégicas, es decir, que los entes que participan en el juego actúan teniendo en cuanta las acciones que tomarían los demás. La teoría de juegos es capaz de ofrecer cuestiones de interés para estudiantes de todas las ramas de las Ciencias Sociales y la Biología, así como técnicas para tomar decisiones prácticas. Aunque la palabra “juego” tiene connotaciones lúdicas y relativas al azar, la teoría de juegos no tiene como principal objetivo el estudio de los juegos de salón, aunque sí entran dentro de su dominio. Una terminología alternativa que ilustra más claramente el objeto de la Teoría de Juegos es el “análisis matemático de conflictos” y la “toma interactiva de decisiones”. DECISIONES ÓPTIMAS EN JUEGO Un juego puede definirse formalmente como una clase de problemas de búsqueda con los componentes siguientes:
  • 2.  Estado inicial: Que incluye la posición del tablero e identifica al jugador que mueve.  Función sucesor: Que devuelve una lista de pares (movimiento, estado), indicando un movimiento legal y el estado que resulta.  Test terminal: Que determina cuándo se termina el juego. A los estados donde el juego se ha terminado se les llaman estados terminales.  Función utilidad (también llamada función objetivo o función de rentabilidad): Que da un valor numérico a los estados terminales. En el ajedrez, el resultado es un triunfo, pérdida, o empate, con valores + 1, - 1 o 0. El estado inicial y los movimientos legales para cada lado definen el árbol de juegos mostrando la parte del árbol de juegos para el juego tres en raya. Desde el estado inicial, max tiene nueve movimientos posibles. El juego alterna entre la colocación de una X para max y la colocación de un O para min, hasta que alcancemos nodos hoja correspondientes a estados terminales, de modo que un jugador tenga tres en raya o todos los cuadrados estén llenos. El número sobre cada nodo hoja indica el valor de utilidad del estado terminal desde el punto de vista de max; se supone que los valores altos son buenos para max y
  • 3. malos para min (por eso los nombres de los jugadores). Este trabajo de max al usar el árbol de búsqueda (en particular la utilidad de estados terminales) determina el mejor movimiento. ESTRATEGIAS ÓPTIMAS En un problema de búsqueda normal, la solución óptima sería una secuencia de movimientos que conducen a un estado objetivo (un estado terminal que es ganador). En un juego, por otra parte, min tiene algo que decir sobre ello. Max por lo tanto debe encontrar una estrategia a contingente, que especifica el movimiento de max en el estado inicial, después los movimientos de max en los estados que resultan de cada respuesta posible de min, después los movimientos de max en los estados que resultan de cada respuesta posible de min de los menores movimientos, etcétera. Hablando de forma aproximada, una estrategia óptima conduce a resultados al menos tan buenos como cualquier otra estrategia cuando uno juega con un oponente infalible. Comenzaremos mostrando cómo encontrar esta estrategia óptima, aunque será infactible, para max, al calcularla en juegos más complejos que tres en raya. Considerando un árbol de juegos, la estrategia óptima puede determinarse examinando el valor minimax cada nodo, que escribimos como el Valor Minimax(n). El valor minimax de un nodo es la utilidad (para max) de estar en el estado correspondiente, asumiendo que ambos jugadores juegan óptimamente desde allí al final del juego. Obviamente, el valor minimax de un estado terminal es solamente su utilidad. Además, considerando una opción, max preferirá moverse a un estado de valor máximo, mientras que min prefiere un estado de valor mínimo.
  • 4. Apliquemos estas definiciones al árbol de juegos de la Figura 6.2. Los nodos terminales se etiquetan por sus valores de utilidad. El primer nodo de min, etiquetado B, tiene tres sucesores con valores 3, 12 y 8, entonces su valor minimax es 3. Del mismo modo, los otros dos nodos de min tienen un valor minimax de 2. El nodo raíz es un nodo max; sus sucesores tienen valores minimax de 3, 2 y 2; entonces tiene un valor minimax de 3. Podemos identificar también la decisión minimax en la raíz: la acción a¡ es la opción óptima para max porque conduce al sucesor con el valor minimax más alto. Esta definición de juego óptimo para max supone que min también juega óptimamente (maximiza los resultados del caso-peor para max). ¿Y si min no juega óptimamente? Entonces es fácil demostrar (Ejercicio 6.2) que max lo hará aún mejor. Puede haber otras estrategias contra oponentes subóptimos que lo hagan mejor que la estrategia minimax; pero estas estrategias necesariamente lo hacen peor contra oponentes óptimos. EL ALGORITMO MINIMAX En teoría de juegos, minimax es un método de decisión para minimizar la pérdida máxima esperada en juegos con adversario y con información perfecta. Minimax es un algoritmo recursivo. El funcionamiento de minimax puede resumirse como elegir el mejor movimiento para ti mismo suponiendo que tu contrincante escogerá el peor para ti.
  • 5. Algoritmo minimax con movimientos alternativos Pasos del algoritmo minimax: 1. Generación del árbol de juego. Se generarán todos los nodos hasta llegar a un estado terminal. 2. Cálculo de los valores de la función de utilidad para cada nodo terminal. 3. Calcular el valor de los nodos superiores a partir del valor de los inferiores. Según nivel si es MAX o MIN se elegirán los valores mínimos y máximos representando los movimientos del jugador y del oponente, de ahí el nombre de minimax. 4. Elegir la jugada valorando los valores que han llegado al nivel superior. El algoritmo explorará los nodos del árbol asignándoles un valor numérico mediante una función de evaluación, empezando por los nodos terminales y subiendo hacia la raíz. La función de utilidad definirá lo buena que es la posición para un jugador cuando la alcanza. En el caso del ajedrez los posibles valores son (+1, 0 ,-1) que se corresponden con ganar, empatar y perder respectivamente. En el caso del backgammon los posibles valores tendrán un rango de [+192,-192], correspondiéndose con el valor de las fichas. Para cada juego pueden ser diferentes. Si minimax se enfrenta con el dilema del prisionero escogerá siempre la opción con la cual maximiza su resultado suponiendo que el contrincante intenta minimizarlo y hacernos perder.
  • 6. CONCLUSIÓN Las estrategias maximin y minimax conducen a los dos jugadores del juego a situaciones en las que ningún jugador tiene razón o incentivo alguno para cambiar su posición. Así mismo, se dice que un jugador posee una estrategia dominante si una estrategia particular es preferida a cualquier otra estrategia a disposición de él. BIBLIOGRAFÍA  Russell, S., Norvig, P. 2008. Inteligencia Artificial Un Enfoque Moderno. Segunda Edición. Pearson Education. España.  Fernando Fernández Rodríguez. 2005. Teoría de juegos: análisis matemático de conflictos. Curso Interuniversitario “Sociedad, Ciencia, Tecnología y Matemáticas”