SlideShare una empresa de Scribd logo
Contenido:
Debido a que el ajedrez es un juego objetivo de IA desde
hace mucho tiempo, se presenta lo siguiente:
• Un ambiente de 2 jugadores con perfecta información.
• El árbol del juego.
• MiniMax: Propaga valores de nodos terminales a internos.
• Poda Alfa-beta: Elimina partes grandes del árbol.
• Árbol demasiado grande: no se llega a nodos terminales.
• Función de evaluación: sobre nodos a profundidad d.
• Extensiones singulares.
• Especulación: factor de ramificación.
Árbol de juegos




• Alternan jugadores por niveles
• Sucesores de un nodo: todas los movimientos
  legales que ese jugador puede hacer
MiniMax


Cuál es el mejor movimiento?
Supongo que el oponente elige el movimiento que más le conviene.
MiniMax
• Idea: propagar hacia atrás el valor de los hijos
• Nodos terminales: valor 1, -1 (gana A o gana B)
• Dos tipos de nodos:
      max: gana con 1
      min: gana con -1
• Propagación hacia atrás:
      max: el máximo de los valores de los hijos
      min: el mínimo de los valores de los hijos
Algoritmo MiniMax
Evaluar nodo n de un árbol de juegos
1. Expandir el árbol bajo n
2. Evaluar los nodos terminales.
3. Seleccionar un nodo sin valor que todos sus hijos
han
sido valuados. Si no existe, retornar el valor de n. Stop.
4. Si el nodo es max, asignar el máximo de sus hijos.
Si el nodo es min asignar el mínimo de sus hijos. Ir a 3.
Algoritmo MiniMax
El algoritmo anterior tiene un problema:
                       ¿cuál?
Supone búsqueda en anchura:
4. Si el nodo es max, asignar el máximo de sus
hijos.
Si el nodo es min asignar el mínimo de sus hijos.
Espacio exponencial
MiniMax en DFS
1. L = {n}
2. x ← extrae-primero(L).
Si x =n con valor asignado, retorna ese valor. Stop.
3. Si x tiene valor w, nodo p es padre de x con valor v
Si p es max, asignar max(v, w) a p.
Si p es min, asignar min(v, w) a p.
Eliminar x de L, ir a 2.
4. Si x no tiene valor y es un nodo terminal,
asignar +1 o -1 como valor, depende si gana para max o min
5. Si x no tiene valor y no es un nodo terminal,
asignar - ∞ o + ∞ como valor, depende si es max o min
MiniMax en DFS
Minimax ha de guardar:
• sucesores de rama actual (como DFS)
• nodos en la rama actual: para actualizar su valor
Alfa-Beta


Con una buena ordenación de sucesores,
Función de evaluación
Función de evaluación para el Ajedrez
e(n) → [-1, +1]
– sustituye la detección de nodos terminales
– es imperfecta
Ajedrez: sumar los valores de las piezas
peón, caballo, alfil, torre, reina
1 3 3 5 10
B: suma de las blancas N: suma de las negras
e(n) = B - N / B + N
Efecto Horizonte
Efecto Horizonte en Ajedrez
• Efecto horizonte: una jugada que inicialmente parece
buena puede resultar mala
• el peligro no se ve, está tras el horizonte
• la función de evaluación es incapaz de detectarlo
• Solución fuerza bruta: buscar más profundo
• coste computacional
• en ajedrez, hay muchos movimientos que
pueden retrasar una jugada de peligro
• Aproximación selectiva: identificar los nodos en los que
se debe profundizar más → extensiones singulares
Extensiones Singulares
Deep Blue
• Proyecto de IBM
•Alfa-beta paralelo:
  • Hardware especializado (2 millones posiciones / sg)
  • Extensiones singulares, quiescencia
  • Función de evaluación sofisticada
  • Biblioteca: aperturas y finales
• Resultados:
  • Venció a Kasparov en 1997
  • Ratio 2700, Kasparov 2800
  • quantity had become quality - la cantidad se había convertido
  en la calidad
Algunas especulaciones
¿Por qué los programas son buenos en ciertos
juegos y en otros no?
Hipótesis:
  • Programa = búsqueda
  • Rendimiento frente a humanos: aumenta con profundidad d
  • Número de estados a visitar bd en tiempo fijado
Depende de b factor de ramificación:
  • Si b pequeño, se puede profundizar → buen rendimiento
  • Si b grande, no se puede profundizar → rendimiento pobre
Algunas especulaciones
Factor de ramificación:
  • damas: 4
  • othello: < 10
  • ajedrez: 36
  • go: 361
el campeón mundial es un programa
Otras ideas:
  • aprendizaje (backgammon)
  • dificultad cuando se intercambian muchas piezas
Por ultimo, Gracias!
Nunca consideres el estudio como un deber, sino
como una oportunidad para penetrar en el
maravilloso mundo del saber.

Albert Einstein

Más contenido relacionado

La actualidad más candente

AI Informed Search Strategies by Examples
AI Informed Search Strategies by ExamplesAI Informed Search Strategies by Examples
AI Informed Search Strategies by Examples
Ahmed Gad
 
PODA ALFA-BETA
PODA ALFA-BETAPODA ALFA-BETA
PODA ALFA-BETA
Raquel Solano
 
Minimax
MinimaxMinimax
Minimax
sabairshad4
 
Reinforcement Learning
Reinforcement LearningReinforcement Learning
Reinforcement Learning
Salem-Kabbani
 
Ejercicios de búsqueda a Ciegas y Búsqueda informada
Ejercicios de búsqueda a Ciegas y Búsqueda informadaEjercicios de búsqueda a Ciegas y Búsqueda informada
Ejercicios de búsqueda a Ciegas y Búsqueda informada
Héctor Estigarribia
 
Criterios de Busqueda en I.A
Criterios de Busqueda en I.ACriterios de Busqueda en I.A
Criterios de Busqueda en I.A
Jose Manuel Silva Gomez
 
Búsqueda Informada y Explorada
Búsqueda Informada y ExploradaBúsqueda Informada y Explorada
Búsqueda Informada y Explorada
Karen Mendoza
 
Tipos de busquedas ia
Tipos de busquedas iaTipos de busquedas ia
Tipos de busquedas ia
PAko DiAz
 
AI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdf
AI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdfAI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdf
AI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdf
Asst.prof M.Gokilavani
 
Adversarial search
Adversarial searchAdversarial search
Adversarial search
Dheerendra k
 
Solución de problemas mediante busqueda
Solución de problemas mediante busquedaSolución de problemas mediante busqueda
Solución de problemas mediante busqueda
sacrilegetx
 
Reinforcement learning:policy gradient (part 1)
Reinforcement learning:policy gradient (part 1)Reinforcement learning:policy gradient (part 1)
Reinforcement learning:policy gradient (part 1)
Bean Yen
 
Deep Q-Learning
Deep Q-LearningDeep Q-Learning
Deep Q-Learning
Nikolay Pavlov
 
Intro to Deep Reinforcement Learning
Intro to Deep Reinforcement LearningIntro to Deep Reinforcement Learning
Intro to Deep Reinforcement Learning
Khaled Saleh
 
Depth First Search, Breadth First Search and Best First Search
Depth First Search, Breadth First Search and Best First SearchDepth First Search, Breadth First Search and Best First Search
Depth First Search, Breadth First Search and Best First Search
Adri Jovin
 
Búsqueda informada y exploración
Búsqueda informada y exploraciónBúsqueda informada y exploración
Búsqueda informada y exploración
JeffoG92
 
And or search
And or searchAnd or search
And or search
Megha Sharma
 
Tipos de búsqueda en inteligencia artificial
Tipos de búsqueda  en inteligencia artificialTipos de búsqueda  en inteligencia artificial
Tipos de búsqueda en inteligencia artificial
Henry Cambal
 
Problem solving in Artificial Intelligence.pptx
Problem solving in Artificial Intelligence.pptxProblem solving in Artificial Intelligence.pptx
Problem solving in Artificial Intelligence.pptx
kitsenthilkumarcse
 
Min-Max algorithm
Min-Max algorithmMin-Max algorithm
Min-Max algorithm
Dr. C.V. Suresh Babu
 

La actualidad más candente (20)

AI Informed Search Strategies by Examples
AI Informed Search Strategies by ExamplesAI Informed Search Strategies by Examples
AI Informed Search Strategies by Examples
 
PODA ALFA-BETA
PODA ALFA-BETAPODA ALFA-BETA
PODA ALFA-BETA
 
Minimax
MinimaxMinimax
Minimax
 
Reinforcement Learning
Reinforcement LearningReinforcement Learning
Reinforcement Learning
 
Ejercicios de búsqueda a Ciegas y Búsqueda informada
Ejercicios de búsqueda a Ciegas y Búsqueda informadaEjercicios de búsqueda a Ciegas y Búsqueda informada
Ejercicios de búsqueda a Ciegas y Búsqueda informada
 
Criterios de Busqueda en I.A
Criterios de Busqueda en I.ACriterios de Busqueda en I.A
Criterios de Busqueda en I.A
 
Búsqueda Informada y Explorada
Búsqueda Informada y ExploradaBúsqueda Informada y Explorada
Búsqueda Informada y Explorada
 
Tipos de busquedas ia
Tipos de busquedas iaTipos de busquedas ia
Tipos de busquedas ia
 
AI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdf
AI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdfAI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdf
AI3391 ARTIFICIAL INTELLIGENCE UNIT II notes.pdf
 
Adversarial search
Adversarial searchAdversarial search
Adversarial search
 
Solución de problemas mediante busqueda
Solución de problemas mediante busquedaSolución de problemas mediante busqueda
Solución de problemas mediante busqueda
 
Reinforcement learning:policy gradient (part 1)
Reinforcement learning:policy gradient (part 1)Reinforcement learning:policy gradient (part 1)
Reinforcement learning:policy gradient (part 1)
 
Deep Q-Learning
Deep Q-LearningDeep Q-Learning
Deep Q-Learning
 
Intro to Deep Reinforcement Learning
Intro to Deep Reinforcement LearningIntro to Deep Reinforcement Learning
Intro to Deep Reinforcement Learning
 
Depth First Search, Breadth First Search and Best First Search
Depth First Search, Breadth First Search and Best First SearchDepth First Search, Breadth First Search and Best First Search
Depth First Search, Breadth First Search and Best First Search
 
Búsqueda informada y exploración
Búsqueda informada y exploraciónBúsqueda informada y exploración
Búsqueda informada y exploración
 
And or search
And or searchAnd or search
And or search
 
Tipos de búsqueda en inteligencia artificial
Tipos de búsqueda  en inteligencia artificialTipos de búsqueda  en inteligencia artificial
Tipos de búsqueda en inteligencia artificial
 
Problem solving in Artificial Intelligence.pptx
Problem solving in Artificial Intelligence.pptxProblem solving in Artificial Intelligence.pptx
Problem solving in Artificial Intelligence.pptx
 
Min-Max algorithm
Min-Max algorithmMin-Max algorithm
Min-Max algorithm
 

Similar a Presentacion funciones heuristicas para el ajedrez

1789019.ppt
1789019.ppt1789019.ppt
1789019.ppt
HumbertoSalcedoMera
 
estudiante
estudiante estudiante
estudiante
antonietaantonieta1
 
cuadro comparativo
cuadro comparativocuadro comparativo
cuadro comparativo
wilmer rodriguez valera
 
Criterios de Búsquedas en Inteligencia artificial
Criterios de Búsquedas en Inteligencia artificialCriterios de Búsquedas en Inteligencia artificial
Criterios de Búsquedas en Inteligencia artificial
Mariy Torrealba
 
Exp BúSqueda Entre Adversarios
Exp BúSqueda Entre AdversariosExp BúSqueda Entre Adversarios
Exp BúSqueda Entre Adversarios
Diana
 
Tecnicas de Busqueda en IA
Tecnicas de Busqueda en IATecnicas de Busqueda en IA
Tecnicas de Busqueda en IA
AlfredoAlejo1
 
Trabajo
TrabajoTrabajo
Criterios de Búsqueda en Inteligencia Artificial
Criterios de Búsqueda en Inteligencia ArtificialCriterios de Búsqueda en Inteligencia Artificial
Criterios de Búsqueda en Inteligencia Artificial
Hilario Per'zz
 
ECImag 2010 - Clase 3/5
ECImag 2010 - Clase 3/5ECImag 2010 - Clase 3/5
ECImag 2010 - Clase 3/5
Corvalius
 

Similar a Presentacion funciones heuristicas para el ajedrez (9)

1789019.ppt
1789019.ppt1789019.ppt
1789019.ppt
 
estudiante
estudiante estudiante
estudiante
 
cuadro comparativo
cuadro comparativocuadro comparativo
cuadro comparativo
 
Criterios de Búsquedas en Inteligencia artificial
Criterios de Búsquedas en Inteligencia artificialCriterios de Búsquedas en Inteligencia artificial
Criterios de Búsquedas en Inteligencia artificial
 
Exp BúSqueda Entre Adversarios
Exp BúSqueda Entre AdversariosExp BúSqueda Entre Adversarios
Exp BúSqueda Entre Adversarios
 
Tecnicas de Busqueda en IA
Tecnicas de Busqueda en IATecnicas de Busqueda en IA
Tecnicas de Busqueda en IA
 
Trabajo
TrabajoTrabajo
Trabajo
 
Criterios de Búsqueda en Inteligencia Artificial
Criterios de Búsqueda en Inteligencia ArtificialCriterios de Búsqueda en Inteligencia Artificial
Criterios de Búsqueda en Inteligencia Artificial
 
ECImag 2010 - Clase 3/5
ECImag 2010 - Clase 3/5ECImag 2010 - Clase 3/5
ECImag 2010 - Clase 3/5
 

Más de G Hoyos A

curvas elipticas
 curvas elipticas curvas elipticas
curvas elipticas
G Hoyos A
 
correo seguro
 correo seguro correo seguro
correo seguro
G Hoyos A
 
cifra flujo
 cifra flujo cifra flujo
cifra flujo
G Hoyos A
 
composicion de algoritmos
 composicion de algoritmos composicion de algoritmos
composicion de algoritmos
G Hoyos A
 
gestion seguridad informatica
 gestion seguridad informatica gestion seguridad informatica
gestion seguridad informatica
G Hoyos A
 
calidad de la informacion
calidad de la informacioncalidad de la informacion
calidad de la informacion
G Hoyos A
 
Cripto clasica
Cripto clasicaCripto clasica
Cripto clasica
G Hoyos A
 
Presentacion cripto transp_manuel_lucena
Presentacion cripto transp_manuel_lucenaPresentacion cripto transp_manuel_lucena
Presentacion cripto transp_manuel_lucena
G Hoyos A
 
S box
S boxS box
S box
G Hoyos A
 
Xor
XorXor
Unixsec
UnixsecUnixsec
Unixsec
G Hoyos A
 
Transposicion
TransposicionTransposicion
Transposicion
G Hoyos A
 
Sellado de tiempo_timestamp
Sellado de tiempo_timestampSellado de tiempo_timestamp
Sellado de tiempo_timestamp
G Hoyos A
 
Protocolo gestor claves
Protocolo gestor clavesProtocolo gestor claves
Protocolo gestor claves
G Hoyos A
 
Problema rsa
Problema rsaProblema rsa
Problema rsa
G Hoyos A
 
Pki
PkiPki
Número primo fuerte
Número primo fuerteNúmero primo fuerte
Número primo fuerte
G Hoyos A
 
Metodo kasiski
Metodo kasiskiMetodo kasiski
Metodo kasiski
G Hoyos A
 
Modos de operación_de_una_unidad_de_cifrado_por_bloques
Modos de operación_de_una_unidad_de_cifrado_por_bloquesModos de operación_de_una_unidad_de_cifrado_por_bloques
Modos de operación_de_una_unidad_de_cifrado_por_bloques
G Hoyos A
 
Hc
HcHc

Más de G Hoyos A (20)

curvas elipticas
 curvas elipticas curvas elipticas
curvas elipticas
 
correo seguro
 correo seguro correo seguro
correo seguro
 
cifra flujo
 cifra flujo cifra flujo
cifra flujo
 
composicion de algoritmos
 composicion de algoritmos composicion de algoritmos
composicion de algoritmos
 
gestion seguridad informatica
 gestion seguridad informatica gestion seguridad informatica
gestion seguridad informatica
 
calidad de la informacion
calidad de la informacioncalidad de la informacion
calidad de la informacion
 
Cripto clasica
Cripto clasicaCripto clasica
Cripto clasica
 
Presentacion cripto transp_manuel_lucena
Presentacion cripto transp_manuel_lucenaPresentacion cripto transp_manuel_lucena
Presentacion cripto transp_manuel_lucena
 
S box
S boxS box
S box
 
Xor
XorXor
Xor
 
Unixsec
UnixsecUnixsec
Unixsec
 
Transposicion
TransposicionTransposicion
Transposicion
 
Sellado de tiempo_timestamp
Sellado de tiempo_timestampSellado de tiempo_timestamp
Sellado de tiempo_timestamp
 
Protocolo gestor claves
Protocolo gestor clavesProtocolo gestor claves
Protocolo gestor claves
 
Problema rsa
Problema rsaProblema rsa
Problema rsa
 
Pki
PkiPki
Pki
 
Número primo fuerte
Número primo fuerteNúmero primo fuerte
Número primo fuerte
 
Metodo kasiski
Metodo kasiskiMetodo kasiski
Metodo kasiski
 
Modos de operación_de_una_unidad_de_cifrado_por_bloques
Modos de operación_de_una_unidad_de_cifrado_por_bloquesModos de operación_de_una_unidad_de_cifrado_por_bloques
Modos de operación_de_una_unidad_de_cifrado_por_bloques
 
Hc
HcHc
Hc
 

Presentacion funciones heuristicas para el ajedrez

  • 1.
  • 2. Contenido: Debido a que el ajedrez es un juego objetivo de IA desde hace mucho tiempo, se presenta lo siguiente: • Un ambiente de 2 jugadores con perfecta información. • El árbol del juego. • MiniMax: Propaga valores de nodos terminales a internos. • Poda Alfa-beta: Elimina partes grandes del árbol. • Árbol demasiado grande: no se llega a nodos terminales. • Función de evaluación: sobre nodos a profundidad d. • Extensiones singulares. • Especulación: factor de ramificación.
  • 3. Árbol de juegos • Alternan jugadores por niveles • Sucesores de un nodo: todas los movimientos legales que ese jugador puede hacer
  • 4. MiniMax Cuál es el mejor movimiento? Supongo que el oponente elige el movimiento que más le conviene.
  • 5. MiniMax • Idea: propagar hacia atrás el valor de los hijos • Nodos terminales: valor 1, -1 (gana A o gana B) • Dos tipos de nodos: max: gana con 1 min: gana con -1 • Propagación hacia atrás: max: el máximo de los valores de los hijos min: el mínimo de los valores de los hijos
  • 6. Algoritmo MiniMax Evaluar nodo n de un árbol de juegos 1. Expandir el árbol bajo n 2. Evaluar los nodos terminales. 3. Seleccionar un nodo sin valor que todos sus hijos han sido valuados. Si no existe, retornar el valor de n. Stop. 4. Si el nodo es max, asignar el máximo de sus hijos. Si el nodo es min asignar el mínimo de sus hijos. Ir a 3.
  • 7. Algoritmo MiniMax El algoritmo anterior tiene un problema: ¿cuál? Supone búsqueda en anchura: 4. Si el nodo es max, asignar el máximo de sus hijos. Si el nodo es min asignar el mínimo de sus hijos. Espacio exponencial
  • 8. MiniMax en DFS 1. L = {n} 2. x ← extrae-primero(L). Si x =n con valor asignado, retorna ese valor. Stop. 3. Si x tiene valor w, nodo p es padre de x con valor v Si p es max, asignar max(v, w) a p. Si p es min, asignar min(v, w) a p. Eliminar x de L, ir a 2. 4. Si x no tiene valor y es un nodo terminal, asignar +1 o -1 como valor, depende si gana para max o min 5. Si x no tiene valor y no es un nodo terminal, asignar - ∞ o + ∞ como valor, depende si es max o min
  • 9. MiniMax en DFS Minimax ha de guardar: • sucesores de rama actual (como DFS) • nodos en la rama actual: para actualizar su valor
  • 10. Alfa-Beta Con una buena ordenación de sucesores,
  • 12. Función de evaluación para el Ajedrez e(n) → [-1, +1] – sustituye la detección de nodos terminales – es imperfecta Ajedrez: sumar los valores de las piezas peón, caballo, alfil, torre, reina 1 3 3 5 10 B: suma de las blancas N: suma de las negras e(n) = B - N / B + N
  • 14. Efecto Horizonte en Ajedrez • Efecto horizonte: una jugada que inicialmente parece buena puede resultar mala • el peligro no se ve, está tras el horizonte • la función de evaluación es incapaz de detectarlo • Solución fuerza bruta: buscar más profundo • coste computacional • en ajedrez, hay muchos movimientos que pueden retrasar una jugada de peligro • Aproximación selectiva: identificar los nodos en los que se debe profundizar más → extensiones singulares
  • 16. Deep Blue • Proyecto de IBM •Alfa-beta paralelo: • Hardware especializado (2 millones posiciones / sg) • Extensiones singulares, quiescencia • Función de evaluación sofisticada • Biblioteca: aperturas y finales • Resultados: • Venció a Kasparov en 1997 • Ratio 2700, Kasparov 2800 • quantity had become quality - la cantidad se había convertido en la calidad
  • 17. Algunas especulaciones ¿Por qué los programas son buenos en ciertos juegos y en otros no? Hipótesis: • Programa = búsqueda • Rendimiento frente a humanos: aumenta con profundidad d • Número de estados a visitar bd en tiempo fijado Depende de b factor de ramificación: • Si b pequeño, se puede profundizar → buen rendimiento • Si b grande, no se puede profundizar → rendimiento pobre
  • 18. Algunas especulaciones Factor de ramificación: • damas: 4 • othello: < 10 • ajedrez: 36 • go: 361 el campeón mundial es un programa Otras ideas: • aprendizaje (backgammon) • dificultad cuando se intercambian muchas piezas
  • 19. Por ultimo, Gracias! Nunca consideres el estudio como un deber, sino como una oportunidad para penetrar en el maravilloso mundo del saber. Albert Einstein