Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación
1. Robocup: IA en
sistemas multiagente
y fútbol de simulación
I Jornadas de Robótica RobotUS
Mayo 2010
• Joaquín Borrego Díaz • Gonzalo A. Aranda Corral
• Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información
• Universidad de Sevilla. • Universidad de Huelva.
• jborrego@us.es • gonzalo.aranda@dti.uhu.es
2. Robocup: IA en
sistemas multiagente
y fútbol de simulación
I Jornadas de Robótica RobotUS
Mayo 2010
• Joaquín Borrego Díaz • Gonzalo A. Aranda Corral
• Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información
• Universidad de Sevilla. • Universidad de Huelva.
• jborrego@us.es • gonzalo.aranda@dti.uhu.es
3. Agentes inteligentes
• Es una metáfora computacional propia de la
Inteligencia Artificial
• Se basa en la tradición de la epistemología
aplicada
• Agente Inteligente: entidad computacional
con autonomía;
• Reactividad
• Proactividad
• Sociabilidad
4. Agentes inteligentes
• Es una metáfora computacional propia de la
Inteligencia Artificial
• Se basa en la tradición de la epistemología
aplicada
• Agente Inteligente: entidad computacional
con autonomía;
• Reactividad
• Proactividad
• Sociabilidad
5. Definición de agente
(Russell-Norvig)
• Dada una sucesión de percepciones, un
agente racional ideal
• debe realizar una acción que
maximice la medida de éxito
• a partir de la base de evidencias
que obtiene de dicha sucesión de
percepciones, y
• junto con el conocimiento que posee
6. Definición de agente
(Russell-Norvig)
• Dada una sucesión de percepciones, un
agente racional ideal
(sólo
No
• debe realizar una acción que
es u lo que d
dice
maximice la medida de éxito
na b
•
uena
a partir de la base de evidencias
que obtiene de dicha sucesión de
defin
ebe
percepciones, y
ición
hace
• junto con el conocimiento que posee
r)
9. Características de los agentes
racionales
• Flexibilidad: las propiedades fundamentales son:
• Reactividad: capacidad para responder a los cambios del
entorno
• Pro-actividad: capacidad de exhibir un comportamiento
dirigido a cumplir sus objetivos
• Sociabilidad: capacidad para comunicarse y colaborar con
otros agentes
• Son las exigencias mínimas
• No se especifica el grado de flexibilidad de cada una
• Situación ideal: combinar módulos reactivos y racionales
• Es posible eludir alguna de éstas, para aplicaciones concretas
10. Características de los agentes
racionales
• Flexibilidad: las propiedades fundamentales son:
• Reactividad: capacidad para responder a los cambios del
entorno
• Pro-actividad: capacidad de exhibir un comportamiento
dirigido a cumplir sus objetivos
• Sociabilidad: capacidad para comunicarse y colaborar con
otros agentes
• Son las exigencias mínimas
• No se especifica el grado de flexibilidad de cada una
• Situación ideal: combinar módulos reactivos y racionales
• Es posible eludir alguna de éstas, para aplicaciones concretas
11. Proactividad versus
reactividad
Reactividad: Proactividad:
+ rapidez -rapidez
(poca deducción) (deducir: planificar)
-control del SMA + control individuos
Inteligencia + Inteligencia
Emergente implementada
12. Proactividad versus
reactividad
Reactividad: Proactividad:
+ rapidez -rapidez
(poca deducción) (deducir: planificar)
-control del SMA + control individuos
Inteligencia + Inteligencia
Emergente implementada
13. ¿Dónde está la IA
clásica?
• IA clásica: Racionalidad calculable
• IA para SMA:
• Racionalidad emergente
• Racionalidad mixta
• Ejemplo: Agentes y entorno:
• IA clásica: poco dinamismo en el entorno
• Ag. Inteligentes: dinamismo, no determinismo
14. ¿Dónde está la IA
clásica?
• IA clásica: Racionalidad calculable
• IA para SMA:
• Racionalidad emergente
• Racionalidad mixta
• Ejemplo: Agentes y entorno:
• IA clásica: poco dinamismo en el entorno
• Ag. Inteligentes: dinamismo, no determinismo
23. • La computación es la ejecución de reglas del tipo:
• Situación → Reacción
• Los datos provienen de los módulos de percepción
• El agente no mantiene, en principio, una representación mental
• Se ahorra deliberación (razonamiento automático)
• La percepción es clave:
• Se caracteriza mediante índices elegidos por el programador
• Los índices son extraídos del entorno
24. Agentes reactivos
Principios de la reactividad
• La computación es la ejecución de reglas del tipo:
• Situación → Reacción
• Los datos provienen de los módulos de percepción
• El agente no mantiene, en principio, una representación mental
• Se ahorra deliberación (razonamiento automático)
• La percepción es clave:
• Se caracteriza mediante índices elegidos por el programador
• Los índices son extraídos del entorno
25.
26. Emergencia
• Test de sorpresa: Requerimientos para la emergencia
• Diseño: se describe el sistema especificando las
interacciones locales entre los agentes, con un lenguaje L
• Observación: El observador describe el
comportamiento global de la ejecución usando un lenguaje
L’
• Sorpresa: Los lenguajes L y L’ son distintos, y el vínculo
causal entre las interacciones elementales programadas en
L y las observaciones descritas en L’ no son obvias
27. Emergencia
• Test de sorpresa: Requerimientos para la emergencia
• Diseño: se describe el sistema especificando las
Int
interacciones locales entre los agentes, con un lenguaje L
elig describe el
• Observación:em enc
El observador
erg ia
comportamiento global de la ejecución usando un lenguaje
L’ ent
• Sorpresa: Los lenguajes L y L’ eson distintos, y el vínculo
causal entre las interacciones elementales programadas en
L y las observaciones descritas en L’ no son obvias
37. Historia hasta 2009
Venue Number of Number of
Participants Countries
RoboCup 2009 Graz Austria 407 43
RoboCup 2008 Shuzhou China 373 35
RoboCup 2007 Atlanta (Georgia Tech) - USA 321 39
RoboCup 2006 Bremen - Germany 440 35
RoboCup 2005 Osaka - Japan 419 35
RoboCup 2004 Lisbon - Portugal 345 37
RoboCup 2003 Padova - Italy 238 35
RoboCup 2002 Fukuoka/Busan - Japan/Korea 188 29
RoboCup 2001 Seattle – USA 141 22
RoboCup 2000 Melbourne - Australia 110 19
RoboCup 1999 Stockholm - Sweden 85 23
RoboCup 1998 Paris - France 63 19
RoboCup 1997 Nagoya - Japan - First official RoboCup 38 11
competition
Pre-RoboCup-96 event - Osaka - Japan 8
38. Robocup Rescue Robocup Junior
• Rescue Simulation League
• Soccer challenge
• Real Rescue Robot League
• Dance challenge
• Rescue challenge
• General
39. Robocup Rescue Robocup Junior
• Rescue Simulation League
• Soccer challenge
• Real Rescue Robot League
• Dance challenge
• Rescue challenge
• General
86. Entrenador vs Preparador
• Distinción entre el entrenador y el preparador.
• El preparador puede ejercer más control
sobre el juego y se puede usar solamente en
la fase de desarrollo.
• El entrenador se usa on-line y proporciona
consejos e información a los jugadores.
87. Entrenador vs Preparador
• Distinción entre el entrenador y el preparador.
• El preparador puede ejercer más control
sobre el juego y se puede usar solamente en
la fase de desarrollo.
• El entrenador se usa on-line y proporciona
consejos e información a los jugadores.
89. El preparador
• Controla el modo de juego
• Envía mensajes
• Mueve a los jugadores y a la pelota a
cualquier posición y con la velocidad que
desee.
• Puede obtener información libre de ruido
de los objetos móviles.
93. Árbitro automático
• Kick-Off
• Goal
• Out of Field
• Player Clearance
• Play-Mode Control
• Off-side
• Backpasses
• Free Kick Faults
• Half-Time and Time-Up
94. Árbitro automático
• Kick-Off
• Goal
• Out of Field
• Player Clearance
• Play-Mode Control
• Off-side
• Backpasses
• Free Kick Faults
• Half-Time and Time-Up
95. Árbitro humano
• Rodear el balón
• Bloquear la portería
• No poner el balón en juego
• Bloquear el movimiento de otros jugadores
• Abusar del uso del portero
• Inundar la red con mensajes
• Comportamiento inapropiados...
96. Árbitro humano
• Rodear el balón
• Bloquear la portería
• No poner el balón en juego
• Bloquear el movimiento de otros jugadores
• Abusar del uso del portero
• Inundar la red con mensajes
• Comportamiento inapropiados...
99. Características como
Sistema multiagente
• Ejemplo de problema PTS (sincronización
periódica de equipos)
• Algunas soluciones iniciales:
• Acuerdos a puerta cerrada:
• (principio, medio, paradas)
• Protocolo de comunicación
102. Soluciones (II)
• Roles (flexibles o rígidos)
• Combinación de comportamientos
externos e internos
• Formaciones (dinámicas o a puerta
cerrada)
• Movimientos preplanificados
107. Historia
• Equipo: Dari2 - 2005
• Mejora sustancial del equipo UVA-TRILEARN
• Ricardo Alfonso Venzala y David Ballesteros
• Equipo: US - 2006
• Mejora del Dari2
• Carlos Villar y Sergio Santos
• Framework DECANO - 2007-2008
• Arquitectura basada en Agentes (Java)
• Pablo Fernández y Álvaro Guerra
• Equipo: DECANO 2010 - 2009-2010
• Mejora de Equipo 2006, basada en DECANO
• José Ángel Torres y Jesús Serrano
115. Nuestro equipo: Sucesiones T-T
truncadas con comportamiento
• Cambiar acciones por comportamientos
• Truncar la sucesión cuando el objetivo está
muy lejano
• Dos categorías de estados:
• Papel activo (categoría A)
• Papel pasivo/posicional (categoría B)
• Teorema: siempre existe un jugador en A
130. Aprendizaje (I)
• Off-line: Para tareas fijas
• Intercepción de balones
• Evaluación de pases
• Usando: redes neuronales, árboles de decisión…
• Ventaja: conocimiento transmisible (no todo es
aconsejable)
• Desventaja:
• ¡No se aprende durante el juego!
131. Aprendizaje (II)
• Online:
• Aprendiendo durante el juego
• Ventaja: aprendo a ganar al contrincante
actual
• Desventaja: poco tiempo de aprendizaje
• Exploración versus explotación
137. ¿Te apuntas?
• Joaquín Borrego Díaz
• Dpto. de Ciencias de la Computación e Inteligencia Artificial.
• Universidad de Sevilla.
• jborrego@us.es
• Gonzalo A. Aranda Corral
• Dpto. Tecnologías de la Información
• Universidad de Huelva.
• gonzalo.aranda@dti.uhu.es
138. ¿Te apuntas?
• Joaquín Borrego Díaz
• Dpto. de Ciencias de la Computación e Inteligencia Artificial.
• Universidad de Sevilla.
• jborrego@us.es
• Gonzalo A. Aranda Corral
• Dpto. Tecnologías de la Información
• Universidad de Huelva.
• gonzalo.aranda@dti.uhu.es