Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

Robocup: IA en
sistemas multiagente
y fútbol de simulación
I Jornadas de Robótica RobotUS
Mayo 2010

• Joaquín Borrego Díaz • Gonzalo A. Aranda Corral
• Dpto. de Ciencias de la Computación e IA. • Dpto. Tecnologías de la Información
• Universidad de Sevilla. • Universidad de Huelva.
• jborrego@us.es • gonzalo.aranda@dti.uhu.es

Agentes inteligentes
• Es una metáfora computacional propia de la
Inteligencia Artiﬁcial
• Se basa en la tradición de la epistemología
aplicada
• Agente Inteligente: entidad computacional
con autonomía;
• Reactividad
• Proactividad
• Sociabilidad

Deﬁnición de agente
(Russell-Norvig)
• Dada una sucesión de percepciones, un
agente racional ideal
• debe realizar una acción que
maximice la medida de éxito
• a partir de la base de evidencias
que obtiene de dicha sucesión de
percepciones, y
• junto con el conocimiento que posee

Deﬁnición de agente
(Russell-Norvig)
• Dada una sucesión de percepciones, un
agente racional ideal

(sólo
No
• debe realizar una acción que

es u lo que d
dice
maximice la medida de éxito

na b
•

uena
a partir de la base de evidencias
que obtiene de dicha sucesión de

deﬁn
ebe
percepciones, y

ición
hace
• junto con el conocimiento que posee
r)

Esqueleto de agente

¿Dónde está el
razonamiento?

Características de los agentes
racionales
• Flexibilidad: las propiedades fundamentales son:
• Reactividad: capacidad para responder a los cambios del
entorno
• Pro-actividad: capacidad de exhibir un comportamiento
dirigido a cumplir sus objetivos
• Sociabilidad: capacidad para comunicarse y colaborar con
otros agentes
• Son las exigencias mínimas
• No se especiﬁca el grado de ﬂexibilidad de cada una
• Situación ideal: combinar módulos reactivos y racionales
• Es posible eludir alguna de éstas, para aplicaciones concretas

Proactividad versus
reactividad
Reactividad: Proactividad:

+ rapidez -rapidez
(poca deducción) (deducir: planificar)

-control del SMA + control individuos

Inteligencia + Inteligencia
Emergente implementada

¿Dónde está la IA
clásica?
• IA clásica: Racionalidad calculable
• IA para SMA:
• Racionalidad emergente
• Racionalidad mixta
• Ejemplo: Agentes y entorno:
• IA clásica: poco dinamismo en el entorno
• Ag. Inteligentes: dinamismo, no determinismo

• La computación es la ejecución de reglas del tipo:

• Situación → Reacción

• Los datos provienen de los módulos de percepción

• El agente no mantiene, en principio, una representación mental

• Se ahorra deliberación (razonamiento automático)

• La percepción es clave:

• Se caracteriza mediante índices elegidos por el programador

• Los índices son extraídos del entorno

Agentes reactivos
Principios de la reactividad

• La computación es la ejecución de reglas del tipo:

• Situación → Reacción

• Los datos provienen de los módulos de percepción

• El agente no mantiene, en principio, una representación mental

• Se ahorra deliberación (razonamiento automático)

• La percepción es clave:

• Se caracteriza mediante índices elegidos por el programador

• Los índices son extraídos del entorno

Emergencia
• Test de sorpresa: Requerimientos para la emergencia
• Diseño: se describe el sistema especiﬁcando las
interacciones locales entre los agentes, con un lenguaje L
• Observación: El observador describe el
comportamiento global de la ejecución usando un lenguaje
L’
• Sorpresa: Los lenguajes L y L’ son distintos, y el vínculo
causal entre las interacciones elementales programadas en
L y las observaciones descritas en L’ no son obvias

Emergencia
• Test de sorpresa: Requerimientos para la emergencia
• Diseño: se describe el sistema especiﬁcando las
Int
interacciones locales entre los agentes, con un lenguaje L
elig describe el
• Observación:em enc
El observador
erg ia
comportamiento global de la ejecución usando un lenguaje
L’ ent
• Sorpresa: Los lenguajes L y L’ eson distintos, y el vínculo
causal entre las interacciones elementales programadas en
L y las observaciones descritas en L’ no son obvias

Tres tipos de emergencia
sintética

ROBOCUP

“By the year 2050, develop a team of fully
autonomous humanoid robots that can win against
the human world soccer champion team.”

Competiciones

• RoboCup Rescue
• RoboCupJunior
• RoboCup@Home
• RoboCupSoccer

Historia hasta 2009
Venue Number of Number of
Participants Countries
RoboCup 2009 Graz Austria 407 43
RoboCup 2008 Shuzhou China 373 35
RoboCup 2007 Atlanta (Georgia Tech) - USA 321 39
RoboCup 2006 Bremen - Germany 440 35
RoboCup 2005 Osaka - Japan 419 35
RoboCup 2004 Lisbon - Portugal 345 37
RoboCup 2003 Padova - Italy 238 35
RoboCup 2002 Fukuoka/Busan - Japan/Korea 188 29
RoboCup 2001 Seattle – USA 141 22
RoboCup 2000 Melbourne - Australia 110 19
RoboCup 1999 Stockholm - Sweden 85 23
RoboCup 1998 Paris - France 63 19
RoboCup 1997 Nagoya - Japan - First official RoboCup 38 11
competition
Pre-RoboCup-96 event - Osaka - Japan 8

Robocup Rescue Robocup Junior
• Rescue Simulation League
• Soccer challenge
• Real Rescue Robot League
• Dance challenge

• Rescue challenge

• General

Robocup Soccer

• Humanoid League
• Four Legged League
• Middle Size League
• Small Size League
• Simulation League

Simulation League
• 2D
• 3D

Servidor

UDP/IP
Equipo B
Equipo A

Monitor
Monitor

Classic Classic RCSSmonitor
Rcssmonitor

Logs
Logs

rcsslogplayer

ROBOCUP 2D COMO AGENTE

PERCEPCIONES

ENTORNO CEREBRO

ACCIONES

Percepciones

• Sensor aural
• Sensor de visión
• Sensor corporal

Sensor aural

(hear Time Sender "Message")

Sensor aural (II)

• Entorno aural

Sensor aural (II)
Só
• Entorno aural lo
do
de sm
(a l e
cto ti ns
s d po aje
e h say s/c
ab icl
la) o

Sensor de visión

(see ObjName Distance Direction
DistChng DirChng BodyDir HeadDir)

Sensor de visión
(distancias)

Sensor corporal

(sense body Time
(view mode ViewQuality ViewWidth)
(stamina Stamina Eort)
(speed AmountOfSpeed DirectionOfSpeed)
(head angle HeadDirection)
(kick KickCount)
(dash DashCount)
(turn TurnCount)
(say SayCount)
(turn neck TurnNeckCount)
(catch CatchCount)
(move MoveCount)
(change view ChangeViewCount))

Sensor corporal

• Física:
• Stamina
• Esfuerzo realizado
• Velocidad (no direccional, cuantitativa)

Acciones
• Catch
• Dash
• Kick
• Move
• Say
• Turn
• TurnNeck

“Turn” y “TurnNeck”
(girar, girar el cuello)

Simulación del entorno
• Intervalo de ejecución
• Ciclos de acción
• Ciclos de percepción

Entrenador vs Preparador
• Distinción entre el entrenador y el preparador.

• El preparador puede ejercer más control
sobre el juego y se puede usar solamente en
la fase de desarrollo.

• El entrenador se usa on-line y proporciona
consejos e información a los jugadores.

El preparador
• Controla el modo de juego
• Envía mensajes
• Mueve a los jugadores y a la pelota a
cualquier posición y con la velocidad que
desee.
• Puede obtener información libre de ruido
de los objetos móviles.

El entrenador
• Puede comunicarse con los jugadores.
(restringida)

• Puede obtener información libre de ruidos

• Puede organizar estrategias

Reglas de juego

• Árbitro automático
• Árbitro humano

Árbitro automático
• Kick-Off
• Goal
• Out of Field
• Player Clearance
• Play-Mode Control
• Off-side
• Backpasses
• Free Kick Faults
• Half-Time and Time-Up

Árbitro humano
• Rodear el balón
• Bloquear la portería
• No poner el balón en juego
• Bloquear el movimiento de otros jugadores
• Abusar del uso del portero
• Inundar la red con mensajes
• Comportamiento inapropiados...

Características como
Sistema multiagente
• Ejemplo de problema PTS (sincronización
periódica de equipos)
• Algunas soluciones iniciales:
• Acuerdos a puerta cerrada:
• (principio, medio, paradas)
• Protocolo de comunicación

Soluciones (II)
• Roles (ﬂexibles o rígidos)
• Combinación de comportamientos
externos e internos
• Formaciones (dinámicas o a puerta
cerrada)
• Movimientos preplaniﬁcados

Limitaciones

• Limitaciones:
• Percepciones con ruido
• Acciones
• Objetivos individuales vs. globales

Historia
• Equipo: Dari2 - 2005
• Mejora sustancial del equipo UVA-TRILEARN
• Ricardo Alfonso Venzala y David Ballesteros
• Equipo: US - 2006
• Mejora del Dari2
• Carlos Villar y Sergio Santos
• Framework DECANO - 2007-2008
• Arquitectura basada en Agentes (Java)
• Pablo Fernández y Álvaro Guerra
• Equipo: DECANO 2010 - 2009-2010
• Mejora de Equipo 2006, basada en DECANO
• José Ángel Torres y Jesús Serrano

Idea
COMPONENTE
T-R

Reorganización de
EQUIPO DARI2

Estructura básica
UVATRILEARN

MEJORAS
FUNCIONALES

Sucesiones teleoreactivas
• N. Nilsson
• Situaciones mediante índices
• Sistemas basados en reglas

Adecuación de la
regresión

Nuestro equipo: Sucesiones T-T
truncadas con comportamiento
• Cambiar acciones por comportamientos
• Truncar la sucesión cuando el objetivo está
muy lejano
• Dos categorías de estados:
• Papel activo (categoría A)
• Papel pasivo/posicional (categoría B)
• Teorema: siempre existe un jugador en A

Comportamientos
¿Macros?

¿Es subsunción?
o en
ba sad
ción
sun las
ub reg
unas
Es

Ejemplo: esquema del
central

Aprendizaje (I)
• Off-line: Para tareas ﬁjas
• Intercepción de balones
• Evaluación de pases
• Usando: redes neuronales, árboles de decisión…
• Ventaja: conocimiento transmisible (no todo es
aconsejable)
• Desventaja:
• ¡No se aprende durante el juego!

Aprendizaje (II)
• Online:
• Aprendiendo durante el juego
• Ventaja: aprendo a ganar al contrincante
actual
• Desventaja: poco tiempo de aprendizaje
• Exploración versus explotación

Otros desafíos
• Propagación de errores
• Combinar capas subsunción/aprendizaje
• Controlar la emergencia

Lineas actuales de
trabajo

• Migrando a JAVA el equipo 2006
• Superar al equipo del 2006
• Diseñar nuevas estrategias para el SMA

Objetivo ﬁnal

Preparar un equipo competitivo US-UHU
para participar en
la ROBOCUP 2012

¿Te apuntas?
• Joaquín Borrego Díaz
• Dpto. de Ciencias de la Computación e Inteligencia Artiﬁcial.
• Universidad de Sevilla.
• jborrego@us.es

• Gonzalo A. Aranda Corral
• Dpto. Tecnologías de la Información
• Universidad de Huelva.
• gonzalo.aranda@dti.uhu.es

Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (6)

Similar a Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

Similar a Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación (20)

Más de Joaquín Borrego-Díaz

Más de Joaquín Borrego-Díaz (20)

Robocup: Inteligencia Artificial en sistemas multiagente y fútbol de simulación

Notas del editor