Aprendizaje de Programas Teleo-Reactivos para Robótica Móvil

Aprendizaje de Programas Teleo-Reactivos
Contenido

´
Introduccion ´ ´
para Robotica Movil
Representa-
´
cion

Aprendizaje
de PTRs Blanca A. Vargas Govea
´
basicos
Asesor: Dr. Eduardo F. Morales Manzanares
Aprendizaje
de PTRs
´
jerarquicos INAOE
Experimentos
Experimentos para
´
navegacion
´
Octubre 28, 2009
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 1 / 53

Contenido

Contenido
Contenido

´
Introduccion ´
1 Introduccion
Representa-
´
cion

Aprendizaje
´
2 Representacion
de PTRs
´
basicos

Aprendizaje
´
3 Aprendizaje de PTRs basicos
de PTRs
´
jerarquicos

Experimentos
´
4 Aprendizaje de PTRs jerarquicos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes 5 Experimentos
Conclusiones ´
Experimentos para navegacion
´
Clasiﬁcacion de ademanes

6 Conclusiones

(INAOE) Octubre 28, 2009 2 / 53

´
Introduccion

´
Motivacion
Contenido

´
Introduccion
Robot, ve a la sala Creciente demanda de
Representa-
´
cion
robots de servicio
Aprendizaje ´
• Metodos para simplificar
de PTRs
´
basicos ´
la programacion.
Aprendizaje
de PTRs
´
• Ambientes dinamicos.
´
jerarquicos
• Ambientes distintos:
Experimentos
Experimentos para
´
navegacion
casa, oficina,
´
Clasificacion de
ademanes
laboratorio.
Conclusiones

´
Un robot movil que aprenda a realizar tareas en ambientes
´
dinamicos.

(INAOE) Octubre 28, 2009 3 / 53

´
Introduccion

´
Problematica
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 4 / 53

´
Introduccion

En esta tesis:
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 5 / 53

´
Introduccion

Trabajo relacionado
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 6 / 53

´
Representacion

´
Representacion
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 7 / 53

´
Representacion

´
Representacion del ambiente 1/2
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

´
[Hernandez, 2005]
(INAOE) Octubre 28, 2009 8 / 53

´
Representacion

´
Representacion del ambiente 2/2
Contenido Distancia ´
Angulo Atrib Tipo
´
Introduccion 2.18 -73 -1.41 izquierda
Representa-
´
cion
2.17 -47 0 esquina
Aprendizaje 3.46 -89.5 1.06 pared
de PTRs
´
basicos

Aprendizaje Ventaja
de PTRs
´
jerarquicos
´
Esta transformacion reduce de cientos de datos por estado
Experimentos
Experimentos para
´
navegacion
a unos pocos atributos signiﬁcativos
´
Clasiﬁcacion de
ademanes

Conclusiones ´ ´ ´
Se agrega la posicion y orientacion del robot, informacion
de los sonares traseros y la meta. Se transforma en los
siguientes
´
Pares estado-accion:
´
[robot(X,Y,Θ),atras(n),meta(Xg,Yg),marca(Dist,Angulo,Atrib,Tipo),..,],Accion
´ ´
´
[robot(X,Y,Θ),atras(n),meta(Xg,Yg),marca(Dist,Angulo,Atrib,Tipo),..,],Accion
´ ´
.
(INAOE) . Octubre 28, 2009 9 / 53

´
Aprendizaje de PTRs basicos

´
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 10 / 53

´

´ ´
Deﬁnicion de la tarea de navegacion
Contenido

´
Introduccion

Representa-
´
cion
Meta
obstáculo dinámico Sub-tareas
Aprendizaje
de PTRs
girar-derecha
´
basicos • Deambular.
Aprendizaje
de PTRs girar-izquierda • Orientarse.
´
jerarquicos

Experimentos
• Salir de
orientarse avanzar
Experimentos para
´
navegacion trampas.
´
Clasiﬁcacion de
ademanes
salir-de-
• Seguir a un
Conclusiones trampa ´
objeto movil.
orientarse

(INAOE) Octubre 28, 2009 11 / 53

´

´ ´
¿Como se aprendio?
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
´
Mediante clonacion, se
de PTRs
´
jerarquicos
aprenden PTRs para que el
Experimentos
robot pueda realizar las
Experimentos para
´
navegacion
sub-tareas deﬁnidas.
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 12 / 53

´

´
Clonacion
Contenido
Extraer conocimiento expl´cito de habilidades de bajo nivel
ı
´
Introduccion
(Michie,1992).
Representa-
´
cion • Obtener ejemplos o trazas.
Aprendizaje
de PTRs
• Dar las trazas como entrada a
´
basicos algoritmos de aprendizaje.
Aprendizaje
de PTRs • Obtener modelos que al
´
jerarquicos
´
ejecutarse produciran
Experimentos
Experimentos para
´
navegacion
comportamientos similares a
´
Clasiﬁcacion de
ademanes
´
quien genero los modelos.
Conclusiones • Se les llama clones porque
reproducen la habilidad de
una persona o sistema.

(INAOE) Octubre 28, 2009 13 / 53

´

Programas Teleo-Reactivos
Contenido
´
Conjunto de clausulas que ejecutan contńuamente una
ı
´
Introduccion ´
accion en el estado actual mientras sus condiciones son
Representa- satisfechas (Nilsson, 1994).
´
cion
´
ptr1(Estado,Accion) ←
Aprendizaje
de PTRs ´
condicion meta(Estado).
´
basicos ´
ptr1(Estado,Accion) ←
Aprendizaje ´
condicion1(Estado,...),
de PTRs ´
condicion2(Estado, ...),
´
jerarquicos ...
Experimentos ptr1(Estado, PTR2 ) ←
Experimentos para
´
navegacion
´
condicion1(Estado,...),
´
Clasificacion de ´
condicion3(Estado, ...), . . .
ademanes
...
Conclusiones

Ventaja
Uso de acciones contńuas,
ı
capaces de reaccionar en un
´
ambiente dinamico.
(INAOE) Octubre 28, 2009 14 / 53

´

Contenido

´
Introduccion
´
PTRs basicos
Representa- Sus acciones son
´
cion

Aprendizaje
unicamente acciones
´
de PTRs
´
´
atomicas
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

´
PTRs jerarquicos
Sus acciones pueden
incluir otros PTRs

(INAOE) Octubre 28, 2009 15 / 53

´

´
Contenido
Objetivo: Producir un conjunto de predicados que
´
Introduccion ´
devuelvan una accion particular, capturando el
Representa- comportamiento deseado.
´
cion
1 Dados: una traza (o trazas), un predicado objetivo y
Aprendizaje
de PTRs posible conocimiento del dominio
´
basicos

Aprendizaje
´
2 Generar ejemplos negativos. Se realizo intercambiando
de PTRs
´
jerarquicos
las acciones.
Experimentos 3 Aprender PTRs usando ALEPH (un sistema de ILP).
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 16 / 53

´

Conocimiento del dominio
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 17 / 53

´

Ejemplo: deambular
Contenido
Entrada: trazas de deambular, el
´
Introduccion
predicado objetivo, el concepto
Representa-
´
cion aprendido zona-frontal, zona-trasera y el
Aprendizaje predicado para obtener la marca mas´
de PTRs
´
basicos cercana.
Aprendizaje
de PTRs Salida:
´
jerarquicos

Experimentos deambular(Estado,avanzar) ←
Experimentos para
´
navegacion zona-frontal(Estado,libre).
´
Clasiﬁcacion de
ademanes deambular(Estado,girar-izq) ← Robot controlado por el PTR
Conclusiones ´
zona-frontal(Estado,obstaculo), para deambular
obst-cercano(Estado,Marca,Dist,Ang),
menor-igual(Ang,-1.51)).
deambular(Estado,girar-der) ←
´
zona-frontal(Estado,obstaculo).

(INAOE) Octubre 28, 2009 18 / 53

´
Aprendizaje de PTRs jerarquicos

´
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 19 / 53

´

´
Aprendizaje de gramaticas
Contenido FOSeq (First Order Sequence learning)
´
Introduccion

Representa-
´
cion
´
Entrada: un conjunto de secuencias de PTRs basicos
Aprendizaje obtenidas al guiar al robot.
de PTRs
´
basicos FOSeq:
Aprendizaje
de PTRs
´
jerarquicos
1 ´
Induce una gramatica para cada secuencia,
Experimentos
identificando elementos repetidos (n-gramas).
Experimentos para
´
navegacion 2 ´
Evalua las secuencias con cada gramatica aprendida y
´
´
Clasificacion de
ademanes
´
selecciona la gramatica mejor evaluada.
Conclusiones
3 ´ ´
Aplica un proceso de generalizacion a la gramatica
´
mejor evaluada y las gramaticas que aportan elementos
nuevos.
´
Salida: Una gramatica que puede usarse como controlador
´
(PTR jerarquico) o como clasificador.
(INAOE) Octubre 28, 2009 20 / 53

´

´
Induccion
Contenido

´
Introduccion

Representa-
´
cion
• El algoritmo busca los n-gramas (e.g., sub-secuencias
Aprendizaje de n-elementos) que aparezcan al menos dos veces en
de PTRs
´
basicos
la secuencia.
Aprendizaje • Los n-gramas candidatos son buscados de forma
de PTRs
´
jerarquicos incremental por su longitud.
Experimentos
Experimentos para
• El n-grama con mayor frecuencia es seleccionado,
´
navegacion
´
generando una nueva regla para la gramatica y
ademanes

Conclusiones
reemplazando con un s´mbolo no-terminal todas las
ı
ocurrencias del n-grama que aparecen en la secuencia
original.

(INAOE) Octubre 28, 2009 21 / 53

´

´
Induccion: ejemplo
Contenido

´
Introduccion

Representa-
´
cion S→a b c b c b c b a b c b d b e b c S2 → R2 d b e R1
Aprendizaje b c (5) R1 → b c
de PTRs Agrega: R1 → b c R2 → a R1 b
´
basicos
S1 → a R1 R1 R1 b a R1 b d b e R1
Aprendizaje Eliminando elementos repetidos:
de PTRs
´
jerarquicos S1 → a R1 b a R1 b d b e R1
Experimentos R1 b (2)
Experimentos para
´
navegacion
a R1 (2)
´
Clasiﬁcacion de a R1 b (2)
ademanes
Agrega: R2 → a R1 b R2 d b e R1
Conclusiones S2 → R2 R2 d b e R1
Eliminando elementos repetidos: a R1 b b c
S2 → R2 d b e R1
b c

(INAOE) Octubre 28, 2009 22 / 53

´

´
Induccion: con predicados
Contenido
Cuando los elementos de la secuencia son predicados, la
´
Introduccion
´ ´ ´
gramatica inducida es una Gramatica de Clausula Deﬁnida
Representa-
´
cion (GCD). Las GCDs:
Aprendizaje
de PTRs
´ ´
• Son una extension de las gramaticas libres de contexto,
´
basicos
• pueden tener argumentos y
Aprendizaje
de PTRs
´
jerarquicos
• son expresadas y ejecutadas en Prolog.
Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
´
La entrada es una secuencia de PTRs basicos como la
ademanes
siguiente:
Conclusiones

Entrada

´ ´ ´
pred1(Estado1,accion1), pred2(Estado2,accion1), pred1(Estado3,accion2), . . .

(INAOE) Octubre 28, 2009 23 / 53

´

´
Evaluacion
Contenido

´
Introduccion ´
• Cada gramatica aprendida se usa para analizar
Representa- ´
sintacticamente todas las secuencias del conjunto
´
cion

Aprendizaje
proporcionado por el usuario.
de PTRs
´
basicos ´
• Por cada secuencia analizada, la gramatica recibe una
Aprendizaje ´ ´
evaluacion, calculada por la funcion:
de PTRs
´
jerarquicos
n
Experimentos cj
Experimentos para eval(Gi ) = (1)
´
navegacion cj + fj
´
Clasiﬁcacion de
ademanes
j=1

Conclusiones donde cj y fj representan el numero de elementos que
´
´
la gramatica es capaz o incapaz de aceptar,
respectivamente.
´
• La gramatica mejor evaluada es seleccionada.

(INAOE) Octubre 28, 2009 24 / 53

´

´
Generalizacion
Contenido

´
Introduccion
´
La idea principal es obtener una nueva gramatica que
Representa-
´
cion ´
mejore la cobertura de gramatica mejor evaluada.
Aprendizaje
de PTRs
´
1 Seleccionar la gramatica que proporciona el mayor
´
basicos
numero de elementos nuevos o uniﬁcaciones diferentes
´
Aprendizaje
de PTRs de predicados.
´
jerarquicos
´
2 Calcular el lgg (generalizacion menos general) entre las
Experimentos
Experimentos para
´
navegacion
´
reglas de ambas gramaticas.
´
Clasiﬁcacion de
ademanes 3 Aceptar la nueva regla si mejora la cobertura original, si
Conclusiones no, descartarla.
4 Terminar el proceso hasta alcanzar un umbral de
cobertura o hasta que no hay mejora.

(INAOE) Octubre 28, 2009 25 / 53

´

Ejemplo lgg
Contenido

´
Introduccion

Representa-
´
cion ´
c1 = pred(Estado,accion1) ← ´
c2 = pred(Estado,Accion) ←
´
cond1(Estado,accion1), ´
cond1(Estado,accion1),
Aprendizaje
de PTRs ´
cond2(Estado,accion2). ´
cond2(Estado,accion3).
´
basicos

Aprendizaje
de PTRs
´
jerarquicos ´
Calculando el lgg(c1,c2), la clausula es:
Experimentos
Experimentos para
´
pred(Estado,Accion) ←
´
navegacion ´
cond1(Estado,accion1),
´
Clasiﬁcacion de
ademanes ´
cond2(Estado,Accion).
Conclusiones

´ ´
donde las constantes accion2 y accion3 del predicado
´
cond2 son reemplazadas por la variable Accion.

(INAOE) Octubre 28, 2009 26 / 53

´

´
De gramatica a programa
Contenido ´
R1 → orientar(Estado1,Accion),
´
Introduccion ´
deambular(Estado2,accion1)
Representa-
´
R2 → orientar(Estado1,accion2),
´
cion ´
deambular(Estado2,Accion)
Aprendizaje
´
R3 → orientar(Estado1,accion3),
de PTRs ´
´
basicos

Aprendizaje
de PTRs
´
jerarquicos ´ ´
(R1) pred-nuevo1(Estado1,accion1) → orientarse(Estado1,Accion),
Experimentos ´
deambular(Estado2,accion1)
Experimentos para ´ ´
(R2) pred-nuevo2(Estado1,Accion) → orientar(Estado1,accion2),
´
navegacion
´
Clasiﬁcacion de
´
ademanes ´ ´
(R3) pred-nuevo3(Estado1,Accion) → orientar(Estado1,accion3),
Conclusiones ´

Cada regla puede interpretarse como una sub-tarea

(INAOE) Octubre 28, 2009 27 / 53

´

´
Ejemplo en navegacion: PTR para ir a un
Contenido
punto (deambular + orientarse)
´
Introduccion ´
Entrada: secuencias de los PTRs basicos deambular y
Representa-
´
cion orientar.
Aprendizaje orientar(Estado,girar-izq),deambular(Estado,girar-izq), deambular(Estado,girar-der),
de PTRs deambular(Estado,avanzar),orientar(Estado,girar-izq),deambular(Estado,avanzar),. . .
´
basicos
...
Aprendizaje
de PTRs
´
jerarquicos
Salida:
Experimentos
ir-a(Estado,nil) ←
Experimentos para en-meta(Estado).
´
navegacion
´
Clasiﬁcacion de
´
ir-a(Estado,Accion) ←
ademanes orientar(Estado,ninguna),
Conclusiones ´
deambular(Estado,Accion).
´
deambular(Estado,avanzar),
´
orientar(Estado,Accion).
´
´
deambular(Estado,Accion).

(INAOE) Octubre 28, 2009 28 / 53

Experimentos

Experimentos
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 29 / 53

Experimentos ´

´
Plataforma de simulacion
Contenido
´
Se utilizo el software para control de robots Player/Stage.
´
Introduccion
• Diferentes escenarios: 10 mapas
Representa-
´
cion diferentes a los de entrenamiento.
Aprendizaje
de PTRs ´ ´
• Obstaculos ﬁjos y moviles de
´
basicos
˜
diversas formas y tamanos.
Aprendizaje
de PTRs ´
• Limitaciones del sensor laser: 50 cm
´
jerarquicos

Experimentos
sobre el piso de forma paralela, se
Experimentos para
´
navegacion
´
evito el vidrio.
´
Clasiﬁcacion de
ademanes ´
• Precision:
Conclusiones
e
p= × 100 (2)
e+f
donde e es el numero de tareas o sub-tareas
´
realizadas exitosamente y f es el numero de tareas
´
o sub-tareas que fallaron.

(INAOE) Octubre 28, 2009 30 / 53

Experimentos ´

Mapas
Contenido
Mapas de entrenamiento Mapas de prueba
´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
Ventaja
´
navegacion
´
Clasiﬁcacion de
ademanes Los PTRs aprendidos pueden
Conclusiones usarse en ambientes distintos
al de entrenamiento

(INAOE) Octubre 28, 2009 31 / 53

Experimentos ´

PTRs aprendidos
Contenido
´
PTR basico E+ y E− Conoc-dom Acciones
deambular 979 zona-frontal* avanzar
´
Introduccion
orientar 2982 zona-trasera* girar-der
Representa- salir-de-trampa 952 menor-igual girar-izq
´
cion
seguir 619 mayor-igual detener
Aprendizaje obst-mas-cercano retroceder
de PTRs ´
obtener-angulos
´
basicos
zona-orienta*
Aprendizaje config-paredes*
de PTRs
´
jerarquicos lado-pared*
zona-seguir*
Experimentos
Experimentos para
rango-distancia*
´
navegacion obtener-vals
´
Clasificacion de
ademanes

Conclusiones (*) significa que el concepto fue aprendido
´
PTR jerarquico No. de secuencias
deambular + orientar (ir a un punto) 12
deambular + orientar + salir de trampa 16
seguir + deambular 10
seguir + deambular + salir de trampa 14
´
PTRs jerarquicos aprendidos y numero de trazas
´

(INAOE) Octubre 28, 2009 32 / 53

Experimentos ´

´
Ejemplos: PTRs basicos
Contenido
Meta Meta Meta Meta

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs Salir de trampa
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos Deambular
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

Orientar ´
Seguir a un objeto movil

(INAOE) Octubre 28, 2009 33 / 53

Experimentos ´

´
Ejemplos: PTRs jerarquicos
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs Ir a un punto
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

Visitando distintos lugares

(INAOE) Octubre 28, 2009 34 / 53

Experimentos ´

´ ´
Simulacion: Precision de PTRs
Contenido PTR Pruebas ´
Precision
´
Introduccion Deambular 30 86.67 %
Representa- Orientar 30 100.00 %
´
cion

Aprendizaje
Salir de trampa 30 80.00 %
de PTRs
´
basicos
Seguir 40 97.50 %
Aprendizaje
de PTRs
´
jerarquicos PTR Pruebas ´
Precision
Experimentos deambular + orientar 30 86.67 %
Experimentos para
´
navegacion
´
Clasiﬁcacion de
(ir a un punto)
ademanes
deambular + orientar + 30 93.33 %
Conclusiones
salir de trampa
seguir + deambular 40 90.00 %
seguir + deambular + 40 100.00 %
salir de trampa
visitar 5 lugares* 30 96.67 %

(INAOE) Octubre 28, 2009 35 / 53

Experimentos ´

´ ´
Modulo de navegacion para Markovito
Contenido

´
Introduccion

Representa-
´
cion
Robot PeopleBot de ActivMedia equipado con un anillo de
Aprendizaje ´ ´
16 sonares en la parte inferior y sistema de vision estereo.
de PTRs
´
basicos

Aprendizaje • Navegar hacia distintos
de PTRs
´
jerarquicos lugares.
Experimentos
Experimentos para
• Seguir a una persona.
´
navegacion
´
Clasiﬁcacion de
ademanes
• Encontrar un objeto.
Conclusiones • Entregar
mensajes/objetos.

(INAOE) Octubre 28, 2009 36 / 53

Experimentos ´

Navegar hacia distintos lugares
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos
Visitando distintos lugares
Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 37 / 53

Experimentos ´

Seguir a una persona
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes

Conclusiones

´
El PTR de seguimiento se adapt´ para seguir a una persona. Esto se hizo
o
´ ´
reemplazando el proceso de identificacion de marcas utilizando un sensor laser
´ ´
por un proceso de identificacion de marcas visuales (Sanchez-Texis, 2008).

(INAOE) Octubre 28, 2009 38 / 53

Experimentos ´

´
Markovito: Precision de PTRs
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos
Pruebas Intervenciones ´
Precision
Aprendizaje
de PTRs Ir a un punto 120 20 85.00 %
´
jerarquicos
Seguir a 20 3 90.00 %
Experimentos
Experimentos para una persona
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 39 / 53

Experimentos ´

´
Comparacion deliberativo/PTRs
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje ´
Se realizaron tres tipos de pruebas de navegacion con el ﬁn
de PTRs
´
basicos de observar las ventajas y desventajas de tres enfoques:
Aprendizaje
de PTRs ´ ´
• Con la pol´tica optima obtenida con iteracion de valor
ı
´
jerarquicos

Experimentos
(DELIB).
Experimentos para
´
navegacion • Con PTRs.
´
Clasiﬁcacion de
ademanes
• Con una pol´tica que combina DELIB con PTRs.
ı
Conclusiones

(INAOE) Octubre 28, 2009 40 / 53

Experimentos ´

´
Comparacion deliberativo/PTRs
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs (a) DELIB (b) PTR (c) a + b
´
basicos
´
Ventaja DELIB: Las trayectorias generadas por este enfoque son las optimas.
Aprendizaje
de PTRs Desventaja DELIB: debe conocer el ambiente.
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(a) DELIB (b) PTR (c) a + b
Ventaja PTRs: El robot puede reaccionar ante obst´
aculos inesperados y llegar a la
´
meta aunque no lo haga con una trayectoria optima. No necesita conocer el
ambiente.
Desventaja PTRs: puede recorrer mayor distancia.
(INAOE) Octubre 28, 2009 41 / 53

Experimentos ´

Experimentos
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos

Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 42 / 53

Experimentos ´

´
Ejemplo: gramaticas de ademanes
Contenido
´ ´
Objetivo: aprender una gramatica para cada ademan (9)
´
Introduccion ´
enfocandonos en el reconocimiento de ademanes
Representa- realizados por una persona.
´
cion

Aprendizaje
de PTRs
´
basicos

Aprendizaje
de PTRs
´
jerarquicos
(a) (b) (c) (d) (e)
Experimentos
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(f) (g) (h) (i) (j)

´ ´
(a) posicion inicial y ﬁnal, (b) atencion, (c) acercar, (d) izquierda, (e) derecha, (f)
detener, (g) girar-hacia-la-derecha, (h) girar-hacia-la-izquierda, (i) saludar, (j)
apuntar ´
[Aviles,2006]
(INAOE) Octubre 28, 2009 43 / 53

Experimentos ´

´
Representacion 1/2
Contenido

´
Introduccion
Cada secuencia es un vector formado por conjuntos de
Representa-
´
siete atributos que describen al ademan. Un ejemplo de una
´
cion secuencia es la siguiente:
Aprendizaje
de PTRs
´
basicos
(+ + −− T F F),(+ + −+ T F F),(+ + +0 T F F),(+ + ++T F F)...
Aprendizaje
de PTRs
´
jerarquicos
Atributos de movimiento Atributos de postura
Experimentos
Experimentos para • ∆area • Forma : horizontal(−),
´
navegacion
´
Clasiﬁcacion de
ademanes • ∆x vertical(+), inclinada (0).
Conclusiones
• ∆y • Arriba (de la cabeza).

Pueden tomar los valores • Derecha (de la cabeza).
{+,−,0}: incremento, • Torso (sobre el torso).
decremento o ninguno.

(INAOE) Octubre 28, 2009 44 / 53

Experimentos ´

´
Representacion 2/2
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
Las secuencias son transformadas a una representacion de
´
basicos
primer orden reemplazando sus atributos con un predicado.
Aprendizaje
de PTRs
´
jerarquicos hmov(Estado,derecha), vmov(Estado,subiendo),
Experimentos
Experimentos para
˜
tamano(Estado,inc), forma(Estado,vertical),
´
navegacion
´
Clasiﬁcacion de
derecha(Estado,si), en rostro(Estado,no),. . .
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 45 / 53

Experimentos ´

Entrenamiento y prueba
Contenido
• Conjuntos de entrenamiento: De 50 secuencias por
´
Introduccion
´
ademan se seleccionaron aleatoriamente 20
Representa-
´
cion secuencias. Las secuencias restantes forman el
Aprendizaje conjunto de prueba.
de PTRs
´
basicos
• Conjuntos de prueba: dos sub-conjuntos seleccionando
Aprendizaje
de PTRs aleatoriamente 2 y 10 secuencias para cada uno.
´
jerarquicos
• Ejemplos negativos: 1 secuencia aleatoria de cada
Experimentos
Experimentos para
´
navegacion
´
ademan.
´
Clasiﬁcacion de
ademanes ´ ´ ´
• Se aprendio una gramatica para cada ademan,
Conclusiones ´
obteniendo 9 gramaticas.
´
• Se mostro cada secuencia del conjunto de pruebas a
´ ´
las gramaticas. La gramatica que obtuviera la mejor
´ ´
evaluacion corresponde al ademan mostrado.
´
• Se repitio el proceso 10 veces para cada sub-conjunto.

(INAOE) Octubre 28, 2009 46 / 53

Experimentos ´

´
Comparacion con HMMs
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos
´
Precision global
Aprendizaje
de PTRs
´
jerarquicos

Experimentos
2 secuencias 10 secuencias
Experimentos para
´
navegacion
FOSeq HMMs FOSeq HMMs
´
Clasiﬁcacion de
ademanes 95.17 % 94.85 % 97.34 % 97.56 %
Conclusiones

(INAOE) Octubre 28, 2009 47 / 53

Experimentos ´

´
Matriz de confusion para 10 secuencias
Contenido
´
Prediccion
´
Introduccion 1 2 3 4 5 6 7 8 9 Tota
1 99.33 0.67 300
Representa- 2 97.24 2.76 290
´
cion 3 100.00 290
Clase real

4 13.10 1.72 85.17 290
Aprendizaje 5 100.00 300
de PTRs 6 1.03 97.59 1.38 290
´
basicos 7 2.07 96.55 1.38 290
8 100.00 290
Aprendizaje
9 100.00 290
de PTRs
Total 301 320 295 255 306 283 280 292 298 263
´
jerarquicos

Experimentos ´
1) atencion, 2) acercar, 3) izquierda, 4) apuntar, 5) derecha, 6) detenerse, 7) girar-hacia-la-izquierda, 8)
Experimentos para
´
navegacion
´ ´ ´
girar-hacia-la-derecha, 9) saludar. La ultima columna indica el numero total de secuencias de cada ademan.
´
Clasificacion de
ademanes
´ ´
El ultimo renglon indica el numero de secuencias clasificadas como la clase indicada en la columna.
´
Conclusiones

Ademanes mejor clasificados: izquierda, derecha,
girar-hacia-la-derecha y saludar.
´
Ademan peor clasificado: apuntar, donde 13 % de los ejemplos
se clasificaron como acercar.

(INAOE) Octubre 28, 2009 48 / 53

Experimentos ´

´
Ejemplo de gramaticas de ademanes
Contenido

´
Introduccion
Acercar Apuntar
Representa-
´
cion ˜
S → R5,tamano(dec), ˜
S → R9,R4,R5,R4,tamano(inc),
forma(vertical),R12,R10,R2,R7, forma(vertical),R2,hmov(ninguno),. . .
Aprendizaje
de PTRs R11,R13,vmov(bajando), . . . R1 → en rostro(Estado,no),
´
basicos R1 → en rostro(Estado,no), sobre torso(Estado,si)
Aprendizaje sobre torso(Estado,si) R2 → derecha(Estado,no),R1
de PTRs R2 → forma(Estado,horizontal), ...
´
jerarquicos
derecha(Estado,no),R1
Experimentos ...
Experimentos para
´
navegacion
´
Clasiﬁcacion de
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 49 / 53

Conclusiones

Contribuciones de la tesis
Contenido

´
Introduccion

Representa-
´
cion

Aprendizaje
de PTRs
´
basicos
´
• Representacion de alto nivel mediante una
Aprendizaje ´ ´
transformacion de informacion de bajo nivel.
de PTRs
´
jerarquicos • Algoritmo para aprendizaje de conceptos y PTRs
Experimentos ´
basicos.
Experimentos para
´
navegacion
´
• Algoritmo para aprendizaje de gramaticas.
ademanes

Conclusiones

(INAOE) Octubre 28, 2009 50 / 53

Conclusiones

Conclusiones
Contenido

´
Introduccion

Representa-
´
cion
´
• Una representacion relacional a partir de datos crudos
Aprendizaje
de PTRs abre posibilidades de utilizar diferentes algoritmos de
´
basicos

Aprendizaje
aprendizaje al reducir el volumen de datos que los
de PTRs
´
jerarquicos
sensores producen.
Experimentos • Los PTRs aprendidos en un ambiente pueden ser
Experimentos para
´
navegacion utilizados en nuevos ambientes con caracter´sticas
ı
´
Clasiﬁcacion de
ademanes
similares.
Conclusiones
´ ´
• La clonacion facilita la programacion de un robot.

(INAOE) Octubre 28, 2009 51 / 53

Conclusiones

Conclusiones
Contenido

´
Introduccion

Representa-
´
cion ´
• Las gramaticas aprendidas permiten expresar
Aprendizaje
de PTRs
´
sub-tareas en el caso de navegacion o sub-ademanes
´
basicos ´
en el caso de la clasificacion de ademanes.
Aprendizaje
de PTRs ´ ´
• La representacion explćita de las gramaticas permite
ı
´
jerarquicos
analizar similitudes y diferencias entre ademanes.
Experimentos
Experimentos para
´
navegacion
´ ´ ´
• La induccion de gramaticas se probo en el aprendizaje
´
Clasificacion de
ademanes ´ ´
de PTRs jerarquicos de navegacion y para generar
Conclusiones ´ ´
gramaticas de ademanes para clasificacion. En ambas
aplicaciones se obtuvieron buenos resultados.

(INAOE) Octubre 28, 2009 52 / 53

Conclusiones

Trabajo futuro
Contenido

´
Introduccion ´
• Establecimiento de diferentes criterios de evaluacion de
Representa-
´
comportamientos.
cion

Aprendizaje ´
• Aprendizaje con retroalimentacion.
de PTRs
´
basicos • Aprendizaje de PTRs para resolver situaciones de
Aprendizaje
de PTRs
conflicto.
´
jerarquicos
• Aprendizaje de valores de velocidad.
Experimentos
Experimentos para
´
navegacion
´ ´
• Ampliacion de la representacion del ambiente.
´
Clasificacion de
ademanes • Aprendizaje de jerarquás con mas niveles.
ı
Conclusiones
´
• Creacion de nuevos predicados para estados
desconocidos.
´
• Mejora del algoritmo de generalizacion en el
´
aprendizaje de gramaticas.

(INAOE) Octubre 28, 2009 53 / 53

Aprendizaje de Programas Teleo-Reactivos para Robótica Móvil

Recomendados

Recomendados

Más contenido relacionado

Más de Blanca Alicia Vargas Govea

Más de Blanca Alicia Vargas Govea (6)

Aprendizaje de Programas Teleo-Reactivos para Robótica Móvil