Este documento presenta el aprendizaje de programas teleo-reactivos (PTRs) básicos y jerárquicos para controlar un robot móvil. Se describe la representación del ambiente, el aprendizaje de PTRs básicos mediante clonación para tareas como navegación, y el aprendizaje de PTRs jerárquicos que pueden incluir otros PTRs. Los experimentos muestran la capacidad del robot para realizar tareas como navegación y clasificación de ademanes controlado por los PTRs aprendidos.
El documento evalúa la presentación de un grupo sobre la selección de una técnica cinematográfica. Se evalúan cuatro indicadores: la presentación del grupo, la presentación de la película a analizar, la presentación de la técnica escogida y la adecuación de la técnica a la película. Se asignan puntuaciones de 0 a 4 dependiendo del nivel de detalle y rigor en la explicación de cada punto.
Este documento describe el seminario de encuentro como una modalidad pedagógica para promover el aprendizaje participativo. Explica que el seminario consiste en tres etapas: la pre-seminario, el seminario central y el post-seminario. Durante estas etapas, los estudiantes trabajan de forma individual y grupal para analizar textos, debatir ideas y generar nuevos conocimientos de manera colaborativa. El documento también define los roles y funciones de los participantes del seminario.
Effects of relevant contextual features in the performance of a restaurant re...Blanca Alicia Vargas Govea
The document describes a restaurant recommender system called Surfeous that incorporates contextual information to make recommendations. It evaluates the impact of different contextual features on recommendation performance. Key findings include:
1) Feature selection identified a minimum relevant subset of 5 attributes (cuisine, hours, days, accepts, address) that achieved similar or better precision, recall, and NDCG scores compared to using all 23 attributes.
2) Incorporating contextual rules to match user profiles improved recommendation performance over a context-free baseline.
3) The best performing subsets were D for precision, C for recall, and D and G for NDCG, demonstrating the value of selective contextual attributes.
Este documento propone aplicar técnicas de minería semántica para generar reglas que mejoren los sistemas de recomendación. Describe el estado actual de los sistemas de recomendación y las limitaciones de los enfoques actuales. Luego presenta una propuesta para aplicar minería semántica para extraer reglas a partir de atributos de usuario, servicio y entorno que capturen mejor las preferencias de los usuarios. Finalmente, muestra ejemplos de reglas generadas que consideran factores como la ocupación, edad, intereses cultural
Effects of relevant contextual features in the performance of a restaurant re...Blanca Alicia Vargas Govea
The document describes experiments conducted to evaluate the effects of relevant contextual features on the performance of a restaurant recommender system called Surfeous. Key findings include:
- Using a reduced subset of attributes (hours, days, accepts, cuisine) performed as well or better than using all attributes, indicating feature selection can improve efficiency.
- For recall, subsets generally outperformed a context-free approach, suggesting contextual attributes enrich recommendations.
- Fusion achieved similar precision and NDCG as the context-free approach, while rules alone provided lower performance.
Este documento describe el aprendizaje de reglas para un sistema de recomendación contextual. Presenta la metodología utilizada, incluyendo la selección de atributos, la preparación de datos y el aprendizaje automático de reglas usando ILP. La evaluación muestra que el enfoque contextual obtiene el menor desempeño, posiblemente debido a reglas demasiado generales o con sobreajuste. Se necesitan reglas que capturen los datos sin estos problemas para mejorar las recomendaciones.
Este documento presenta un resumen breve de la historia de la ingeniería de software desde la década de 1960 hasta la década de 1990. Comenzó con el uso de grandes computadoras y lenguajes como Fortran y COBOL, luego evolucionó hacia lenguajes más estructurados como Algol y Pascal, y finalmente condujo al desarrollo de la programación orientada a objetos, interfaces gráficas de usuario y software libre.
El documento evalúa la presentación de un grupo sobre la selección de una técnica cinematográfica. Se evalúan cuatro indicadores: la presentación del grupo, la presentación de la película a analizar, la presentación de la técnica escogida y la adecuación de la técnica a la película. Se asignan puntuaciones de 0 a 4 dependiendo del nivel de detalle y rigor en la explicación de cada punto.
Este documento describe el seminario de encuentro como una modalidad pedagógica para promover el aprendizaje participativo. Explica que el seminario consiste en tres etapas: la pre-seminario, el seminario central y el post-seminario. Durante estas etapas, los estudiantes trabajan de forma individual y grupal para analizar textos, debatir ideas y generar nuevos conocimientos de manera colaborativa. El documento también define los roles y funciones de los participantes del seminario.
Effects of relevant contextual features in the performance of a restaurant re...Blanca Alicia Vargas Govea
The document describes a restaurant recommender system called Surfeous that incorporates contextual information to make recommendations. It evaluates the impact of different contextual features on recommendation performance. Key findings include:
1) Feature selection identified a minimum relevant subset of 5 attributes (cuisine, hours, days, accepts, address) that achieved similar or better precision, recall, and NDCG scores compared to using all 23 attributes.
2) Incorporating contextual rules to match user profiles improved recommendation performance over a context-free baseline.
3) The best performing subsets were D for precision, C for recall, and D and G for NDCG, demonstrating the value of selective contextual attributes.
Este documento propone aplicar técnicas de minería semántica para generar reglas que mejoren los sistemas de recomendación. Describe el estado actual de los sistemas de recomendación y las limitaciones de los enfoques actuales. Luego presenta una propuesta para aplicar minería semántica para extraer reglas a partir de atributos de usuario, servicio y entorno que capturen mejor las preferencias de los usuarios. Finalmente, muestra ejemplos de reglas generadas que consideran factores como la ocupación, edad, intereses cultural
Effects of relevant contextual features in the performance of a restaurant re...Blanca Alicia Vargas Govea
The document describes experiments conducted to evaluate the effects of relevant contextual features on the performance of a restaurant recommender system called Surfeous. Key findings include:
- Using a reduced subset of attributes (hours, days, accepts, cuisine) performed as well or better than using all attributes, indicating feature selection can improve efficiency.
- For recall, subsets generally outperformed a context-free approach, suggesting contextual attributes enrich recommendations.
- Fusion achieved similar precision and NDCG as the context-free approach, while rules alone provided lower performance.
Este documento describe el aprendizaje de reglas para un sistema de recomendación contextual. Presenta la metodología utilizada, incluyendo la selección de atributos, la preparación de datos y el aprendizaje automático de reglas usando ILP. La evaluación muestra que el enfoque contextual obtiene el menor desempeño, posiblemente debido a reglas demasiado generales o con sobreajuste. Se necesitan reglas que capturen los datos sin estos problemas para mejorar las recomendaciones.
Este documento presenta un resumen breve de la historia de la ingeniería de software desde la década de 1960 hasta la década de 1990. Comenzó con el uso de grandes computadoras y lenguajes como Fortran y COBOL, luego evolucionó hacia lenguajes más estructurados como Algol y Pascal, y finalmente condujo al desarrollo de la programación orientada a objetos, interfaces gráficas de usuario y software libre.
Blanca Vargas Govea reflects on her 10 year journey pursuing a PhD degree and career in research. She started as a research assistant and became a PhD student, focusing her thesis on robotics. After receiving her PhD, she moved to new cities for postdoc research, taking on challenges in data analysis, recommender systems, and the semantic web. Along the way, she discovered a passion for teaching and dealing with the ups and downs of academic work while relying on family and friends for support. Looking to the future, she hopes to continue learning, teaching, conducting research, generating new ideas, writing, and enjoying life beyond her specialized field of work.
Este documento introduce el uso de árboles de decisión y selección de atributos en WEKA. Explica brevemente el origen de WEKA y sus interfaces principales. Luego, describe cómo construir árboles de decisión dividiendo recursivamente los datos basados en el atributo que proporciona la mayor ganancia de información. Finalmente, introduce la importancia de la selección de atributos para mejorar la calidad de los datos y el rendimiento de los algoritmos de aprendizaje automático.
Este documento describe los desafíos y enfoques para evaluar sistemas de recomendación. Explica que la evaluación es importante para mostrar el cumplimiento del objetivo, analizar deficiencias y permitir comparaciones. Sin embargo, existen dificultades como la variedad de algoritmos, falta de metodología estándar y escasez de datos de prueba. El documento propone nuevas métricas, enfoques centrados en el usuario y considerar atributos de contexto. Finalmente, presenta gráficos sobre precision y recall para ilustrar su metodología
The document describes a method for learning relational grammars from sequences of actions performed by a user steering a robot. It induces grammars from sequences of state-action pairs by identifying repeated n-grams and generalizing rules. Experiments applying the method to navigation tasks and gesture recognition are discussed.
Este documento describe los tipos de sistemas de recomendación, incluyendo filtrado de contenido, colaborativo e híbrido, y los desafíos de evaluar estos sistemas. También discute los enfoques para la evaluación, incluyendo métricas de precisión, cobertura y satisfacción del usuario.
Blanca Vargas Govea reflects on her 10 year journey pursuing a PhD degree and career in research. She started as a research assistant and became a PhD student, focusing her thesis on robotics. After receiving her PhD, she moved to new cities for postdoc research, taking on challenges in data analysis, recommender systems, and the semantic web. Along the way, she discovered a passion for teaching and dealing with the ups and downs of academic work while relying on family and friends for support. Looking to the future, she hopes to continue learning, teaching, conducting research, generating new ideas, writing, and enjoying life beyond her specialized field of work.
Este documento introduce el uso de árboles de decisión y selección de atributos en WEKA. Explica brevemente el origen de WEKA y sus interfaces principales. Luego, describe cómo construir árboles de decisión dividiendo recursivamente los datos basados en el atributo que proporciona la mayor ganancia de información. Finalmente, introduce la importancia de la selección de atributos para mejorar la calidad de los datos y el rendimiento de los algoritmos de aprendizaje automático.
Este documento describe los desafíos y enfoques para evaluar sistemas de recomendación. Explica que la evaluación es importante para mostrar el cumplimiento del objetivo, analizar deficiencias y permitir comparaciones. Sin embargo, existen dificultades como la variedad de algoritmos, falta de metodología estándar y escasez de datos de prueba. El documento propone nuevas métricas, enfoques centrados en el usuario y considerar atributos de contexto. Finalmente, presenta gráficos sobre precision y recall para ilustrar su metodología
The document describes a method for learning relational grammars from sequences of actions performed by a user steering a robot. It induces grammars from sequences of state-action pairs by identifying repeated n-grams and generalizing rules. Experiments applying the method to navigation tasks and gesture recognition are discussed.
Este documento describe los tipos de sistemas de recomendación, incluyendo filtrado de contenido, colaborativo e híbrido, y los desafíos de evaluar estos sistemas. También discute los enfoques para la evaluación, incluyendo métricas de precisión, cobertura y satisfacción del usuario.
Aprendizaje de Programas Teleo-Reactivos para Robótica Móvil
1. Aprendizaje de Programas Teleo-Reactivos
Contenido
´
Introduccion ´ ´
para Robotica Movil
Representa-
´
cion
Aprendizaje
de PTRs Blanca A. Vargas Govea
´
basicos
Asesor: Dr. Eduardo F. Morales Manzanares
Aprendizaje
de PTRs
´
jerarquicos INAOE
Experimentos
Experimentos para
´
navegacion
´
Octubre 28, 2009
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 1 / 53
2. Contenido
Contenido
Contenido
´
Introduccion ´
1 Introduccion
Representa-
´
cion
Aprendizaje
´
2 Representacion
de PTRs
´
basicos
Aprendizaje
´
3 Aprendizaje de PTRs basicos
de PTRs
´
jerarquicos
Experimentos
´
4 Aprendizaje de PTRs jerarquicos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes 5 Experimentos
Conclusiones ´
Experimentos para navegacion
´
Clasificacion de ademanes
6 Conclusiones
(INAOE) Octubre 28, 2009 2 / 53
3. ´
Introduccion
´
Motivacion
Contenido
´
Introduccion
Robot, ve a la sala Creciente demanda de
Representa-
´
cion
robots de servicio
Aprendizaje ´
• Metodos para simplificar
de PTRs
´
basicos ´
la programacion.
Aprendizaje
de PTRs
´
• Ambientes dinamicos.
´
jerarquicos
• Ambientes distintos:
Experimentos
Experimentos para
´
navegacion
casa, oficina,
´
Clasificacion de
ademanes
laboratorio.
Conclusiones
´
Un robot movil que aprenda a realizar tareas en ambientes
´
dinamicos.
(INAOE) Octubre 28, 2009 3 / 53
4. ´
Introduccion
´
Problematica
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 4 / 53
5. ´
Introduccion
En esta tesis:
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 5 / 53
6. ´
Introduccion
Trabajo relacionado
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 6 / 53
7. ´
Representacion
´
Representacion
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 7 / 53
8. ´
Representacion
´
Representacion del ambiente 1/2
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
´
[Hernandez, 2005]
(INAOE) Octubre 28, 2009 8 / 53
9. ´
Representacion
´
Representacion del ambiente 2/2
Contenido Distancia ´
Angulo Atrib Tipo
´
Introduccion 2.18 -73 -1.41 izquierda
Representa-
´
cion
2.17 -47 0 esquina
Aprendizaje 3.46 -89.5 1.06 pared
de PTRs
´
basicos
Aprendizaje Ventaja
de PTRs
´
jerarquicos
´
Esta transformacion reduce de cientos de datos por estado
Experimentos
Experimentos para
´
navegacion
a unos pocos atributos significativos
´
Clasificacion de
ademanes
Conclusiones ´ ´ ´
Se agrega la posicion y orientacion del robot, informacion
de los sonares traseros y la meta. Se transforma en los
siguientes
´
Pares estado-accion:
´
[robot(X,Y,Θ),atras(n),meta(Xg,Yg),marca(Dist,Angulo,Atrib,Tipo),..,],Accion
´ ´
´
[robot(X,Y,Θ),atras(n),meta(Xg,Yg),marca(Dist,Angulo,Atrib,Tipo),..,],Accion
´ ´
.
(INAOE) . Octubre 28, 2009 9 / 53
10. ´
Aprendizaje de PTRs basicos
´
Aprendizaje de PTRs basicos
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 10 / 53
11. ´
Aprendizaje de PTRs basicos
´ ´
Definicion de la tarea de navegacion
Contenido
´
Introduccion
Representa-
´
cion
Meta
obstáculo dinámico Sub-tareas
Aprendizaje
de PTRs
girar-derecha
´
basicos • Deambular.
Aprendizaje
de PTRs girar-izquierda • Orientarse.
´
jerarquicos
Experimentos
• Salir de
orientarse avanzar
Experimentos para
´
navegacion trampas.
´
Clasificacion de
ademanes
salir-de-
• Seguir a un
Conclusiones trampa ´
objeto movil.
orientarse
(INAOE) Octubre 28, 2009 11 / 53
12. ´
Aprendizaje de PTRs basicos
´ ´
¿Como se aprendio?
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
´
Mediante clonacion, se
de PTRs
´
jerarquicos
aprenden PTRs para que el
Experimentos
robot pueda realizar las
Experimentos para
´
navegacion
sub-tareas definidas.
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 12 / 53
13. ´
Aprendizaje de PTRs basicos
´
Clonacion
Contenido
Extraer conocimiento expl´cito de habilidades de bajo nivel
ı
´
Introduccion
(Michie,1992).
Representa-
´
cion • Obtener ejemplos o trazas.
Aprendizaje
de PTRs
• Dar las trazas como entrada a
´
basicos algoritmos de aprendizaje.
Aprendizaje
de PTRs • Obtener modelos que al
´
jerarquicos
´
ejecutarse produciran
Experimentos
Experimentos para
´
navegacion
comportamientos similares a
´
Clasificacion de
ademanes
´
quien genero los modelos.
Conclusiones • Se les llama clones porque
reproducen la habilidad de
una persona o sistema.
(INAOE) Octubre 28, 2009 13 / 53
14. ´
Aprendizaje de PTRs basicos
Programas Teleo-Reactivos
Contenido
´
Conjunto de clausulas que ejecutan cont´nuamente una
ı
´
Introduccion ´
accion en el estado actual mientras sus condiciones son
Representa- satisfechas (Nilsson, 1994).
´
cion
´
ptr1(Estado,Accion) ←
Aprendizaje
de PTRs ´
condicion meta(Estado).
´
basicos ´
ptr1(Estado,Accion) ←
Aprendizaje ´
condicion1(Estado,...),
de PTRs ´
condicion2(Estado, ...),
´
jerarquicos ...
Experimentos ptr1(Estado, PTR2 ) ←
Experimentos para
´
navegacion
´
condicion1(Estado,...),
´
Clasificacion de ´
condicion3(Estado, ...), . . .
ademanes
...
Conclusiones
Ventaja
Uso de acciones cont´nuas,
ı
capaces de reaccionar en un
´
ambiente dinamico.
(INAOE) Octubre 28, 2009 14 / 53
15. ´
Aprendizaje de PTRs basicos
Contenido
´
Introduccion
´
PTRs basicos
Representa- Sus acciones son
´
cion
Aprendizaje
unicamente acciones
´
de PTRs
´
´
atomicas
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
´
PTRs jerarquicos
Sus acciones pueden
incluir otros PTRs
(INAOE) Octubre 28, 2009 15 / 53
16. ´
Aprendizaje de PTRs basicos
´
Aprendizaje de PTRs basicos
Contenido
Objetivo: Producir un conjunto de predicados que
´
Introduccion ´
devuelvan una accion particular, capturando el
Representa- comportamiento deseado.
´
cion
1 Dados: una traza (o trazas), un predicado objetivo y
Aprendizaje
de PTRs posible conocimiento del dominio
´
basicos
Aprendizaje
´
2 Generar ejemplos negativos. Se realizo intercambiando
de PTRs
´
jerarquicos
las acciones.
Experimentos 3 Aprender PTRs usando ALEPH (un sistema de ILP).
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 16 / 53
17. ´
Aprendizaje de PTRs basicos
Conocimiento del dominio
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 17 / 53
18. ´
Aprendizaje de PTRs basicos
Ejemplo: deambular
Contenido
Entrada: trazas de deambular, el
´
Introduccion
predicado objetivo, el concepto
Representa-
´
cion aprendido zona-frontal, zona-trasera y el
Aprendizaje predicado para obtener la marca mas´
de PTRs
´
basicos cercana.
Aprendizaje
de PTRs Salida:
´
jerarquicos
Experimentos deambular(Estado,avanzar) ←
Experimentos para
´
navegacion zona-frontal(Estado,libre).
´
Clasificacion de
ademanes deambular(Estado,girar-izq) ← Robot controlado por el PTR
Conclusiones ´
zona-frontal(Estado,obstaculo), para deambular
obst-cercano(Estado,Marca,Dist,Ang),
menor-igual(Ang,-1.51)).
deambular(Estado,girar-der) ←
´
zona-frontal(Estado,obstaculo).
(INAOE) Octubre 28, 2009 18 / 53
19. ´
Aprendizaje de PTRs jerarquicos
´
Aprendizaje de PTRs jerarquicos
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 19 / 53
20. ´
Aprendizaje de PTRs jerarquicos
´
Aprendizaje de gramaticas
Contenido FOSeq (First Order Sequence learning)
´
Introduccion
Representa-
´
cion
´
Entrada: un conjunto de secuencias de PTRs basicos
Aprendizaje obtenidas al guiar al robot.
de PTRs
´
basicos FOSeq:
Aprendizaje
de PTRs
´
jerarquicos
1 ´
Induce una gramatica para cada secuencia,
Experimentos
identificando elementos repetidos (n-gramas).
Experimentos para
´
navegacion 2 ´
Evalua las secuencias con cada gramatica aprendida y
´
´
Clasificacion de
ademanes
´
selecciona la gramatica mejor evaluada.
Conclusiones
3 ´ ´
Aplica un proceso de generalizacion a la gramatica
´
mejor evaluada y las gramaticas que aportan elementos
nuevos.
´
Salida: Una gramatica que puede usarse como controlador
´
(PTR jerarquico) o como clasificador.
(INAOE) Octubre 28, 2009 20 / 53
21. ´
Aprendizaje de PTRs jerarquicos
´
Induccion
Contenido
´
Introduccion
Representa-
´
cion
• El algoritmo busca los n-gramas (e.g., sub-secuencias
Aprendizaje de n-elementos) que aparezcan al menos dos veces en
de PTRs
´
basicos
la secuencia.
Aprendizaje • Los n-gramas candidatos son buscados de forma
de PTRs
´
jerarquicos incremental por su longitud.
Experimentos
Experimentos para
• El n-grama con mayor frecuencia es seleccionado,
´
navegacion
´
Clasificacion de ´
generando una nueva regla para la gramatica y
ademanes
Conclusiones
reemplazando con un s´mbolo no-terminal todas las
ı
ocurrencias del n-grama que aparecen en la secuencia
original.
(INAOE) Octubre 28, 2009 21 / 53
22. ´
Aprendizaje de PTRs jerarquicos
´
Induccion: ejemplo
Contenido
´
Introduccion
Representa-
´
cion S→a b c b c b c b a b c b d b e b c S2 → R2 d b e R1
Aprendizaje b c (5) R1 → b c
de PTRs Agrega: R1 → b c R2 → a R1 b
´
basicos
S1 → a R1 R1 R1 b a R1 b d b e R1
Aprendizaje Eliminando elementos repetidos:
de PTRs
´
jerarquicos S1 → a R1 b a R1 b d b e R1
Experimentos R1 b (2)
Experimentos para
´
navegacion
a R1 (2)
´
Clasificacion de a R1 b (2)
ademanes
Agrega: R2 → a R1 b R2 d b e R1
Conclusiones S2 → R2 R2 d b e R1
Eliminando elementos repetidos: a R1 b b c
S2 → R2 d b e R1
b c
(INAOE) Octubre 28, 2009 22 / 53
23. ´
Aprendizaje de PTRs jerarquicos
´
Induccion: con predicados
Contenido
Cuando los elementos de la secuencia son predicados, la
´
Introduccion
´ ´ ´
gramatica inducida es una Gramatica de Clausula Definida
Representa-
´
cion (GCD). Las GCDs:
Aprendizaje
de PTRs
´ ´
• Son una extension de las gramaticas libres de contexto,
´
basicos
• pueden tener argumentos y
Aprendizaje
de PTRs
´
jerarquicos
• son expresadas y ejecutadas en Prolog.
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
´
La entrada es una secuencia de PTRs basicos como la
ademanes
siguiente:
Conclusiones
Entrada
´ ´ ´
pred1(Estado1,accion1), pred2(Estado2,accion1), pred1(Estado3,accion2), . . .
(INAOE) Octubre 28, 2009 23 / 53
24. ´
Aprendizaje de PTRs jerarquicos
´
Evaluacion
Contenido
´
Introduccion ´
• Cada gramatica aprendida se usa para analizar
Representa- ´
sintacticamente todas las secuencias del conjunto
´
cion
Aprendizaje
proporcionado por el usuario.
de PTRs
´
basicos ´
• Por cada secuencia analizada, la gramatica recibe una
Aprendizaje ´ ´
evaluacion, calculada por la funcion:
de PTRs
´
jerarquicos
n
Experimentos cj
Experimentos para eval(Gi ) = (1)
´
navegacion cj + fj
´
Clasificacion de
ademanes
j=1
Conclusiones donde cj y fj representan el numero de elementos que
´
´
la gramatica es capaz o incapaz de aceptar,
respectivamente.
´
• La gramatica mejor evaluada es seleccionada.
(INAOE) Octubre 28, 2009 24 / 53
25. ´
Aprendizaje de PTRs jerarquicos
´
Generalizacion
Contenido
´
Introduccion
´
La idea principal es obtener una nueva gramatica que
Representa-
´
cion ´
mejore la cobertura de gramatica mejor evaluada.
Aprendizaje
de PTRs
´
1 Seleccionar la gramatica que proporciona el mayor
´
basicos
numero de elementos nuevos o unificaciones diferentes
´
Aprendizaje
de PTRs de predicados.
´
jerarquicos
´
2 Calcular el lgg (generalizacion menos general) entre las
Experimentos
Experimentos para
´
navegacion
´
reglas de ambas gramaticas.
´
Clasificacion de
ademanes 3 Aceptar la nueva regla si mejora la cobertura original, si
Conclusiones no, descartarla.
4 Terminar el proceso hasta alcanzar un umbral de
cobertura o hasta que no hay mejora.
(INAOE) Octubre 28, 2009 25 / 53
26. ´
Aprendizaje de PTRs jerarquicos
Ejemplo lgg
Contenido
´
Introduccion
Representa-
´
cion ´
c1 = pred(Estado,accion1) ← ´
c2 = pred(Estado,Accion) ←
´
cond1(Estado,accion1), ´
cond1(Estado,accion1),
Aprendizaje
de PTRs ´
cond2(Estado,accion2). ´
cond2(Estado,accion3).
´
basicos
Aprendizaje
de PTRs
´
jerarquicos ´
Calculando el lgg(c1,c2), la clausula es:
Experimentos
Experimentos para
´
pred(Estado,Accion) ←
´
navegacion ´
cond1(Estado,accion1),
´
Clasificacion de
ademanes ´
cond2(Estado,Accion).
Conclusiones
´ ´
donde las constantes accion2 y accion3 del predicado
´
cond2 son reemplazadas por la variable Accion.
(INAOE) Octubre 28, 2009 26 / 53
27. ´
Aprendizaje de PTRs jerarquicos
´
De gramatica a programa
Contenido ´
R1 → orientar(Estado1,Accion),
´
Introduccion ´
deambular(Estado2,accion1)
Representa-
´
R2 → orientar(Estado1,accion2),
´
cion ´
deambular(Estado2,Accion)
Aprendizaje
´
R3 → orientar(Estado1,accion3),
de PTRs ´
deambular(Estado2,Accion)
´
basicos
Aprendizaje
de PTRs
´
jerarquicos ´ ´
(R1) pred-nuevo1(Estado1,accion1) → orientarse(Estado1,Accion),
Experimentos ´
deambular(Estado2,accion1)
Experimentos para ´ ´
(R2) pred-nuevo2(Estado1,Accion) → orientar(Estado1,accion2),
´
navegacion
´
Clasificacion de
´
deambular(Estado2,Accion)
ademanes ´ ´
(R3) pred-nuevo3(Estado1,Accion) → orientar(Estado1,accion3),
Conclusiones ´
deambular(Estado2,Accion)
Cada regla puede interpretarse como una sub-tarea
(INAOE) Octubre 28, 2009 27 / 53
28. ´
Aprendizaje de PTRs jerarquicos
´
Ejemplo en navegacion: PTR para ir a un
Contenido
punto (deambular + orientarse)
´
Introduccion ´
Entrada: secuencias de los PTRs basicos deambular y
Representa-
´
cion orientar.
Aprendizaje orientar(Estado,girar-izq),deambular(Estado,girar-izq), deambular(Estado,girar-der),
de PTRs deambular(Estado,avanzar),orientar(Estado,girar-izq),deambular(Estado,avanzar),. . .
´
basicos
...
Aprendizaje
de PTRs
´
jerarquicos
Salida:
Experimentos
ir-a(Estado,nil) ←
Experimentos para en-meta(Estado).
´
navegacion
´
Clasificacion de
´
ir-a(Estado,Accion) ←
ademanes orientar(Estado,ninguna),
Conclusiones ´
deambular(Estado,Accion).
´
ir-a(Estado,Accion) ←
deambular(Estado,avanzar),
´
orientar(Estado,Accion).
´
ir-a(Estado,Accion) ←
´
deambular(Estado,Accion).
(INAOE) Octubre 28, 2009 28 / 53
29. Experimentos
Experimentos
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 29 / 53
30. Experimentos ´
Experimentos para navegacion
´
Plataforma de simulacion
Contenido
´
Se utilizo el software para control de robots Player/Stage.
´
Introduccion
• Diferentes escenarios: 10 mapas
Representa-
´
cion diferentes a los de entrenamiento.
Aprendizaje
de PTRs ´ ´
• Obstaculos fijos y moviles de
´
basicos
˜
diversas formas y tamanos.
Aprendizaje
de PTRs ´
• Limitaciones del sensor laser: 50 cm
´
jerarquicos
Experimentos
sobre el piso de forma paralela, se
Experimentos para
´
navegacion
´
evito el vidrio.
´
Clasificacion de
ademanes ´
• Precision:
Conclusiones
e
p= × 100 (2)
e+f
donde e es el numero de tareas o sub-tareas
´
realizadas exitosamente y f es el numero de tareas
´
o sub-tareas que fallaron.
(INAOE) Octubre 28, 2009 30 / 53
31. Experimentos ´
Experimentos para navegacion
Mapas
Contenido
Mapas de entrenamiento Mapas de prueba
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
Ventaja
´
navegacion
´
Clasificacion de
ademanes Los PTRs aprendidos pueden
Conclusiones usarse en ambientes distintos
al de entrenamiento
(INAOE) Octubre 28, 2009 31 / 53
32. Experimentos ´
Experimentos para navegacion
PTRs aprendidos
Contenido
´
PTR basico E+ y E− Conoc-dom Acciones
deambular 979 zona-frontal* avanzar
´
Introduccion
orientar 2982 zona-trasera* girar-der
Representa- salir-de-trampa 952 menor-igual girar-izq
´
cion
seguir 619 mayor-igual detener
Aprendizaje obst-mas-cercano retroceder
de PTRs ´
obtener-angulos
´
basicos
zona-orienta*
Aprendizaje config-paredes*
de PTRs
´
jerarquicos lado-pared*
zona-seguir*
Experimentos
Experimentos para
rango-distancia*
´
navegacion obtener-vals
´
Clasificacion de
ademanes
Conclusiones (*) significa que el concepto fue aprendido
´
PTR jerarquico No. de secuencias
deambular + orientar (ir a un punto) 12
deambular + orientar + salir de trampa 16
seguir + deambular 10
seguir + deambular + salir de trampa 14
´
PTRs jerarquicos aprendidos y numero de trazas
´
(INAOE) Octubre 28, 2009 32 / 53
33. Experimentos ´
Experimentos para navegacion
´
Ejemplos: PTRs basicos
Contenido
Meta Meta Meta Meta
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs Salir de trampa
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos Deambular
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
Orientar ´
Seguir a un objeto movil
(INAOE) Octubre 28, 2009 33 / 53
34. Experimentos ´
Experimentos para navegacion
´
Ejemplos: PTRs jerarquicos
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs Ir a un punto
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
Visitando distintos lugares
(INAOE) Octubre 28, 2009 34 / 53
35. Experimentos ´
Experimentos para navegacion
´ ´
Simulacion: Precision de PTRs
Contenido PTR Pruebas ´
Precision
´
Introduccion Deambular 30 86.67 %
Representa- Orientar 30 100.00 %
´
cion
Aprendizaje
Salir de trampa 30 80.00 %
de PTRs
´
basicos
Seguir 40 97.50 %
Aprendizaje
de PTRs
´
jerarquicos PTR Pruebas ´
Precision
Experimentos deambular + orientar 30 86.67 %
Experimentos para
´
navegacion
´
Clasificacion de
(ir a un punto)
ademanes
deambular + orientar + 30 93.33 %
Conclusiones
salir de trampa
seguir + deambular 40 90.00 %
seguir + deambular + 40 100.00 %
salir de trampa
visitar 5 lugares* 30 96.67 %
(INAOE) Octubre 28, 2009 35 / 53
36. Experimentos ´
Experimentos para navegacion
´ ´
Modulo de navegacion para Markovito
Contenido
´
Introduccion
Representa-
´
cion
Robot PeopleBot de ActivMedia equipado con un anillo de
Aprendizaje ´ ´
16 sonares en la parte inferior y sistema de vision estereo.
de PTRs
´
basicos
Aprendizaje • Navegar hacia distintos
de PTRs
´
jerarquicos lugares.
Experimentos
Experimentos para
• Seguir a una persona.
´
navegacion
´
Clasificacion de
ademanes
• Encontrar un objeto.
Conclusiones • Entregar
mensajes/objetos.
(INAOE) Octubre 28, 2009 36 / 53
37. Experimentos ´
Experimentos para navegacion
Navegar hacia distintos lugares
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Visitando distintos lugares
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 37 / 53
38. Experimentos ´
Experimentos para navegacion
Seguir a una persona
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
´
El PTR de seguimiento se adapt´ para seguir a una persona. Esto se hizo
o
´ ´
reemplazando el proceso de identificacion de marcas utilizando un sensor laser
´ ´
por un proceso de identificacion de marcas visuales (Sanchez-Texis, 2008).
(INAOE) Octubre 28, 2009 38 / 53
39. Experimentos ´
Experimentos para navegacion
´
Markovito: Precision de PTRs
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Pruebas Intervenciones ´
Precision
Aprendizaje
de PTRs Ir a un punto 120 20 85.00 %
´
jerarquicos
Seguir a 20 3 90.00 %
Experimentos
Experimentos para una persona
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 39 / 53
40. Experimentos ´
Experimentos para navegacion
´
Comparacion deliberativo/PTRs
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje ´
Se realizaron tres tipos de pruebas de navegacion con el fin
de PTRs
´
basicos de observar las ventajas y desventajas de tres enfoques:
Aprendizaje
de PTRs ´ ´
• Con la pol´tica optima obtenida con iteracion de valor
ı
´
jerarquicos
Experimentos
(DELIB).
Experimentos para
´
navegacion • Con PTRs.
´
Clasificacion de
ademanes
• Con una pol´tica que combina DELIB con PTRs.
ı
Conclusiones
(INAOE) Octubre 28, 2009 40 / 53
41. Experimentos ´
Experimentos para navegacion
´
Comparacion deliberativo/PTRs
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs (a) DELIB (b) PTR (c) a + b
´
basicos
´
Ventaja DELIB: Las trayectorias generadas por este enfoque son las optimas.
Aprendizaje
de PTRs Desventaja DELIB: debe conocer el ambiente.
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(a) DELIB (b) PTR (c) a + b
Ventaja PTRs: El robot puede reaccionar ante obst´
aculos inesperados y llegar a la
´
meta aunque no lo haga con una trayectoria optima. No necesita conocer el
ambiente.
Desventaja PTRs: puede recorrer mayor distancia.
(INAOE) Octubre 28, 2009 41 / 53
42. Experimentos ´
Experimentos para navegacion
Experimentos
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 42 / 53
43. Experimentos ´
Clasificacion de ademanes
´
Ejemplo: gramaticas de ademanes
Contenido
´ ´
Objetivo: aprender una gramatica para cada ademan (9)
´
Introduccion ´
enfocandonos en el reconocimiento de ademanes
Representa- realizados por una persona.
´
cion
Aprendizaje
de PTRs
´
basicos
Aprendizaje
de PTRs
´
jerarquicos
(a) (b) (c) (d) (e)
Experimentos
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(f) (g) (h) (i) (j)
´ ´
(a) posicion inicial y final, (b) atencion, (c) acercar, (d) izquierda, (e) derecha, (f)
detener, (g) girar-hacia-la-derecha, (h) girar-hacia-la-izquierda, (i) saludar, (j)
apuntar ´
[Aviles,2006]
(INAOE) Octubre 28, 2009 43 / 53
44. Experimentos ´
Clasificacion de ademanes
´
Representacion 1/2
Contenido
´
Introduccion
Cada secuencia es un vector formado por conjuntos de
Representa-
´
siete atributos que describen al ademan. Un ejemplo de una
´
cion secuencia es la siguiente:
Aprendizaje
de PTRs
´
basicos
(+ + −− T F F),(+ + −+ T F F),(+ + +0 T F F),(+ + ++T F F)...
Aprendizaje
de PTRs
´
jerarquicos
Atributos de movimiento Atributos de postura
Experimentos
Experimentos para • ∆area • Forma : horizontal(−),
´
navegacion
´
Clasificacion de
ademanes • ∆x vertical(+), inclinada (0).
Conclusiones
• ∆y • Arriba (de la cabeza).
Pueden tomar los valores • Derecha (de la cabeza).
{+,−,0}: incremento, • Torso (sobre el torso).
decremento o ninguno.
(INAOE) Octubre 28, 2009 44 / 53
45. Experimentos ´
Clasificacion de ademanes
´
Representacion 2/2
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
Las secuencias son transformadas a una representacion de
´
basicos
primer orden reemplazando sus atributos con un predicado.
Aprendizaje
de PTRs
´
jerarquicos hmov(Estado,derecha), vmov(Estado,subiendo),
Experimentos
Experimentos para
˜
tamano(Estado,inc), forma(Estado,vertical),
´
navegacion
´
Clasificacion de
derecha(Estado,si), en rostro(Estado,no),. . .
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 45 / 53
46. Experimentos ´
Clasificacion de ademanes
Entrenamiento y prueba
Contenido
• Conjuntos de entrenamiento: De 50 secuencias por
´
Introduccion
´
ademan se seleccionaron aleatoriamente 20
Representa-
´
cion secuencias. Las secuencias restantes forman el
Aprendizaje conjunto de prueba.
de PTRs
´
basicos
• Conjuntos de prueba: dos sub-conjuntos seleccionando
Aprendizaje
de PTRs aleatoriamente 2 y 10 secuencias para cada uno.
´
jerarquicos
• Ejemplos negativos: 1 secuencia aleatoria de cada
Experimentos
Experimentos para
´
navegacion
´
ademan.
´
Clasificacion de
ademanes ´ ´ ´
• Se aprendio una gramatica para cada ademan,
Conclusiones ´
obteniendo 9 gramaticas.
´
• Se mostro cada secuencia del conjunto de pruebas a
´ ´
las gramaticas. La gramatica que obtuviera la mejor
´ ´
evaluacion corresponde al ademan mostrado.
´
• Se repitio el proceso 10 veces para cada sub-conjunto.
(INAOE) Octubre 28, 2009 46 / 53
47. Experimentos ´
Clasificacion de ademanes
´
Comparacion con HMMs
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
´
Precision global
Aprendizaje
de PTRs
´
jerarquicos
Experimentos
2 secuencias 10 secuencias
Experimentos para
´
navegacion
FOSeq HMMs FOSeq HMMs
´
Clasificacion de
ademanes 95.17 % 94.85 % 97.34 % 97.56 %
Conclusiones
(INAOE) Octubre 28, 2009 47 / 53
48. Experimentos ´
Clasificacion de ademanes
´
Matriz de confusion para 10 secuencias
Contenido
´
Prediccion
´
Introduccion 1 2 3 4 5 6 7 8 9 Tota
1 99.33 0.67 300
Representa- 2 97.24 2.76 290
´
cion 3 100.00 290
Clase real
4 13.10 1.72 85.17 290
Aprendizaje 5 100.00 300
de PTRs 6 1.03 97.59 1.38 290
´
basicos 7 2.07 96.55 1.38 290
8 100.00 290
Aprendizaje
9 100.00 290
de PTRs
Total 301 320 295 255 306 283 280 292 298 263
´
jerarquicos
Experimentos ´
1) atencion, 2) acercar, 3) izquierda, 4) apuntar, 5) derecha, 6) detenerse, 7) girar-hacia-la-izquierda, 8)
Experimentos para
´
navegacion
´ ´ ´
girar-hacia-la-derecha, 9) saludar. La ultima columna indica el numero total de secuencias de cada ademan.
´
Clasificacion de
ademanes
´ ´
El ultimo renglon indica el numero de secuencias clasificadas como la clase indicada en la columna.
´
Conclusiones
Ademanes mejor clasificados: izquierda, derecha,
girar-hacia-la-derecha y saludar.
´
Ademan peor clasificado: apuntar, donde 13 % de los ejemplos
se clasificaron como acercar.
(INAOE) Octubre 28, 2009 48 / 53
49. Experimentos ´
Clasificacion de ademanes
´
Ejemplo de gramaticas de ademanes
Contenido
´
Introduccion
Acercar Apuntar
Representa-
´
cion ˜
S → R5,tamano(dec), ˜
S → R9,R4,R5,R4,tamano(inc),
forma(vertical),R12,R10,R2,R7, forma(vertical),R2,hmov(ninguno),. . .
Aprendizaje
de PTRs R11,R13,vmov(bajando), . . . R1 → en rostro(Estado,no),
´
basicos R1 → en rostro(Estado,no), sobre torso(Estado,si)
Aprendizaje sobre torso(Estado,si) R2 → derecha(Estado,no),R1
de PTRs R2 → forma(Estado,horizontal), ...
´
jerarquicos
derecha(Estado,no),R1
Experimentos ...
Experimentos para
´
navegacion
´
Clasificacion de
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 49 / 53
50. Conclusiones
Contribuciones de la tesis
Contenido
´
Introduccion
Representa-
´
cion
Aprendizaje
de PTRs
´
basicos
´
• Representacion de alto nivel mediante una
Aprendizaje ´ ´
transformacion de informacion de bajo nivel.
de PTRs
´
jerarquicos • Algoritmo para aprendizaje de conceptos y PTRs
Experimentos ´
basicos.
Experimentos para
´
navegacion
´
Clasificacion de ´
• Algoritmo para aprendizaje de gramaticas.
ademanes
Conclusiones
(INAOE) Octubre 28, 2009 50 / 53
51. Conclusiones
Conclusiones
Contenido
´
Introduccion
Representa-
´
cion
´
• Una representacion relacional a partir de datos crudos
Aprendizaje
de PTRs abre posibilidades de utilizar diferentes algoritmos de
´
basicos
Aprendizaje
aprendizaje al reducir el volumen de datos que los
de PTRs
´
jerarquicos
sensores producen.
Experimentos • Los PTRs aprendidos en un ambiente pueden ser
Experimentos para
´
navegacion utilizados en nuevos ambientes con caracter´sticas
ı
´
Clasificacion de
ademanes
similares.
Conclusiones
´ ´
• La clonacion facilita la programacion de un robot.
(INAOE) Octubre 28, 2009 51 / 53
52. Conclusiones
Conclusiones
Contenido
´
Introduccion
Representa-
´
cion ´
• Las gramaticas aprendidas permiten expresar
Aprendizaje
de PTRs
´
sub-tareas en el caso de navegacion o sub-ademanes
´
basicos ´
en el caso de la clasificacion de ademanes.
Aprendizaje
de PTRs ´ ´
• La representacion expl´cita de las gramaticas permite
ı
´
jerarquicos
analizar similitudes y diferencias entre ademanes.
Experimentos
Experimentos para
´
navegacion
´ ´ ´
• La induccion de gramaticas se probo en el aprendizaje
´
Clasificacion de
ademanes ´ ´
de PTRs jerarquicos de navegacion y para generar
Conclusiones ´ ´
gramaticas de ademanes para clasificacion. En ambas
aplicaciones se obtuvieron buenos resultados.
(INAOE) Octubre 28, 2009 52 / 53
53. Conclusiones
Trabajo futuro
Contenido
´
Introduccion ´
• Establecimiento de diferentes criterios de evaluacion de
Representa-
´
comportamientos.
cion
Aprendizaje ´
• Aprendizaje con retroalimentacion.
de PTRs
´
basicos • Aprendizaje de PTRs para resolver situaciones de
Aprendizaje
de PTRs
conflicto.
´
jerarquicos
• Aprendizaje de valores de velocidad.
Experimentos
Experimentos para
´
navegacion
´ ´
• Ampliacion de la representacion del ambiente.
´
Clasificacion de
ademanes • Aprendizaje de jerarqu´as con mas niveles.
ı
Conclusiones
´
• Creacion de nuevos predicados para estados
desconocidos.
´
• Mejora del algoritmo de generalizacion en el
´
aprendizaje de gramaticas.
(INAOE) Octubre 28, 2009 53 / 53