1. Asignatura: Inteligencia Artificial
Práctica 1:Aplicaciones de la I.A.
Curso2013-14
ROBOTS CON CAPACIDAD
DE APRENDIZAJE
Alejandro Casado Quijada
Andrés Ortiz Corrales
Antonio Jiménez Martínez
Jesús Prieto López
Salvador Rueda Molina
Grupo de Prácticas B2
1
2. Índice
1.¿En qué consiste el problema?. ¿Por qué es
relevante?
2.¿Qué técnicas de IA se aplican?
3.¿Por qué requiere aplicar técnicas de IA?
4.¿Cómo funciona la aplicación?
5.Referencias
2
4. 1.2 Relevancia del problema
•Aparecen los siguientes beneficios:
•Sociedad:
•Industria: cambio brusco de robots autómatas a los robots «gestuales» .
Estos son manipuladores que se limitan a realizar secuencias de
movimientos.
•Informática: utilizando las tecnologías avanzadas , aumentamos el
rendimiento de los sistemas software como el ejemplo de Microsoft:
Excel, Outlook, Azure…
4
-Robots para la vida cotidiana
-Robots para el entretenimiento
5. 2.TÉCNICAS DE APRENDIZAJE
• A partir de ejemplos etiquetados donde se conoce
la salida, se calcula una función genérica.Supervisado
• El objetivo es descubrir un patrón en los datos a partir de
ejemplos no etiquetados. Sin indicaciones para solución
correcta o errónea.
No supervisado
• Mediante una entrada externa en respuesta a sus
acciones busca el resultado mas deseable.(prueba-
error).
Por refuerzo
• Se enfrenta a un problema mediante el uso de
conocimiento previamente guardado.Multi-tarea
• Acumula experiencias y habilidades generando sus
propias secuencias de situaciones de
aprendizaje(curriculum).Por desarrollo
6. 3. Justificación del uso de la IA
.
6
¿Por qué requiere aplicar técnicas de IA?
Necesitamos la evolución del software a través de las experiencias, sea capaz
de decidir ante una situación determinada.
Identificar los requisitos de la aplicación:
Cada proceso se compone de un conjunto de: estados, entorno y señales de
refuerzo escalares (0-1).
¿Por qué no puede resolverse con técnicas convencionales?
El software debe ser capaz de corregir su comportamiento en base a las
experiencias que ya ha tenido. Por lo tanto si sus experiencias es positiva tendrá
más posibilidades de volver a tener este comportamiento.
7. 3. 1. Emular las técnicas cognitivas
Una de sus características principales es que a
partir de la información almacenada es capaz
de determinar que tipo de objeto es, sin
haberlo visto anteriormente (abstracción). Esta
técnica es la cognición incorporada y su
objetivo es resolver problemas variados no
previstos por su programador.
7
Podemos ejemplificar estas técnicas a partir del Robots Armar III.
Ya que es un claro ejemplo de los algoritmos de aprendizaje.
Este robots es capaz de manipular objetos y almacenar información; de
esta manera es capaz de desarrollar sus capacidades cognitivas y aprender.
8. 4. Descripción de la aplicación
• Interacción con el entorno:
• Tienen lugar con: los humanos, objetos y
otros agentes.
• Reciben percepciones y ejecutan acciones.
• Secuencia de interacción:
Se interactúa en una secuencia de instantes de
tiempo ( t = 0,1,2,3)
En cada instante de tiempo t, se recibe un
estado del entorno s(t), dentro de un conjunto
de posibles estados s(p).
Se selecciona una acción a(t) y en
consecuencia se recibe una recompensa sobre
la acción y pasa a estar en un nuevo estado
s(t+1).
• En cada momento se revisan los estados y la
probabilidad de realizar cada una de las
diferentes acciones (política del agente). 8
9. 4. Descripción de la aplicación
9
Recompensa: valores variables que indican lo deseable que es una acción.
La suma de las recompensas se denomina retorno y el objetivo final del aprendizaje
por refuerzo es que se consiga un mayor retorno a largo plazo
Lo ideal es que para el historial de percepciones realizadas tuviera información
completa para los estados (propiedad de Markov), ya que lo normal es que un
estado esté compuesto por la percepciones del momento actual.
Los estados pueden obtenerse por: percepciones de bajo nivel (p.e. sensores), de
mayor nivel (p.e. descripciones simbólicas de los objetos de una habitación).
Lo mejor de este marco de trabajo es que es flexible, y puede ser aplicado a
muchos problemas diferentes.