Este documento trata sobre el aprendizaje automático o machine learning. Explica que es una rama de la inteligencia artificial cuyo objetivo es desarrollar técnicas que permitan a las computadoras aprender a partir de datos. Luego clasifica los sistemas de aprendizaje automático en tres dimensiones: estrategias de aprendizaje, tipo de conocimiento adquirido y dominio de aplicación. Finalmente, describe algunos ejemplos de aprendizaje automático y su historia.
1. Maestría en Sistemas Computacionales
Sistemas de Información Administrativa
Trabajo Final
Machine Learning
(Aprendizaje Computacional o
Aprendizaje Automático)
Alumno
José Antonio Sandoval Acosta
212157
1
UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA
FACULTAD DE CONTADURÍA Y ADMINISTRACIÓN
Cd. Juárez. Noviembre de 2007.
2. Índice
¿Que es el Aprendizaje Automático o Machine Learning?.............................................3
Objetivos del Aprendizaje Automático..............................................................................4
El aprendizaje automático como una Ciencia..................................................................5
Adquisición de Conocimiento versus Refinamiento de Habilidades...............................6
Un Sistema de Investigación del Aprendizaje Automático..............................................6
Clasificaciones Basadas en Estrategias de Aprendizaje Fundamentales.......................7
Clasificación de Acuerdo al Tipo de Conocimiento Adquirido.....................................10
Clasificación por el Dominio de Aplicación...................................................................12
Un Vistazo Histórico del Aprendizaje Automático.........................................................13
Algunos Ejemplos de Aprendizaje Automático..............................................................15
Caso Práctico de uso de Aprendizaje Automático..........................................................16
Conclusiones....................................................................................................................17
Bibliografía......................................................................................................................18
2
3. ¿Que es el Aprendizaje Automático o Machine Learning?
El Aprendizaje Automático (Machine Learning) es una rama de la Inteligencia Artificial
(IA) cuyo objetivo es desarrollar técnicas que permitan a las computadoras aprender. De
forma más concreta, se trata de crear programas capaces de generalizar comportamientos
a partir de una información no estructurada suministrada en forma de ejemplos. Es, por lo
tanto, un proceso de inducción del conocimiento. En muchas ocasiones el campo de
actuación del Aprendizaje Automático se solapa con el de la Estadística, ya que las dos
disciplinas se basan en el análisis de datos. Sin embargo, el Aprendizaje Automático se
centra más en el estudio de la Complejidad Computacional de los problemas.
El Aprendizaje Automático tiene una amplia gama de aplicaciones, se usa
principalmente en:
• Motores de búsqueda.
• Diagnósticos médicos.
• Detección de fraude en el uso de tarjetas de crédito.
• Análisis del mercado de valores.
• Clasificación de secuencias de ADN.
• Reconocimiento del habla.
• Reconocimiento del lenguaje escrito.
• Juegos.
• Navegación autónoma de robots.
• Recuperación de información documental.
• Filtrado cooperativo.
• Sistemas de diagnóstico, etc.
El Aprendizaje Automático trata de construir sistemas informáticos que optimicen un
criterio de rendimiento utilizando datos o experiencia previa. Una situación en la que se
requiere aprender es cuando no existe experiencia humana o cuando no es fácilmente
explicable. Otra es cuando el problema a resolver cambia en el tiempo o depende del
entorno particular. El Aprendizaje Automático transforma los datos en conocimiento y
proporciona sistemas de propósito general que se adaptan a las circunstancias.
El aprendizaje también puede definirse como alguno de los siguientes procesos:
• Adquisición de nuevo conocimiento.
• Desarrollo de habilidades motoras y cognoscitivas a través de la instrucción o la
práctica.
• Organización de nuevo conocimiento dentro de representaciones generales y
efectivas.
• Descubrimiento de nuevos factores y teorías a través de la observación y la
experimentación.
3
4. Resolver estos problemas ha sido, y es, una meta a largo plazo en el campo de la IA. Los
investigadores han estado trabajando para implantar esas capacidades en las
computadoras. El estudio y el modelado informático de los procesos de aprendizaje en
sus múltiples manifestaciones constituyen el objeto de investigación del aprendizaje
automático.
Objetivos del Aprendizaje Automático
En la actualidad, la investigación en aprendizaje automático gira sobre tres ejes:
• Estudios orientados a las tareas: A partir de una tarea predeterminada analizar
los sistemas de aprendizaje aplicados para mejorar el comportamiento en el
desarrollo de esa tarea. También conocido como el “enfoque de ingeniería”.
• Simulación cognoscitiva: La investigación y simulación informática proceso de
aprendizaje humano.
• Análisis teórico: La exploración teórica del espacio de los posibles métodos de
aprendizaje y los algoritmos con independencia del dominio de las aplicaciones.
Progresar hacia un objetivo frecuentemente conduce a progresar hacia otro. Por ejemplo,
para investigar el domino de los posibles métodos de aprendizaje, un punto de comienzo
razonable puede ser considerar un ejemplo conocido del comportamiento aprendido,
especialmente humano (y tal vez de otros sistemas biológicos). Paralelamente, las
investigaciones psicológicas del aprendizaje humano, se acompañan un análisis teórico
que sugiera los posibles modelos de aprendizaje aplicados. La necesidad de adquirir una
forma particular de conocimiento en algunos estudios orientados a las tareas puede
producir por sí mismos nuevos análisis teóricos o proponer la pregunta: “¿Cómo
adquieren los humanos esta habilidad específica (o conocimiento)?
En la actualidad, instruir a un sistema informático o a un robot controlado por un sistema
informático para realizar una tarea, requiere definir un algoritmo para esa tarea y luego
programarlo detalladamente. Los sistemas informáticos actuales no pueden aprender a
realizar una tarea a través de los ejemplos reales o por analogía a una tarea similar
previamente resuelta. Tampoco pueden mejorar significativamente su comportamiento a
partir de los errores del pasado, ni adquirir nuevas habilidades observando e imitando a
los expertos.
Al tratar de definir el proceso de adquisición de conocimiento orientado a tareas, se debe
ser consciente que los sistemas informáticos resultantes deben interactuar con humanos, y
por consiguiente, deben semejar estrechamente habilidades humanas. El argumento
tradicional del "enfoque de ingeniería", que sostiene que no se necesita reflejar al
humano, no es realmente aplicable al aprendizaje automático. Los sistemas informáticos
que aprenden deben interactuar con las personas que hacen uso de ellos, y por
4
5. consiguiente los conceptos y habilidades que ellos adquieren (no necesariamente sus
mecanismos internos) deben ser entendibles para los humanos.
El aprendizaje automático como una Ciencia.
El tema de cuáles son las habilidades genéticamente provistas en un sistema biológico,
contra habilidades o conocimiento adquiridos por interacción con el medio ambiente, ha
fascinado igualmente a biólogos, psicólogos, filósofos y a los investigadores de la
inteligencia artificial. Candidato claro para un conocimiento invariante en humanos es el
mecanismo de aprendizaje, definido como la habilidad innata de adquirir hechos,
habilidades y conceptos más abstractos. Por consiguiente, comprender el aprendizaje
humano para reproducir aspectos en un sistema informático, es en sí mismo, una meta
científica válida. Es más, los modelos informáticos pueden aportar ayuda a la psicología
cognoscitiva, dado que pueden usarse para probar la consistencia e integridad de teorías
de aprendizaje.
El estudio de procesos de aprendizaje humanos también es de importancia práctica
considerable. Mediante la construcción de modelos del aprendizaje humano es probable
llegar a construir técnicas educativas más eficaces. No es sorprendente que la
investigación en instrucción inteligente asistida por computadora, que intenta desarrollar
sistemas de enseñanza basados en computadoras, comparta muchas de las metas y
perspectivas con la investigación del aprendizaje automático. Un desarrollo interesante es
que los sistemas de enseñanza por computadora están empezando a incorporar
habilidades para inferir modelos de competencia del estudiante a partir del desempeño
observado. Inferir el alcance del conocimiento de un estudiante y las habilidades
requeridas para que desarrolle una tarea particular, permite que el proceso de enseñanza
sea más eficaz e individualizado.
Un objetivo científico igualmente básico del aprendizaje automático es la exploración de
mecanismos de aprendizaje alternativos, incluyendo el descubrimiento de algoritmos de
inducción diferentes, la información que debe estar disponible al aprendiz y el problema
de disponer de datos de entrenamiento imperfectos. No hay ninguna razón para creer que
los métodos de aprendizaje humanos son los únicos medios posibles de adquirir
conocimiento y habilidades. De hecho, el sentido común sugiere que el aprendizaje
humano representa simplemente un punto en un espacio desconocido de posibles
métodos de aprendizaje, un punto que a través del proceso evolutivo se satisface
particularmente bien para cubrir con el ambiente físico general en el que existimos. La
mayoría de los trabajos teóricos en aprendizaje automático han sido centrados en la
creación, caracterización y análisis de métodos de aprendizaje generales, con énfasis en
analizar generalidad y actuación.
Construyendo y probando sistemas de aplicación con aprendizaje automático, uno puede
establecer valores estadísticos que permiten establecer el costo de la efectividad con
respecto a los resultados y las limitaciones de cada enfoque.
5
6. Adquisición de Conocimiento versus Refinamiento de
Habilidades
Hay dos formas básicas de aprender: adquisición de conocimiento y refinamiento de
habilidades.
Cuando decimos que alguien aprendió física, queremos decir que esa persona adquirió
conceptos significantes de física, comprendió su significado, y también la relación entre
el mundo de la física y cualquier otro mundo. La esencia de aprender en este caso, es la
adquisición de nuevo conocimiento, incluyendo descripciones y modelos de sistemas de
física y sus comportamientos, incorporando una variedad de representaciones, desde
modelos intuitivos, ejemplos e imágenes, hasta ecuaciones matemáticas totalmente
testeadas y leyes físicas. Se dice que una persona ha aprendido más si su conocimiento
abarca una gran cantidad de situaciones, es más seguro, y es capaz de predecir el
comportamiento del mundo físico en una forma más eficiente. Esta forma de aprendizaje
es típica en una gran variedad de situaciones y se encuentra generalmente en términos de
adquisición de conocimiento. Aquí, la adquisición de conocimiento está definida como el
aprendizaje de nueva información simbólica, conjuntamente con la habilidad de aplicar
esa información de manera efectiva.
Un segundo tipo de aprendizaje es la mejora gradual de las habilidades motoras y
cognoscitivas a través de la práctica, como aprender a montar una bicicleta o tocar el
piano. Adquirir el conocimiento del libro de texto sobre cómo realizar estas actividades
representa sólo la fase inicial en el desarrollo de las habilidades requeridas. La clave del
proceso de aprendizaje consiste en el refinamiento de las habilidades aprendidas, tanto
coordinación mental como motora, por práctica repetida y en la corrección de
desviaciones de la conducta deseada. Esta forma de aprendizaje, a menudo llamada
refinamiento de habilidad, difiere de muchas maneras de la adquisición de conocimiento.
Un Sistema de Investigación del Aprendizaje Automático
Se pueden clasificar los sistemas de aprendizaje automático sobre distintas dimensiones.
Se eligieron tres dimensiones particularmente significativas:
• Clasificación sobre las bases de las estrategias de aprendizaje fundamentales
utilizadas. Los procesos están ordenados por sí mismos por el monto de inferencia
que realiza el sistema de aprendizaje sobre la información disponible.
• Clasificación de acuerdo al tipo de conocimiento adquirido.
• Clasificación en términos del dominio de la aplicación de la performance del
sistema para el cual el conocimiento es adquirido.
6
7. Cada punto en el espacio, definido por las dimensiones anteriores, corresponde a una
estrategia de aprendizaje particular empleando una representación de conocimiento
particular, aplicada a un dominio particular.
Como los sistemas de aprendizaje existentes emplean representaciones múltiples y
procesos, y muchos se han aplicado a más de un dominio, dichos sistemas de aprendizaje
son caracterizados a través de varios puntos en el espacio.
Las subsecciones siguientes describen valores explorados a lo largo de cada uno de estas
dimensiones. Futuras investigaciones pueden revelar nuevos valores y dimensiones. Los
sistemas de aprendizaje existentes corresponden a sólo una porción pequeña del espacio
porque ellos representan sólo un número pequeño de posibles combinaciones de los
valores.
Clasificaciones Basadas en Estrategias de Aprendizaje
Fundamentales
Como distinguimos a las estrategias de aprendizaje por el monto de inferencia de las
acciones de aprender sobre la información provista, primero consideramos los dos
extremos: no realizar inferencia, y realizar un monto substancial de inferencia. Si el
sistema de computadora está programado directamente, su conocimiento se incrementa,
pero no realiza ninguna inferencia en absoluto: todo el esfuerzo cognoscitivo corre por
parte del programador. Recíprocamente, si un sistema independiente descubre nuevas
teorías o inventa nuevos conceptos, debe realizar una cantidad considerable de inferencia:
esto deriva del conocimiento organizado de experimentos y observaciones. Un punto
intermedio en el espectro debería ser, por ejemplo, un estudiante determinando cómo
resolver un problema matemático por analogía con los ejercicios de un libro de texto (un
proceso que requiere inferencia, pero mucho menos que descubrir una nueva rama de
matemática sin la guía de un maestro o un libro de texto).
A medida que la cantidad de inferencia que el aprendiz es capaz de realizar aumenta, la
carga puesta en el maestro o en el ambiente externo disminuye. Es mucho más difícil
enseñar a una persona explicando cada paso en una tarea compleja que mostrarle a la
persona la manera en que normalmente se manejan tareas similares. Una persona es
instruida para realizar la tarea: cuando programando requiere especificación explícita de
todo el detalle requerido, considerando que una persona que recibe instrucción puede usar
su conocimiento anterior y sentido común para rellenar la mayoría de los detalles
mundanos. El sistema captura esta noción de balanceo entre la cantidad de esfuerzo
requerida del aprendiz y del maestro.
a. Aprendizaje repetitivo e implante directo de nuevo conocimiento: Ninguna
inferencia u otra transformación del conocimiento es requerida por parte del
aprendiz. Un ejemplo de este método de adquisición de conocimiento es el
aprendizaje por memorización de factores y datos dados sin ninguna inferencia
7
8. proporcionada en la información entrante. El término aprendizaje repetitivo es
usado principalmente en este contexto.
b. Aprendiendo por instrucción (o aprendiendo siendo avisado): consiste en
adquirir conocimiento de un maestro o de otra fuente organizada, como un libro
de texto, requiriendo que el aprendiz transforme el conocimiento en un lenguaje
de entrada a una representación interna y usable, y que la nueva información sea
integrada con el conocimiento previo para un uso efectivo. De aquí, se requiere
que el aprendiz realice algunas inferencias, pero una gran fracción del peso
permanece con el maestro, quien debe presentar y organizar conocimiento en una
forma que disputa incrementalmente el conocimiento existente del alumno.
c. Aprendiendo por analogía: consiste en adquirir nuevos factores o habilidades
mediante la transformación y aumento del conocimiento existente que tiene una
fuerte similitud con el nuevo concepto o habilidad deseada en una forma
efectivamente útil en la nueva situación. Por ejemplo, una persona que nunca ha
manejado un camión pequeño, pero que maneja autos, puede transformar su
habilidad existente (quizás en forma imperfecta) a la nueva tarea. En forma
similar, un sistema de aprendizaje por analogía debería aplicarse a la función para
la cual no fue originalmente diseñado. Aprender por analogía requiere más
inferencia por parte del aprendiz que el aprendizaje repetitivo o el aprendizaje por
instrucción. Un hecho o habilidad análogo en parámetros relevantes debe ser
recuperado por la memoria; luego el conocimiento recuperado debe ser
transformado, aplicado a la nueva situación, y almacenado para un futuro uso.
d. Aprendiendo de ejemplos o aprendizaje supervisado (un caso especial del
aprendizaje inductivo): Dado un conjunto de ejemplos y contraejemplos de un
concepto, el aprendiz induce una descripción del concepto general que describe
todos los ejemplos positivos posibles y ningún contraejemplo. Aprender de
ejemplos es un método que ha sido fuertemente investigado en la inteligencia
artificial. El monto de inferencia realizado por el aprendiz es más grande que el
aprendido por instrucción, porque ningún concepto general es provisto por un
maestro, y es de alguna forma más grande que el aprendizaje por analogía, porque
ningún concepto similar es provisto como “semillas” sobre las cuales el nuevo
concepto deberá crecer. El aprendizaje por ejemplos puede ser subcategorizado de
acuerdo con la fuente de ejemplos:
La fuente es un maestro que conoce el concepto y genera secuencias de
ejemplos que tienen significado para ser lo más útiles posible; Si el
maestro también conoce (o, más típicamente, infiere) el estado del
conocimiento del aprendiz, los ejemplos pueden ser seleccionados para
optimizar la convergencia en el concepto deseado.
La fuente es el aprendiz en sí mismo; El aprendiz típicamente conoce su
propio estado de conocimiento, pero claramente no conoce el concepto a ser
adquirido. Por consiguiente, el aprendiz puede generar instancias, y tener
una entidad externa, como el ambiente o el maestro que los clasifica como
ejemplos positivos o negativos y lo ayuda a discriminar entre conceptos. Por
ejemplo, un aprendiz que está tratando de adquirir el concepto de sustancia
8
9. ferromagnética, puede generar como posible candidato a todos los metales.
Al probar cobre y otros metales con un imán, el aprendiz descubrirá
entonces que ese cobre es un contraejemplo, y por consiguiente el concepto
de sustancia ferromagnética no debe generalizarse para incluir todos los
metales.
La fuente es el ambiente externo; En este caso el proceso de generación de
ejemplos es operacionalmente aleatorio, de igual forma el aprendiz debe
contar con las observaciones relativamente no controladas. Por ejemplo, un
astrónomo que intenta inferir precursores a las supernovas debe contar
principalmente con las presentaciones de datos no estructuradas. Aunque el
astrónomo sabe el concepto de una supernova, él no puede saber dónde y
cuándo una supernova ocurrirá, ni puede él causar que ocurra uno.
Uno puede también clasificar el aprendizaje a partir de ejemplos por el tipo de
ejemplos que tiene disponibles el aprendiz:
Sólo ejemplos positivos disponibles: Considerando que los ejemplos
positivos proporcionan los casos del concepto a ser adquirido, ellos no
mantienen información para prevenir sobregeneralización del concepto
inferido. En este tipo de situación de aprendizaje, la sobregeneralización
podría ser evitada considerando las mínimas generalizaciones necesarias, o
contando a priori con el conocimiento para reprimir el concepto a ser
inferido.
Ejemplos positivos y negativos disponibles: En este tipo de situación, los
ejemplos positivos fuerzan la generalización considerando la prevención de
ejemplos negativos (el concepto inducido nunca debería ser tan general
como para incluir cualquier ejemplo negativo). Esta es la forma más típica
de aprender a partir de ejemplos.
Aprender de ejemplos debe ser a una prueba o incremental. En el primer caso,
todos los ejemplos son presentados de una vez. En el último caso, el sistema debe
formular una o más hipótesis del concepto (o el rango de conceptos) consistente
con los datos disponibles, y subsecuentemente refinar las hipótesis después de
considerar ejemplos adicionales. El acercamiento incremental tiene mas
semejanza con el aprendizaje humano, le permite al aprendiz usar conceptos
parcialmente aprendidos (para la actuación, o para guiar el proceso de generación
de ejemplos), y le permite a un maestro enfocarse en los aspectos básicos de un
nuevo concepto antes de intentar impartir detalles menos centrales. Por otro lado,
el acercamiento de a un paso es menos propicio a conducir por caminos por una
opción imprudente de ejemplos iniciales al formular el núcleo del nuevo
concepto.
e. Aprendiendo de observaciones y descubrimientos, (aprendizaje no
supervisado): es un método general de aprendizaje por inducción que incluye
sistemas de descubrimientos, tareas de formación de teorías, la creación de
9
10. criterios de clasificación para jerarquías de métodos sistemáticos, y tareas
similares sin los beneficios de un maestro externo.
Este método de aprendizaje no supervisado requiere que el aprendiz realice más
inferencia que cualquier acercamiento a ser discutido. Al aprendiz no se lo provee
con un conjunto de instancias de un concepto en particular, tampoco se le da un
acceso a un oráculo que pueda clasificar instancias internamente generadas como
instancias positivas o negativas de cualquier concepto dado. Además, a pesar de
poner el foco en un concepto simple en un momento dado, las observaciones
pueden juntar varios conceptos que necesitan ser adquiridos, introduciendo de esa
forma un problema severo y foco de atención. Se puede clasificar el aprendizaje
por observación de acuerdo con el grado de interacción con el ambiente externo.
Los puntos extremos en esta dimensión son:
Observación pasiva; en donde el aprendiz clasifica y sistematiza las
observaciones de múltiples aspectos del ambiente.
Experimentación activa; en donde el aprendiz perturba el ambiente para
observar los resultados de sus perturbaciones. Las experimentaciones deben
ser aleatorias, con foco dinámicamente de acuerdo a un criterio general de
interés, o fuertemente guiada por conceptos teóricos. A medida que un
sistema adquiere conocimiento, y supone teorías, el mismo debe ser
conducido para confirmar o no sus teorías, y así explorar su ambiente
aplicando diferentes observaciones y estrategias de experimentación a
medida que son necesitadas. A veces este método de aprendizaje involucra
la generación de ejemplos para testear conceptos que fueron tomados como
hipótesis o parcialmente adquiridos.
La clasificación anterior de las estrategias de aprendizaje ayuda a comparar varios
sistemas de aprendizaje en términos de sus mecanismos más importantes, en términos de
fuentes de información externas disponibles, y en términos del grado en el que confían en
el conocimiento pre-organizado.
Clasificación de Acuerdo al Tipo de Conocimiento
Adquirido
Un sistema de aprendizaje debe adquirir reglas de comportamiento, descripciones de
objetos físicos, heurísticas de resolución de problemas, sistemas de clasificación sobre un
espacio de ejemplo, y muchos otros tipos de conocimiento útiles en la performance de
una gran variedad de tareas. La siguiente lista une tipos de conocimiento adquiridos,
principalmente como una función de representación de conocimiento.
a) Parámetros en expresiones algebraicas; Aprender en este contexto consiste en
ajustar parámetros numéricos o coeficientes en expresiones algebraicas de un
método funcional para obtener la performance esperada.
b) Árboles de decisión; Algunos sistemas toman árboles de decisión para
discriminar entre clases de objetos. Los nodos en un árbol de decisión
10
11. corresponden a atributos de objetos seleccionados, y los extremos corresponden a
los valores predeterminados de las alternativas para esos atributos. Las hojas del
árbol corresponden a conjuntos de objetos con la misma clasificación.
c) Gramáticas formales; Aprendiendo a reconocer un lenguaje particular
(generalmente artificial) la gramática formal está inducida por secuencias de
expresiones en el lenguaje. Estas gramáticas son típicamente representadas como
expresiones regulares, estados finitos automatizados, reglas gramáticas libres de
contexto, o reglas de transformación.
d) Reglas de producción; Una regla de producción es un parcondición/acción {C
=> A}, donde C es un conjunto de condiciones y A es una secuencia de acciones.
Si todas las condiciones en una regla de producción son satisfechas, entonces la
secuencia de acciones es ejecutada. Debido a su simplicidad y la fácil
interpretación y producción, las reglas forman un conocimiento masivamente
utilizado en los sistemas de aprendizaje. Las cuatro operaciones básicas en donde
las reglas de producción deben ser adquiridas y refinadas son:
Creación: una nueva regla es construida por el sistema o adquirida por una
entidad externa.
Generalización: las condiciones se hacen menos restrictivas, para que la
regla se aplique en un gran número de situaciones.
Especialización: condiciones adicionales son agregadas al conjunto de
condiciones, o las condiciones existentes se hacen más restrictivas, para
que la regla se aplique a un menor número de situaciones específicas.
Composición: dos o más reglas, que fueron aplicadas en secuencia son
compuestas en una sola regla más grande, formando así un proceso
compilado y eliminando cualquier condición o acción redundante.
e) Expresiones formales lógicas y métodos relacionados: Estas representaciones
de propósito general han sido utilizadas para formular descripciones de objetos
individuales (entrada a un sistema de aprendizaje) y para formular descripciones
de concepto resultante (salida de un sistema de aprendizaje). Ellas toman la forma
de expresiones lógicas formales cuyos componentes son proposiciones,
predicados arbitrarios, variables de valor finitas, declaraciones que restringen
rangos de variables (como "un número entre 1 y 9"), o las expresiones lógicas
embebidas.
f) Gráficos y redes: En muchos gráficos de dominios y redes provee una
representación más conveniente y eficiente que las expresiones lógicas, a pesar de
que el poder de la representación de las redes es comparable con las expresiones
lógicas formales. Algunas técnicas de aprendizaje explotan el macheo gráfico y
los esquemas gráficos de transformación para comparar e indexar el conocimiento
eficientemente.
g) Marcos y esquemas: Estos proveen unidades de representación más largas que
las expresiones lógicas o las simples reglas de producción. Los marcos y
esquemas pueden ser vistos como colecciones de entidades etiquetadas (“pistas”),
cada pista juega un rol re-escrito en la representación. Ellos han demostrado
exitosamente en muchas aplicaciones de inteligencia artificial. Por ejemplo, un
sistema que adquiere planes de generalización debe ser capaz de representar y
11
12. manipular a cada plan como unidad, a pesar de que su estructura interna deba ser
arbitrariamente compleja. Además, en el aprendizaje experimental, los éxitos
pasados, las alternativas no testeadas, causan fallas, y otra información debe ser
grabada y comparada en la inducción y refinamiento de varias reglas de
comportamiento (o los planes enteros). Las representaciones del esquema
proporcionan un formalismo apropiado.
h) Programas de computadoras y otros códigos procedurales: El objetivo de los
muchos sistemas de aprendizaje es adquirir una habilidad para llevar adelante un
proceso específico en forma eficiente, más que razonar sobre la estructura interna
del proceso. La mayoría de los sistemas de programación automáticos caen en
esta categoría general. Además de los programas de computadora, la codificación
procedural incluye las habilidades motoras humanas (tales como conocer como
montar una bicicleta), secuencias de instrucción para la manipulación de robots, y
otras habilidades humanas o de máquina. Al contrario de las descripciones
lógicas, los marcos y redes, la estructura interna detallada del código procedural
resultante necesita ser comprensible para los humanos, o para los sistemas de
razonamiento automático. Solo el comportamiento externo de las habilidades
procedurales adquiridas quedan directamente disponibles para el sistema de
razonamiento.
i) Sistemas: Aprender por observación puede terminar en la estructuración global
de los objetos del dominio dentro de una jerarquía o sistema. Agrupar las
descripciones del objeto en categorías recientemente propuestas, y formar
clasificaciones jerárquicas, requiere que el sistema formule un criterio pertinente
para la clasificación.
j) Representaciones múltiples: Algunos sistemas de adquisición de conocimiento
usan varios esquemas de representación para el nuevo conocimiento adquirido. La
mayoría de los sistemas más notables y algunos de formación de teorías y
descubrimiento que adquieren conceptos, operaciones con esos conceptos, y
reglas de heurística para un nuevo dominio deben seleccionar apropiadas
combinaciones de esquemas de representación aplicables a los diferentes métodos
de conocimiento adquirido.
Clasificación por el Dominio de Aplicación
Una dimensión útil para clasificar los sistemas de aprendizaje es su área de aplicación. La
siguiente lista especifica las áreas de aplicación para las cuales han sido aplicados varios
sistemas de aplicación existentes. Las áreas de aplicación aparecen en orden alfabético,
sin reflejar significado del resultado del sistema automático: Agricultura,
Caracterizaciones de objetos físicos, Diagnósticos médicos, Educación, Física, Juegos
(ajedrez, damas, póker), Matemática, Métodos generales, Modelado cognoscitivo
(simulando procesos de aprendizaje humano), Música, Planeamiento y solución de
problemas, Predicción de secuencias, Proceso natural de lenguaje, Programación de
computadoras, Química, Reconocimiento de imágenes, Reconocimiento de voz,
Robótica, Sistemas expertos (alta performance, programas de dominio específicos de IA)
12
13. Un Vistazo Histórico del Aprendizaje Automático
Dentro de la relativamente corta historia del aprendizaje automático esta disciplina, se
pueden distinguir tres principales períodos, cada uno centrado sobre un paradigma
diferente:
• Modelado neuronal y técnicas de decisión teóricas
• Aprendizaje simbólico orientado a conceptos
• Sistemas de aprendizaje de conocimiento intensivo que exploran varias
tareas de aprendizaje
El rasgo que distinguía al primer paradigma era el interés en construir un sistema de
aprendizaje de propósito general que comience con una estructura inicial o tarea pequeña
o ninguna orientada al conocimiento. El empuje mayor de la investigación basada en este
acercamiento involucró la construcción de una variedad de modelos neuronales, las
máquinas basadas en una estructura inicial al azar o parcialmente el azar. Estos sistemas
generalmente estaban referidos a redes neuronales o sistemas autoorganizados. Aprender
en esos sistemas consiste en cambios incrementales que posibilitan a la neurona (unidad
de umbral lógica) transmitir una señal.
Debido a la naturaleza de la tecnología de las computadoras en la actualidad, la mayoría
de las investigaciones bajo este paradigma fueron tanto teóricas como involucradas en la
construcción de sistemas de hardware de propósito experimental. El fundamento para este
paradigma fue dado en el cuarenta por Rashevsky y sus seguidores que trabajaban en el
área de biofísica matemática, y por McCulloch y Pitts que descubrieron la aplicación de
la lógica simbólica de modelar actividades del sistema nervioso. La investigación
relacionada involucró la simulación de procesos evolutivos que a través de la mutación
del azar y la selección natural podrían crear un sistema capaz de realizar tal conducta
inteligente.
La experiencia en las áreas anteriores produjo la nueva disciplina del reconocimiento de
patrones y condujo al desarrollo de un acercamiento de decisión teórica al aprendizaje
automático. En este acercamiento, el aprendizaje es asociado con la adquisición de
métodos lineales y polinómicos de funciones discriminantes de un conjunto de ejemplos
de práctica dados.
Uno de los más conocidos y exitosos sistemas de aprendizaje que utiliza dichas técnicas
(tanto como algunas ideas originales que involucran transformaciones no lineales) fue el
programa de damas de Samuel. Dicho programa era capaz de adquirir a través del
aprendizaje un nivel maestro de performance. De alguna forma diferente, pero
cercanamente relacionadas, las técnicas utilizaron métodos de decisión estadística para
aprender las reglas de reconocimiento de patrones.
13
14. Un segundo paradigma mayor empezó a surgir en los sesenta proveniente del trabajo de
psicólogos e investigadores de IA sobre los modelos de aprendizaje humano. El
paradigma utilizó la lógica o representaciones de estructura de gráfico en lugar de los
métodos numéricos o estadísticos. Los sistemas aprendieron descripciones simbólicas que
representan un conocimiento nivelado más alto y las asunciones estructurales fuertes
hechas sobre los conceptos a ser adquiridos.
Algunos investigadores construyeron sistemas orientados a las tareas que deberían
adquirir conocimiento en el contexto de un problema práctico. Por ejemplo, el programa
META-DENDRAL genera reglas que explican los datos para el uso de dicho sistema.
Un desarrollo fundamental en este paradigma fue el sistema de Winston sobre
aprendizaje automático. En paralelo con dicho desarrollo, aparecieron diferentes
acercamientos al aprendizaje de los conceptos estructurales de los ejemplos, incluyendo
una familia de programas de aprendizaje basados en la inducción lógica (AQUAL), y el
trabajo relacionado por Hayes-Roth, Hayes-Roth & McDermott, Vere, Mitchell y
Michie.
El tercer paradigma representa el período más reciente de investigación comenzado a
mitad de los setenta. Los investigadores han volcado su interés hacia los conceptos del
aprendizaje aislado de los ejemplos, y han comenzado a investigar un gran espectro de
métodos de aprendizaje, la mayoría de ellos basados en los sistemas de rico
conocimiento. Específicamente este paradigma puede caracterizarse por varias tendencias
nuevas, incluyendo:
Acercamientos al conocimiento intensivo: Los investigadores están enfatizando
el uso del conocimiento orientado a las tareas y las contenciones proveen una guía
para el proceso de aprendizaje. Una lección de las fallas de la temprana tabla rasa
y el pobre conocimiento de los sistemas de aprendizaje es que para adquirir nuevo
conocimiento un sistema debe también poseer un gran manejo del conocimiento
inicial.
Exploración del aprendizaje de los métodos alternativos: Adicionalmente al
primer énfasis puesto en la investigación sobre el aprendizaje sobre ejemplos, los
investigadores están ahora investigando una gran variedad de métodos de
aprendizaje tales como el aprendizaje por instrucción y el descubrimiento de los
conceptos y clasificaciones.
Habilidades incorporadas para generar y seleccionar tareas aprendidas: En
contraste a los esfuerzos previos, algunos sistemas incorporan heurísticas para
controlar su foco de atención para generar las tareas de aprendizaje, proponiendo
experimentos para elegir los datos de prueba, y los conceptos a adquirir.
14
15. Algunos Ejemplos de Aprendizaje Automático
Reconocimiento de VOZ: un campo con mucho auge en los últimos años, utilizado en
dispositivos como agendas electrónicas, teléfonos celulares, conmutadores, etc. Los
usuarios de estos dispositivos pueden localizar los datos guardados de contactos solo con
mencionar sus nombres y el sistema es capaz de identificar la voz de diferentes usuarios.
También es utilizado para generar texto en base a VOZ, este ultimo con usos para
personas que tienen discapacidades de movimiento, sin embargo esta tecnología es aún
muy costosa.
Robótica: Este es el campo que ha tenido mayor uso (y también el mas investigado) En
la actualidad se están creando vehículos robóticas que son capaces de identificar los
caminos y llegar a su destino sin la interferencia del ser humano, en otros casos
compañías como Nissan están agregando a sus vehículos tecnología que es capas de
identificar cuando el conductor esta ebrio o se queda dormido previniendo de esta manera
accidentes.
Dentro de la robótica las fuerzas armadas Norteamericanas han venido creando aeronaves
robotizadas que no requieren de un piloto, en un principio estas se crearon para ser
controladas por un piloto a distancia (control remoto) pero actualmente por medio de la
tecnología de Aprendizaje Automático se están desarrollando prototipos de aeronaves
que en un futuro no requerirán de un piloto a distancia. Estas naves serán capaces de
viajar a su destino, cumplir con una misión y después regresar a su base.
Reconocimiento de Objetos e Imágenes: El reconocimiento facial es uno de los campos
de mayor actividad del Aprendizaje Automático, este es utilizado en sistemas de
seguridad de corporaciones así como en los modernos sistemas que utilizan las agencias
policíacas y de investigación en países desarrollados.
Con estos sistemas agencias como el FBI pueden identificar el rostro de un delincuente
dentro de una base de datos de imágenes, o bien, su huella digital.
Sistemas de búsqueda de respuestas: Los sistemas de búsqueda de respuestas (BR) son
actualmente muy utilizados. Actualmente se guarda una gran cantidad de información en
formato electrónico en la WEB, en esta, la información digital tiene la ventaja de poder
ser reproducida de manera sencilla y rápida, y además está disponible para cualquier
persona que la requiera. Lo anterior permite a cualquier tipo de usuario, ya sea
especializado o casual, consultar dicha información para satisfacer sus necesidades. Sin
embargo, aunado a la gran ventaja que representa el acceso libre a la información, surge
un problema que afecta a todo aquel que la consulta: la revisión y elección de
información relevante.
Día a día la cantidad de información crece de manera exponencial por lo que su consulta
resulta una tarea costosa, tanto en tiempo como en esfuerzo. Lo anterior convierte la
consulta en un problema que tiene que ser resuelto para aprovechar de manera adecuada
todo el potencial del conocimiento contenido en los millones de documentos disponibles
ya sea en colecciones de documentos privadas o en la Web. Los diferentes sitios WEB
que se dedican a la búsqueda de respuestas han desarrollado algoritmos basados en
15
16. Aprendizaje Automático que facilitan la búsqueda de la información, los cuales, ofrecen
al usuario una respuesta concreta y precisa acerca de una pregunta
Caso Práctico de uso de Aprendizaje Automático
Actualmente el Departamento de Seguridad Interna de USA (Homeland Security) está
haciendo uso muy fuerte del reconocimiento de imágenes y huellas digitales por medio
de Aprendizaje Automático.
A cargo de dicho departamento están todas las aduanas y puertos de entrada a USA, las
agencias que dependen de dicho Departamento hacen uso de tecnología muy avanzada
de reconocimiento de imágenes y huellas digitales, estas, son capturadas al momento que
un extranjero solicita una visa para USA o bien cuando este viaja por su territorio, las
huellas son comparadas con una base de datos y en ella se pueden detectar delincuentes o
personas que tienen prohibida la entrada a USA por diversas razones.
Dicha tecnología ha sido implementada ya en todas las aduanas y puertos de entrada de
USA así como en todas sus embajadas y consulados en el mundo.
16
17. Conclusiones
El Aprendizaje Automático o Marhine Learning en Inteligencia Artificial realiza estudios
para saber como realizar programas que puedan aprender por si solos conforme vayan
adquiriendo experiencia como el ser humano.
Se pretende que las máquinas realicen actividades comunes para el hombre de manera
rápida, eficaz, y que éstas se incrementen que no sólo sea un proceso si no varios.
Auque esto no se ha logrado de manera total puesto que hay que librar varios obstáculos
como lo son que las tareas se vayan mejorando conforme las realice, que no necesiten de
supervisión, que utilice su experiencia para mejorar.
17
18. Bibliografía.
Nils J. Nilsson, “INTRODUCTION TO MACHINE LEARNING”, Robotics
Laboratory Department of Computer Science, 1996.
Wnek J. et al, “Comparing Learning Paradigms via Diagrammatic Visualization”,
In Proc. Fifth Intl. Symp. on Methodologies for Intelligent Systems.
1990.
Machine Learning, Wikipedia ; 2007,
http://es.wikipedia.org/wiki/Aprendizaje_Autom%C3%A1tico
http://en.wikipedia.org/wiki/Machine_learning
18