Aprendizaje Automatizado: Supervisado vs No Supervisado
1. Aprendizaje Automatizado
El aprendizaje automático o aprendizaje automatizado o aprendizaje de máquinas (del inglés,
"Machine Learning") es el subcampo de las ciencias de la computación y una rama de
la inteligencia artificial, cuyo objetivo es desarrollar técnicas que permitan que las
computadoras aprendan.
De forma más concreta, se trata de crear programas capaces de generalizar comportamientos a
partir de una información suministrada en forma de ejemplos.
El machine learning es un método de análisis de datos que automatiza la construcción de
modelos analíticos. Es una rama de la inteligencia artificial basada en la idea de que los sistemas
pueden aprender de datos, identificar patrones y tomar decisiones con mínima intervención
humana.
El aprendizaje automático tiene una amplia gama de aplicaciones, incluyendo motores de
búsqueda, diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis
del mercado de valores, clasificación de secuencias de ADN, reconocimiento del habla y
del lenguaje escrito, juegos y robótica.
¿Por qué es importante el machine learning?
El resurgimiento del interés en el aprendizaje basado en máquina se debe a los mismos factores
que han hecho la minería de datos y el análisis Bayesiano más populares que nunca. Cosas como
los volúmenes y variedades crecientes de datos disponibles, procesamiento computacional más
económico y poderoso, y almacenaje de datos asequible.
Todas estas cosas significan que es posible producir modelos de manera rápida y automática que
puedan analizar datos más grandes y complejos y producir resultados más rápidos y precisos –
incluso en una escala muy grande. Y con la construcción de modelos precisos, una organización
tiene una mejor oportunidad de identificar oportunidades rentables – o de evitar riesgos
desconocidos.
Aprendizaje Supervisado
En los algoritmos de aprendizaje supervisado se genera un modelo predictivo, basado en datos de
entrada y salida. La palabra clave “supervisado” viene de la idea de tener un conjunto de datos
previamente etiquetado y clasificado, es decir, tener un conjunto de muestra el cual ya se sabe a
qué grupo, valor o categoría pertenecen los ejemplos. Con este grupo de datos, el cual llamamos
datos de entrenamiento, se realiza el ajuste al modelo inicial planteado. De esta forma es como el
2. algoritmo va “aprendiendo” a clasificar las muestras de entrada comparando el resultado del
modelo, y la etiqueta real de la muestra, realizando las compensaciones respectivas al modelo de
acuerdo a cada error en la estimación del resultado.
Aprendizaje no supervisado
Los algoritmos de aprendizaje no supervisado trabajan de forma muy similar a los supervisados,
con la diferencia de que éstos solo ajustan su modelo predictivo tomando en cuenta los datos de
entrada, sin importar los de salida. Es decir, a diferencia del supervisado, los datos de entrada no
están clasificados ni etiquetados, y no son necesarias estas características para entrenar el
modelo.
Dentro de este tipo de algoritmos, el agrupamiento o clustering en inglés, es el más utilizado, ya
que particiona los datos en grupos que posean características similares entre sí. Una aplicación de
estos métodos es la compresión de imágenes.
SITUACIONES APRENDIZAJE SUPERVISADO
Servicios financieros
Los bancos y otras empresas de la industria financiera utilizan la tecnología del aprendizaje
basado en máquina para dos fines principales: identificar insights importantes en los datos y
prevenir el fraude. Los insights pueden identificar oportunidades de inversión o bien ayudar a los
inversionistas a saber cuándo vender o comprar.
Atención a la salud
Elmachine learning es una tendencia en rápido crecimiento en laindustria de atención a lasalud,
gracias a la aparición de dispositivos y sensores de vestir que pueden usar datos para evaluar la
salud de un paciente en tiempo real. Asimismo, la tecnología puede ayudar a expertos médicos
a analizar datos para identificar tendencias o banderas rojas que puedan llevar a diagnósticos y
tratamientos mejorado.
Reconocimiento de Imágenes
Se utilizan diversos algoritmos para poder comprender imágenes, algo en particular o agrupar
zonas. Sabemos que las imágenes son conjuntos de pixeles continuos y cada uno contiene
información del color que tiene que “iluminar” (por ejemplo RGB).
Los ejemplos comunes son los de OCR Reconocimiento de Caracteres ópticos, es decir, encontrar
letras, agruparlas, encontrar espacios y poder descifrar textos y el otro ejemplo es el de detectar
personas en imágenes, presencia humana en cámaras de seguridad o más recientemente se
utilizan redes neuronales convolucionales para detectar rostros: reconocimiento facial,
3. seguramente más de una vez Facebook fue capaz de localizar a tus primos y hermanos en tus
álbumes de fotos.
Predicción
Similar a la clasificación, pero para valores continuos, nos permite intentar predecir qué valor
obtendremos dado un conjunto de datos de entrada con resultado desconocido. Como
comentábamos antes, se puede utilizar para predecir precios de inmuebles, alquileres, coches o
la probabilidad de que ocurra algún evento utilizado con frecuencia en estadística con Regresión
Lineal.
SITUACIONES APRENDIZAJE NO SUPERVISADO
Segmentación de Audiencia
Se suele utilizar el aprendizaje no supervisado para crear y descubrir patrones no conocidos en
el comportamiento de los clientes de una web, app o comercio. Estos algoritmos pueden
descubrir grupos que desconocíamos por completo o agrupar ciertas características que se
correlacionan y que nosotros difícilmente lo hubiéramos identificado.
Facturaciones
Por ejemplo, uno de estos sistemas cargadocon datos de facturación de un supermercado podría
detectar que la mitad de los hombres de entre 35 y 42 años que compran cerveza también
compran pañales, y esta información sería útil para propósitos comerciales o de marketing.
Petróleo y gas
Cómo encontrar nuevas fuentes de energía. Análisis de minerales del suelo. Predicción de fallos
de sensores de refinerías. Optimización de la distribución de petróleo para hacerla más eficiente
y económica.