2. ¿Qué es “Machine Learning”?
Los mensajes que llegan a
nuestra bandeja de correo se
clasifican según su importancia.
¿Cómo sabe dónde va cada
mensaje?
El Machine Learning o Aprendizaje Automático es la ciencia que tiene como objetivo
desarrollar algoritmos capaces de aprender de datos, lo que puede resultar muy útil
en distintos casos, por ejemplo:
3. ¿En qué casos se utilizan estos algoritmos?
Machine learning trata numerosos problemas entre los cuáles distinguimos:
- Analizar imágenes y clasificarlas automáticamente.
- Detección de tumores u otras enfermedades en el ámbito
de la medicina.
- Clasificación de nuevos artículos o posts ofensivos en
redes sociales.
- Crear un asistente personal o poder resumir textos
automáticamente.
- Fraudes de tarjetas de crédito, recomendar un producto en
el que podría estar interesado un cliente, permitir que tu
app reaccione a comandos de voz…
4. Data Mining
Para ser capaces de resolver los problemas mencionados anteriormente, estos algoritmos
deben descubrir y conocer patrones estudiando una enorme cantidad de datos. Las técnicas
empleadas para transformar estos datos se conocen como Data Mining.
En resumen, gracias al Data
Mining podremos resolver
problemas sencillos que siguen
reglas distintas, problemas
complejos sin una solución
existente o podremos mantener
información de sistemas que
cambien constantemente.
5. Encontraremos sistemas que necesiten o no supervisión, que puedan aprender en
tiempo de ejecución o que trabajen únicamente comparando algunos puntos en lugar
de aprendiendo y descubriendo patrones.
Sistemas de Machine Learning I
● Aprendizaje supervisado: En este tipo de aprendizaje
tendremos el resultado deseado, como en la
clasificación o predicción del precio de un objeto.
Tenemos que tener en cuenta algunos de los
algoritmos de aprendizaje supervisado más
importante, como k-Nearest Neighbors, Linear
Regression, Logistic Regression, Support Vector
Machines, Decision Trees and Random Forests y
Neural networks.
6. Sistemas de Machine Learning II
● Aprendizaje no supervisado: El sistema intentará aprender sin conocer
el resultado. Tendremos algoritmos de Clustering como K-Means, de
Detección de Anomalías y Novedades como Isolation Forest, de
Visualización y Reducción de Dimensionalidad o de Aprendizaje de
Reglas de Asociación como Apriori.
● Aprendizaje semisupervisado: Este sistema aprenderá
conociendo el resultado únicamente en algunos casos.
Muchos de los algoritmos más famosos nacerán de la
mezcla entre algoritmos supervisados y no
supervisados.
7. Sistemas de Machine Learning III
● Aprendizaje reforzado: Estos
sistemas contarán con un agente
que observarán el entorno y
otorgarán premios o
penalizaciones al algoritmo según
su desempeño. Tendrá que
aprender por cuenta propia cuál
es la mejor estrategia, lo que se
conocerá como política.
8. Sistemas de Machine Learning IV
● Aprendizaje por lotes o aprendizaje offline : En estos algoritmos el sistema no
podrá aprender incrementalmente, sino que necesitará tener toda la información.
Estos algoritmos pueden ser una buena solución en algunos casos, pero se
puede convertir en un problema si necesitas actualizar los datos cada poco
tiempo.
● Aprendizaje online: En este tipo de sistema se añadirán datos secuencialmente
por lo que aprenderá incrementalmente y será una buena opción para sistemas
que necesiten adaptarse rápidamente (esta rapidez se llamará tasa de
aprendizaje).
Según si el sistema puede aprender gradualmente de un flujo de datos entrantes
o no:
9. Sistemas de Machine Learning V
Finalmente podremos distinguir según cómo generalizan:
● Aprendizaje basado en instancias: El sistema
conocerá ejemplos de memoria y generaliza
según el parecido con estos ejemplos.
● Aprendizaje basado en modelos: El
sistema creará un modelo con los
ejemplos que tenga y lo usará para
realizar predicciones.