3. 1. Pero, ¿qué son esos palabros?
Big Data: Almacenamiento y procesamiento de un conjunto de datos
demasiado grandes para ser almacenados en la memoria de un único
ordenador.
Deep Learning
Machine Learning
Big Data
Data Mining
Data Analysis: Exploración de los datos aprovechando métodos
estadísticos. Se conoce las preguntas y dónde encontrar los datos en
contraposición con data mining.
Data Science: Campo de la ciencia que incluye métodos y procesos para
operar sobre los datos como métodos de visualización, machine learning,
tratamiento de datos, …
Google Trends
Data Mining: Analizar los datos para descubrir patrones o propiedades
imprevistas.
Machine Learning: Técnicas que le permiten a las computadoras aprender.
Deep Learning: algoritmos que permiten a los ordenadores distinguir
objetos, textos, vídeos, …
Data Driven: Tomar decisiones basado en datos y no en intuiciones
Data Analysis
4. 2. Algunas aplicaciones del Machine Learning
● Reconocimiento de patrones en imágenes o de voz
● Prevención y detección de fraude en agencias de seguros
● Previsión de demanda de compras en tienda física o predicción de clicks
● Detección de correos spam y de virus
● Recomendación de productos que comprar o canciones que escuchar
● Buscadores para mejorar resultados y sugerencias de búsquedas
● Predicción y pronóstico del clima, del tráfico o de fallos en equipos
6. 3. ¿Tecnología del futuro? Y ciencia del pasado...
★ 1763 Se enuncia el Teorema de Bayes.
★ 1806 Legendre desarrolló y publicó el método de regresión lineal.
★ 1950 Test de Turing. Para pasar el test el ordenador debe hacer creer a un humano que él es también humano.
★ 1953 Athur Samuel escribe el primer programa que aprendía. Se trataba de un juego de damas que mejoraba cuanto más
jugaba al incorporar en su programa las estrategias ganadoras.
★ 1957 Frank Rosenblatt diseñó la primera red neuronal para ordenadores (el perceptrón) que simulaba los procesos de
pensamientos humanos.
★ 1963 Se crea el algoritmo original de SVM (máquinas de vector de soporte)
★ 1967 Se escribe el algoritmo de “vecino más cercano” (“nearest neighbor”).
★ 1986 Se inventaron las redes neuronales multicapa superando la limitación del perceptrón.
★ 1990 Primer cliente Web llamado WorldWideWeb
★ 1993 Se crea el SVM no lineal
★ 1997 Deep Blue de IBM al campeón del mundo de ajedrez.
★ 2006 Geoffrey Hinton acuña el término “deep learning” para explicar los nuevos algoritmos que permiten a los
ordenadores distinguir objetos, textos, vídeos, …
★ 2014 Facebook desarrolla DeepFace, algoritmo de que es capaz de reconocer individuos en fotos con un 97% de precisión
7. 4. ¿Cómo aprenden las máquinas?
Aprendizaje supervisado
Aprendizaje no supervisado
Otros tipos de aprendizajes
8. 4.1 Aprendizaje Supervisado
La base de conocimiento del sistema está formado
por ejemplos de etiquetados anteriores.
Ejemplos de problemas: Determinar si un correo es
spam (clasificación), determinar el precio de un
piso teniendo a otros de referencia (regresión)
Algunos algoritmos son: Vecinos más cercanos,
Naive Bayes, árboles de decisión, regresión, ...
?
10. 4.2 Aprendizaje No Supervisado
El sistema tiene que reconocer patrones para
poder etiquetar nuevas entradas.
Algunos algoritmos son: agrupamiento por k-
medias, análisis de componentes principales, ...
?
11. 4.3 Otros tipos de Aprendizajes
Aprendizaje semisupervisado. Combina los dos anteriores. Se tiene en cuenta los
datos marcados y los no marcados.
Aprendizaje por refuerzo. El sistema aprende a base de ensayo-error. Su
información de entrada lo obtiene del mundo exterior como respuestas a sus
acciones.
12. 5. Técnicas de Machine Learning
Tres grandes grupos:
1. Algoritmos de reducción
2. Algoritmos de clasificación
3. Algoritmos de regresión
13. 5.1 Haz más sencilla tu vida: Simplifica dimensiones
14. 5.1 Algoritmos de reducción de dimensiones
Al reducir el número de dimensiones se reduce el
espacio de tiempo y almacenamiento requerido.
Además se mejora el rendimiento del modelo de
aprendizaje automático.
Análisis por discriminante lineal (LDA).
Aprendizaje supervisado que selecciona, de las
dimensiones que ya tiene, aquellas que mejor
caracterizan los grupos.
Análisis de componentes principales (PCA).
Aprendizaje no supervisado en la que transforma
las dimensiones para quedarse con variables sin
correlación.
16. 5.2 Algoritmos de clasificación
Predecir una clase con las observaciones
(clasificación) o agrupar las observaciones en
grupos significativos (clustering)
El algoritmo de agrupamiento por k-medias utiliza
aprendizaje no supervisado en el que cada
observación pertenece al grupo cuyo valor medio
es más cercano.
Algoritmos de aprendizaje supervisado hay por
ejemplo el de clasificación Naive Bayes, las
máquinas de vectores de soporte (SVM) o las redes
neuronales.
1
2
17. 5.3 Ver el futuro y lo que desconocemos: Regresión
18. 5.3 Algoritmos de regresión
Estos algoritmos de aprendizaje supervisado
permiten predecir el valor de una variable.
Regresión lineal, regresión polinómica, regresión
logística, árboles de decisión, random forest, ...
19. 5.4 Hay muchos mas algoritmos de Machine Learning
Machine Learning Algorithms
20. 5.4 Algoritmos de Machine Learning - Azure
A Visual Introduction to Machine Learning
23. 6. Software de Machine Learning
○ R
○ Scikit-learn de Python
● Software de pago:
○ SPSS
○ SPSS Modeller (Clementine)
● Software gratuíto:
○ RapidMiner
○ Weka
● Software de big data
○ MLlib - Spark
○ Mahout - Hadoop
● Software de pago para trabajar en la nube
○ Azure de Microsoft
25. Índice
1. Pero, ¿qué son esos palabros que se oyen por ahí?
2. Algunas aplicaciones del Machine Learning
3. ¿Tecnología del futuro?
4. ¿Cómo aprenden las máquinas?
1. Aprendizaje Supervisado
2. Aprendizaje No Supervisado
3. Otros tipos de aprendizajes
5. Técnicas de Machine Learning
1. Algoritmos de reducción
2. Algoritmos de clasificación
3. Algoritmos de regresión
4. Y más algoritmos
6. Software
Notas del editor
Se suben mas de 300 horas de Youtube por cada minuto
http://www.lanacion.com.ar/1820979-cuanto-dura-el-conocimiento
http://www.rtve.es/alacarta/videos/orbita-laika/orbita-laika-10-monosabio/3314487/