Introducción de Machine Learning
@zigiella, 10/2016 Craftsmanship Barcelona
a lo Berserker
AVISO A LAS EXPECTATIVAS
Esta charla es una charla de INTRODUCCIÓN al Machine Learning.
Es una charla de INTRODUCCIÓN.
Niv...
What do
I mean with
“Berserker”?
Craftsmanship Barcelona
DISCLAIMERS
Esta charla puede herir la sensibilidad de estadísticos
y matemáticos. También de data scientist expertos. Lo ...
PLAN
1- CONTEXTO: De dónde venimos, dónde estamos, a dónde vamos,... y qué pinta
Machine Learning en todo esto. TRENDS, ME...
MY BACKGROUND
Craftsmanship Barcelona
@zigiella
INGENIERÍA
INFORMÁTICA
DATA
MANAGEMENT
& ANALYTICS
BUSINESS
MANAGEMENT
MAR...
Cerros de Úbeda
2014
EMERGING TECHNOLOGIES
2014
Craftsmanship BarcelonaContexto
Tecnologías emergentes
Craftsmanship BarcelonaContexto
EMERGING TECHNOLOGIES
2015
Craftsmanship BarcelonaContexto
EMERGING TECHNOLOGIES
2016
Craftsmanship BarcelonaContexto
Sources: Gartner 2013, Gartner 2014, Gartner 2015, Gartner 2016
EMERGING TECHNOLOGIES
2016...
NEGRA
PESADA
BLANCA
LIGERA
BLANCA
PESADA
NEGRO
LIGERO
Imagen tio+ordenador:https://pixabay.com
Todos los experimentos de tiradas de objetos
son los datos con lo que la máquina
va a poder aprender para luego predecir,
...
Machine Learning
“Se trata de dotar a las máquinas
de la habilidad de aprender a partir
de ejemplos.”
Machine Learning
“Las máquinas aprenden a partir
de la experiencia.”
Machine Learning
“Aplicar y ajustar algoritmos que
buscan patrones en los datos
que permitan establecer
un modelo predicti...
ORDENADOR
SALIDA
ENTRADAS
(OBSERVACIONES)
PROGRAMA
ORDENADOR
SALIDA
ENTRADAS
(OBSERVACIONES))
PROGRAMA
PROGRAMADOR
PROGRAM...
Machine Learning
“Field of study that gives computers the ability to learn
without being explicitly programmed.” Arthur Sa...
“Los programas con Machine Learning
aprenden de la experiencia.”
¿QUÉ PASA CON
MACHINE LEARNING
Y BIG DATA?
“Cría datos y tendrás muchos.”
Lo que vale es extraer
valor del dato.
¿QUÉ PASA CON
MACHINE LEARNING
Y DATA SCIENCE?
http://drewconway.com/ 2010
DATA SCIENCE
ALGORITMO
MACHINE LEARNING
DATOS
MODELO
PREDICTIVO
DATA
MINING
CONOCIMIENTO
QUE PUEDO EXTRAER
DE LOS DATOS
MODELO QUE ME
P...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
Proceso proyecto data science
ENTENDER
PROBLEMA
Definir objetivos
PREPARAR Y
LI...
El Titanic
?
Hombre, 35 años, tercera clase ?
Proceso Machine Learning
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
¿Qué algoritmo
uso?
CONSTRUIR MODELO
DATA PRODUCT
VISU...
Proceso Machine Learning
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
¿Qué algoritmo
uso?
CONSTRUIR MODELO
DATA PRODUCT
VISU...
Proceso Machine Learning
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
¿Qué algoritmo
uso?
CONSTRUIR MODELO
DATA PRODUCT
VISU...
Proceso Machine Learning
ENTENDER LOS DATOS
PREPROCESO DE LOS DATOS
¿Qué algoritmo
uso?
CONSTRUIR MODELO
DATA PRODUCT
VISU...
Matriz de confusión
En “general”,
un modelo bueno
es aquel que
“generaliza” bien.
PELIGRO: Overfitting!!
PELIGRO: Overfitting!!
La mayoría de métodos estadísticos y de Machine
Learning usan alguna forma de REGULARIZACIÓN para
q...
Algoritmos
de Machine
Learning
Sospechosos habituales
Regresión Lineal
Regresión Logística
Árboles de Decisión
Random Forest
SVM
KNN
K-means
Tipos de “learning”
SUPERVISED
&
UNSUPERVISED
(& SEMI-SUPERVISED)
ALGORITMO
MACHINE
LEARNING
DATOS MODELO
PREDICCIÓN!!
NUEVOS
DATOS
Entradas Respuesta Predicción
respuesta
Nuevas entradas
...
ALGORITMO
MACHINE
LEARNING
DATOS MODELO
Entradas
CLUSTERING
REDUCCIÓN
No supervisado
Supervisado No supervisado
Regresión
Clasificación
Clustering
Reducción de
variables
Supervisado No supervisado
Regresión
Regresión Lineal
Árboles de Decisión
Random Forest
SVM
Regresión Logística
SVM
Árbole...
Regresión
Lineal
El caballo de batalla
REG
RESIÓ
N
Slide tomada prestada de http://www.slideshare.net/benfreundorfer
Slide tomada prestada de http://www.slideshare.net/benfreundorfer
Y=β0+β1X
Slide tomada prestada de http://www.slideshare.net/benfreundorfer
Y=β0+β1X
Slide tomada prestada de http://www.slideshare.net/benfreundorfer
Y=β0+β1X
Regresión
Logística
Clasificación
CLASIFICAD
O
R
Fuente:es.wikipedia.org
Árboles
de decisión
Fácil de entender, fácil de explicar
CLASIFICAD
O
R
SVM
SUPPORT VECTOR MACHINE
“Lo peta”
CLASIFICAD
O
R
El hiperplano
R2
Más alta dimensión,
más separabilidad.
Las SVM se basan en aplicar funciones (llamadas de kernel) que
transforman el espacio de puntos original en un espacio de ...
Las SVM se basan en aplicar funciones (llamadas de Kernel) que
transforman el espacio de puntos original en un espacio de ...
Función de Kernel→
Más alta dimensión!!
Kernel Trick!!!
La maldición de los SVM es evitar el sobreajuste.
Random Forest
EL PODER DE MUCHOS
CLASIFICAD
O
R
Random Forest
EL PODER DE MUCHOS
CLASIFICAD
O
R
DEL EN-SEM-BLE
KNN
Cómo son mis vecinos
CLASIFICACIÓ
N
K-Means
Agrupaciones, segmentación
CLU
STERIN
G
Text Mining
Machine learning aplicado al dato no estructurados de tipo texto.
FUÍ UNA MONGUER
PENSANDO QUE
ME DARÍA TIEMPO...
En resumen...
Resumen
El dato no habla por nosotros, nosotros hablamos por el dato.
Machine Learning consiste en que las máquinas aprend...
Dónde aprender, recursos...
OS Tools & Pay-as-you-go services
Comentarios?¿Preguntas
Machine Learning a lo Berserker
@zigiella, 10/2016 Craftsmanship Barcelona
GRACIAS ;)
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Próxima SlideShare
Cargando en…5
×

Machine Learning a lo berserker - Software Craftsmanship Barcelona 2016

407 visualizaciones

Publicado el

Slides de la charla "Machine learning a lo berserker". Una charla que consiste en explicar Machine Learning a lo bruto y con un poco de irresponsabilidad :P Nada de mates y un poco de sentido práctico.

Publicado en: Datos y análisis
0 comentarios
1 recomendación
Estadísticas
Notas
  • Sé el primero en comentar

Sin descargas
Visualizaciones
Visualizaciones totales
407
En SlideShare
0
De insertados
0
Número de insertados
25
Acciones
Compartido
0
Descargas
19
Comentarios
0
Recomendaciones
1
Insertados 0
No insertados

No hay notas en la diapositiva.

Machine Learning a lo berserker - Software Craftsmanship Barcelona 2016

  1. 1. Introducción de Machine Learning @zigiella, 10/2016 Craftsmanship Barcelona a lo Berserker
  2. 2. AVISO A LAS EXPECTATIVAS Esta charla es una charla de INTRODUCCIÓN al Machine Learning. Es una charla de INTRODUCCIÓN. Nivel BÁSICO. Craftsmanship Barcelona
  3. 3. What do I mean with “Berserker”? Craftsmanship Barcelona
  4. 4. DISCLAIMERS Esta charla puede herir la sensibilidad de estadísticos y matemáticos. También de data scientist expertos. Lo básico, a veces, necesita reducir la dimensionalidad del contenido, así que esta charla contiene muchas simplificaciones. No se habla apenas de tecnologías: ni Hadoop, ni Spark,... Los ejemplos están en R, lo siento por los amantes del Python. Hay mezcla de idiomas. La charla requiere actos de Fe! Craftsmanship Barcelona
  5. 5. PLAN 1- CONTEXTO: De dónde venimos, dónde estamos, a dónde vamos,... y qué pinta Machine Learning en todo esto. TRENDS, MERCADO, PALABROS, ROLES 2- MACHINE LEARNING. DEFINICIÓN Y PROCESO. + CONTEXTO 3- ALGUNOS ALGORITMOS. 4- CONCLUSIONES. 5- RONDA DE COMENTARIOS. Craftsmanship Barcelona
  6. 6. MY BACKGROUND Craftsmanship Barcelona @zigiella INGENIERÍA INFORMÁTICA DATA MANAGEMENT & ANALYTICS BUSINESS MANAGEMENT MARKETING ADVERTISING PSICOLOGÍA ExecutiveMBA EMPRENDEDURÍA
  7. 7. Cerros de Úbeda
  8. 8. 2014 EMERGING TECHNOLOGIES 2014 Craftsmanship BarcelonaContexto
  9. 9. Tecnologías emergentes Craftsmanship BarcelonaContexto EMERGING TECHNOLOGIES 2015
  10. 10. Craftsmanship BarcelonaContexto EMERGING TECHNOLOGIES 2016
  11. 11. Craftsmanship BarcelonaContexto Sources: Gartner 2013, Gartner 2014, Gartner 2015, Gartner 2016 EMERGING TECHNOLOGIES 2016 The perceptual smart machine age: Smart machine technologies will be the most disruptive class of technologies over the next 10 years due to radical computational power, near-endless amounts of data, and unprecedented advances in deep neural networks that will allow organizations with smart machine technologies to harness data in order to adapt to new situations and solve problems that no one has encountered previously. Enterprises that are seeking leverage in this theme should consider the following technologies: Smart Dust, Machine Learning, Virtual Personal Assistants, Cognitive Expert Advisors, Smart Data Discovery, Smart Workspace, Conversational User Interfaces, Smart Robots, Commercial UAVs (Drones), Autonomous Vehicles, Natural-Language Question Answering, Personal Analytics, Enterprise Taxonomy and Ontology Management, Data Broker PaaS (dbrPaaS), and Context Brokering.
  12. 12. NEGRA PESADA BLANCA LIGERA BLANCA PESADA NEGRO LIGERO Imagen tio+ordenador:https://pixabay.com
  13. 13. Todos los experimentos de tiradas de objetos son los datos con lo que la máquina va a poder aprender para luego predecir, dado dos objetos nuevos y sus características, cuál de ellos va a llegar antes al suelo. Analogía original de la consultora polaca Algolytics Imagen tio+ordenador:https://pixabay.com
  14. 14. Machine Learning “Se trata de dotar a las máquinas de la habilidad de aprender a partir de ejemplos.”
  15. 15. Machine Learning “Las máquinas aprenden a partir de la experiencia.”
  16. 16. Machine Learning “Aplicar y ajustar algoritmos que buscan patrones en los datos que permitan establecer un modelo predictivo.”
  17. 17. ORDENADOR SALIDA ENTRADAS (OBSERVACIONES) PROGRAMA ORDENADOR SALIDA ENTRADAS (OBSERVACIONES)) PROGRAMA PROGRAMADOR PROGRAMACIÓN TRADICIONAL MACHINE LEARNING
  18. 18. Machine Learning “Field of study that gives computers the ability to learn without being explicitly programmed.” Arthur Samuel, 1959 “A computer program is said to learn from experience E with respect to some class of tasks T if its performance, as measured by P, improves with experience E.” Tom M Mitchell, 1997
  19. 19. “Los programas con Machine Learning aprenden de la experiencia.”
  20. 20. ¿QUÉ PASA CON MACHINE LEARNING Y BIG DATA?
  21. 21. “Cría datos y tendrás muchos.” Lo que vale es extraer valor del dato.
  22. 22. ¿QUÉ PASA CON MACHINE LEARNING Y DATA SCIENCE?
  23. 23. http://drewconway.com/ 2010 DATA SCIENCE
  24. 24. ALGORITMO MACHINE LEARNING DATOS MODELO PREDICTIVO DATA MINING CONOCIMIENTO QUE PUEDO EXTRAER DE LOS DATOS MODELO QUE ME PERMITE PREDECIR SOBRE NUEVOS DATOS MACHINE LEARNING
  25. 25. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO
  26. 26. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO
  27. 27. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO OBTENER DATOS
  28. 28. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO OBTENER DATOS
  29. 29. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO
  30. 30. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO ¡¡NUNCA SE HACE UN MODELADO SIN MIRAR ANTES LOS DATOS!! EL TRABAJO DE PREPROCESO SE LLEVA EL MAYOR TIEMPO DEL PROCESO!!
  31. 31. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO
  32. 32. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO
  33. 33. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO DIVIDIR DATOS
  34. 34. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO DIVIDIR DATOS
  35. 35. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO
  36. 36. ENTENDER LOS DATOS PREPROCESO DE LOS DATOS Proceso proyecto data science ENTENDER PROBLEMA Definir objetivos PREPARAR Y LIMPIAR DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO EVALUAR MODELO EXPLORAR Y ANALIZAR DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES Proceso Machine Learning ELEGIR MEJOR MODELO
  37. 37. El Titanic
  38. 38. ? Hombre, 35 años, tercera clase ?
  39. 39. Proceso Machine Learning ENTENDER LOS DATOS PREPROCESO DE LOS DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES ELEGIR MEJOR MODELO PREPARAR Y LIMPIAR DATOS EVALUAR MODELO EXPLORAR Y ANALIZAR ENTENDER PROBLEMA Definir objetivos ENTENDER PROBLEMA Definir objetivos
  40. 40. Proceso Machine Learning ENTENDER LOS DATOS PREPROCESO DE LOS DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES ELEGIR MEJOR MODELO PREPARAR Y LIMPIAR DATOS EVALUAR MODELO EXPLORAR Y ANALIZAR ALGORITMO MACHINE LEARNING DATOS ENTENDER PROBLEMA Definir objetivos ENTENDER PROBLEMA Definir objetivos DATASET NEW DATA PREDICCIÓN!! NUEVOS DATOS DATASET TRAIN DATASET VAL MODELO CLASIFICACIÓN
  41. 41. Proceso Machine Learning ENTENDER LOS DATOS PREPROCESO DE LOS DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES ELEGIR MEJOR MODELO PREPARAR Y LIMPIAR DATOS EVALUAR MODELO EXPLORAR Y ANALIZAR ENTENDER PROBLEMA Definir objetivos ENTENDER PROBLEMA Definir objetivos
  42. 42. Proceso Machine Learning ENTENDER LOS DATOS PREPROCESO DE LOS DATOS ¿Qué algoritmo uso? CONSTRUIR MODELO DATA PRODUCT VISUALIZACIÓN TOMA DE DECISIONES ELEGIR MEJOR MODELO PREPARAR Y LIMPIAR DATOS EVALUAR MODELO EXPLORAR Y ANALIZAR ENTENDER PROBLEMA Definir objetivos ENTENDER PROBLEMA Definir objetivos MODELO CLASIFICACIÓN
  43. 43. Matriz de confusión
  44. 44. En “general”, un modelo bueno es aquel que “generaliza” bien.
  45. 45. PELIGRO: Overfitting!!
  46. 46. PELIGRO: Overfitting!! La mayoría de métodos estadísticos y de Machine Learning usan alguna forma de REGULARIZACIÓN para que se pueda limitar el SOBREAJUSTE.
  47. 47. Algoritmos de Machine Learning
  48. 48. Sospechosos habituales Regresión Lineal Regresión Logística Árboles de Decisión Random Forest SVM KNN K-means
  49. 49. Tipos de “learning”
  50. 50. SUPERVISED & UNSUPERVISED (& SEMI-SUPERVISED)
  51. 51. ALGORITMO MACHINE LEARNING DATOS MODELO PREDICCIÓN!! NUEVOS DATOS Entradas Respuesta Predicción respuesta Nuevas entradas Supervisado
  52. 52. ALGORITMO MACHINE LEARNING DATOS MODELO Entradas CLUSTERING REDUCCIÓN No supervisado
  53. 53. Supervisado No supervisado Regresión Clasificación Clustering Reducción de variables
  54. 54. Supervisado No supervisado Regresión Regresión Lineal Árboles de Decisión Random Forest SVM Regresión Logística SVM Árboles de Decisión Random Forest KNN Clasificación K-Means Clustering PCA Reducción de variablesA B
  55. 55. Regresión Lineal El caballo de batalla REG RESIÓ N
  56. 56. Slide tomada prestada de http://www.slideshare.net/benfreundorfer
  57. 57. Slide tomada prestada de http://www.slideshare.net/benfreundorfer Y=β0+β1X
  58. 58. Slide tomada prestada de http://www.slideshare.net/benfreundorfer Y=β0+β1X
  59. 59. Slide tomada prestada de http://www.slideshare.net/benfreundorfer Y=β0+β1X
  60. 60. Regresión Logística Clasificación CLASIFICAD O R
  61. 61. Fuente:es.wikipedia.org
  62. 62. Árboles de decisión Fácil de entender, fácil de explicar CLASIFICAD O R
  63. 63. SVM SUPPORT VECTOR MACHINE “Lo peta” CLASIFICAD O R
  64. 64. El hiperplano
  65. 65. R2
  66. 66. Más alta dimensión, más separabilidad.
  67. 67. Las SVM se basan en aplicar funciones (llamadas de kernel) que transforman el espacio de puntos original en un espacio de mayor dimensión.
  68. 68. Las SVM se basan en aplicar funciones (llamadas de Kernel) que transforman el espacio de puntos original en un espacio de mayor dimensión, donde encontrar un hyperplano que separe los datos.
  69. 69. Función de Kernel→ Más alta dimensión!! Kernel Trick!!!
  70. 70. La maldición de los SVM es evitar el sobreajuste.
  71. 71. Random Forest EL PODER DE MUCHOS CLASIFICAD O R
  72. 72. Random Forest EL PODER DE MUCHOS CLASIFICAD O R DEL EN-SEM-BLE
  73. 73. KNN Cómo son mis vecinos CLASIFICACIÓ N
  74. 74. K-Means Agrupaciones, segmentación CLU STERIN G
  75. 75. Text Mining Machine learning aplicado al dato no estructurados de tipo texto. FUÍ UNA MONGUER PENSANDO QUE ME DARÍA TIEMPO A EXPLICAR ESTO.
  76. 76. En resumen...
  77. 77. Resumen El dato no habla por nosotros, nosotros hablamos por el dato. Machine Learning consiste en que las máquinas aprendan sin programación explícita. Las máquinas aprenden de la experiencia. Hay que saber: algoritmos, mates, estadística, programación y análisis, y… sensores, IoT, data storage, data management, y… conocer los contextos de aplicación. Machine Learning nos rodea ahora y cada vez más. Esto ha sido una explicación berserker y hay todo un mundo ahí fuera.
  78. 78. Dónde aprender, recursos...
  79. 79. OS Tools & Pay-as-you-go services
  80. 80. Comentarios?¿Preguntas
  81. 81. Machine Learning a lo Berserker @zigiella, 10/2016 Craftsmanship Barcelona GRACIAS ;)

×