SlideShare una empresa de Scribd logo
1 de 37
Descargar para leer sin conexión
DATA SCIENCE
Analítica Predictiva y Evolución de BI
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
PATRICIO DEL BOCA
PI Co-founder
@pdelboca
pdelboca@piconsulting.com.ar
RODRIGO BOBADILLA
Data Scientist en PI
@rodrib_08
rbobadilla@piconsulting.com.ar
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes.
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
OBJETIVO
Dar una introducción a Data Science para conocer los conceptos y características
fundamentales de esta disciplina.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Data Science?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
2015
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Bajos costos de procesamiento,
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
algoritmos,
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
y muchos datos.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Nuevo rol, Data Scientist.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
We define Data Science as managing the process
that can transform hypothesis and data into
actionable predictions.
- Practical Data Science with R -
”
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
EVOLUCION DE BI
¿Cuál es el perfil de los clientes que
han dejado de usar mi servicio?
¿Qué clientes van a abandonar
el uso de mi servicio?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Detección de Fraude
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Detección de Patrones y
Segmentación de Clientes
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Sistemas de Recomendación
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Predicción de Abandono de Marca
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Predicción de Demanda
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Scoring y Riesgo Crediticio
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Mantenimiento Predictivo
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
ALGORITMOS
SUPERVISADOS
Clasificación
Regresión
Motores de Recomendación
Detección de Anomalías
ALGORITMOS
NO SUPERVISADOS
Clustering
Clustering Jerárquico
Mapas auto organizados
Descubrimiento de Patrones
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
CICLO DE VIDA
- CRISP-DM, el “SCRUM” de Data Science.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
1. COMPRENSIÓN DEL NEGOCIO
- ¿Cuál es el valor que aporta al negocio este proyecto?
- ¿Cómo puede saber que sus resultados son precisos o efectivos?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
2. COMPRENSIÓN DE LOS DATOS
- Análisis de completitud de los datos
- Búsqueda de errores
- Análisis de valores extremos
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
3. PREPARACIÓN DE LOS DATOS
- Limpieza de datos
- Feature engineering
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
4. MODELADO
- Generalización que busca explicar y predecir el comportamiento de los datos
- “Essentially all models are wrong, but some are useful.” George E. P. Box
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
5. EVALUACIÓN
- ¿Resuelve el modelo el objetivo que planteamos?
- Análisis de los errores y planificación de próximos pasos
- Si es demasiado bueno para ser verdad, probablemente lo sea! (Overfitting)
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
6. IMPLEMENTACIÓN
- Presentación de los resultados a todos los stakeholders
- Implementación del modelos en producción
- Tiempo Real vs Procesamiento en Lote
- Cloud vs On-Premise
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
At the end of the day, it is usually how we frame
the problem, not the tools and techniques that
we use to answer it, that determines how
valuable our work is.
- Thinking with Data, Max Shron -
”
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
THUMB-RULES
- ¿Hay datos disponibles? ¿Etiquetados? ¿Cuántos?
- ¿Qué tipo de datos?
- Garbage In, Garbage Out.
- Iniciar siempre con una prueba de concepto.
- ¿Está el negocio comprometido con un trabajo de calidad?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
BIG DATA
“Big Data es cuando el tamaño comienza a ser un problema y los datos ya no
pueden ser procesados en una sola terminal de cómputo.” - Consenso Popular -
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
CONCLUSIONES
- Data Science es un proceso Iterativo que requiere de muchas idas y vueltas
entre cada etapa
- Lo más importante en un Proyecto es la pregunta que se hace para abordar una
problemática concreta, más aún que las herramientas que se usen.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
PREGUNTAS?
?© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
MUCHAS GRACIAS!
https://github.com/PiConsulting
info@piconsulting.com.ar
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados

Más contenido relacionado

Similar a Data Science - Analítica Predictiva y Evolución de BI

SAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANASAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANA
jorge507504
 
201510_TransformacionBigData
201510_TransformacionBigData201510_TransformacionBigData
201510_TransformacionBigData
Raul Gomez
 
Diez razones por las que las PyMEs eligen SAP para transformar sus negocios.
Diez razones por las que las PyMEs eligen SAP para transformar sus negocios. Diez razones por las que las PyMEs eligen SAP para transformar sus negocios.
Diez razones por las que las PyMEs eligen SAP para transformar sus negocios.
SAP Latinoamérica
 
Guía para acelerar negocios basados en datos
Guía para acelerar negocios basados en datos Guía para acelerar negocios basados en datos
Guía para acelerar negocios basados en datos
Datos.gob.es
 

Similar a Data Science - Analítica Predictiva y Evolución de BI (20)

Estrategia de datos en las organizaciones
Estrategia de datos en las organizaciones Estrategia de datos en las organizaciones
Estrategia de datos en las organizaciones
 
TRANSFORMACIÓN DIGITAL Y MEDIOS
TRANSFORMACIÓN DIGITAL Y MEDIOSTRANSFORMACIÓN DIGITAL Y MEDIOS
TRANSFORMACIÓN DIGITAL Y MEDIOS
 
Programa de Dirección en Big Data - IE Business School
Programa de Dirección en Big Data - IE Business School Programa de Dirección en Big Data - IE Business School
Programa de Dirección en Big Data - IE Business School
 
Programa de Dirección en Big Data - IE Business School
Programa de Dirección en Big Data - IE Business School Programa de Dirección en Big Data - IE Business School
Programa de Dirección en Big Data - IE Business School
 
Análisis de Datos para toma de Decisiones (BIG DATA)
Análisis de Datos para toma de Decisiones (BIG DATA) Análisis de Datos para toma de Decisiones (BIG DATA)
Análisis de Datos para toma de Decisiones (BIG DATA)
 
H. Gomis y E. Cañizares. Herramientas BI : Elección y Buenas Prácticas. Seman...
H. Gomis y E. Cañizares. Herramientas BI : Elección y Buenas Prácticas. Seman...H. Gomis y E. Cañizares. Herramientas BI : Elección y Buenas Prácticas. Seman...
H. Gomis y E. Cañizares. Herramientas BI : Elección y Buenas Prácticas. Seman...
 
Cómo implementar una solución Big Data
Cómo implementar una solución Big DataCómo implementar una solución Big Data
Cómo implementar una solución Big Data
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
 
SAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANASAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANA
 
Solid Day - Seguridad de información en la transformación digital
Solid Day - Seguridad de información en la transformación digitalSolid Day - Seguridad de información en la transformación digital
Solid Day - Seguridad de información en la transformación digital
 
Sopra banking compliance españa, resumen de compañía
Sopra banking compliance españa, resumen de compañíaSopra banking compliance españa, resumen de compañía
Sopra banking compliance españa, resumen de compañía
 
Incremente su presencia gracias y a través de internet
Incremente su presencia gracias y a través de internetIncremente su presencia gracias y a través de internet
Incremente su presencia gracias y a través de internet
 
201510_TransformacionBigData
201510_TransformacionBigData201510_TransformacionBigData
201510_TransformacionBigData
 
Un Plan Estratégico de BI
Un Plan Estratégico de BIUn Plan Estratégico de BI
Un Plan Estratégico de BI
 
10 razones de por qué las PYMES eligen SAP
10 razones de por qué las PYMES eligen SAP10 razones de por qué las PYMES eligen SAP
10 razones de por qué las PYMES eligen SAP
 
Diez razones por las que las PyMEs eligen SAP para transformar sus negocios.
Diez razones por las que las PyMEs eligen SAP para transformar sus negocios. Diez razones por las que las PyMEs eligen SAP para transformar sus negocios.
Diez razones por las que las PyMEs eligen SAP para transformar sus negocios.
 
Eficiencia: ¿cómo mejorar a través de sistemas de gestión (GRP)? - Adriana Be...
Eficiencia: ¿cómo mejorar a través de sistemas de gestión (GRP)? - Adriana Be...Eficiencia: ¿cómo mejorar a través de sistemas de gestión (GRP)? - Adriana Be...
Eficiencia: ¿cómo mejorar a través de sistemas de gestión (GRP)? - Adriana Be...
 
Las 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz DíazLas 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz Díaz
 
10 beneficios de la analítica para la salud
10 beneficios de la analítica para la salud10 beneficios de la analítica para la salud
10 beneficios de la analítica para la salud
 
Guía para acelerar negocios basados en datos
Guía para acelerar negocios basados en datos Guía para acelerar negocios basados en datos
Guía para acelerar negocios basados en datos
 

Último

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Último (10)

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 

Data Science - Analítica Predictiva y Evolución de BI

  • 1. DATA SCIENCE Analítica Predictiva y Evolución de BI © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 2. PATRICIO DEL BOCA PI Co-founder @pdelboca pdelboca@piconsulting.com.ar RODRIGO BOBADILLA Data Scientist en PI @rodrib_08 rbobadilla@piconsulting.com.ar © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 3. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes. Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 4. OBJETIVO Dar una introducción a Data Science para conocer los conceptos y características fundamentales de esta disciplina. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 5. Data Science? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 6. 2015 © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 7. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 8. Bajos costos de procesamiento, © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 9. algoritmos, © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 10. y muchos datos. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 11. Nuevo rol, Data Scientist. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 12. We define Data Science as managing the process that can transform hypothesis and data into actionable predictions. - Practical Data Science with R - ” © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 13. EVOLUCION DE BI ¿Cuál es el perfil de los clientes que han dejado de usar mi servicio? ¿Qué clientes van a abandonar el uso de mi servicio? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 14. Detección de Fraude © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 15. Detección de Patrones y Segmentación de Clientes © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 16. Sistemas de Recomendación © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 17. Predicción de Abandono de Marca © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 18. Predicción de Demanda © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 19. Scoring y Riesgo Crediticio © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 20. Mantenimiento Predictivo © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 21. ALGORITMOS SUPERVISADOS Clasificación Regresión Motores de Recomendación Detección de Anomalías ALGORITMOS NO SUPERVISADOS Clustering Clustering Jerárquico Mapas auto organizados Descubrimiento de Patrones © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 22. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 23. CICLO DE VIDA - CRISP-DM, el “SCRUM” de Data Science. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 24. 1. COMPRENSIÓN DEL NEGOCIO - ¿Cuál es el valor que aporta al negocio este proyecto? - ¿Cómo puede saber que sus resultados son precisos o efectivos? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 25. 2. COMPRENSIÓN DE LOS DATOS - Análisis de completitud de los datos - Búsqueda de errores - Análisis de valores extremos © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 26. 3. PREPARACIÓN DE LOS DATOS - Limpieza de datos - Feature engineering © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 27. 4. MODELADO - Generalización que busca explicar y predecir el comportamiento de los datos - “Essentially all models are wrong, but some are useful.” George E. P. Box © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 28. 5. EVALUACIÓN - ¿Resuelve el modelo el objetivo que planteamos? - Análisis de los errores y planificación de próximos pasos - Si es demasiado bueno para ser verdad, probablemente lo sea! (Overfitting) © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 29. 6. IMPLEMENTACIÓN - Presentación de los resultados a todos los stakeholders - Implementación del modelos en producción - Tiempo Real vs Procesamiento en Lote - Cloud vs On-Premise © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 30. At the end of the day, it is usually how we frame the problem, not the tools and techniques that we use to answer it, that determines how valuable our work is. - Thinking with Data, Max Shron - ” © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 31. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 32. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 33. THUMB-RULES - ¿Hay datos disponibles? ¿Etiquetados? ¿Cuántos? - ¿Qué tipo de datos? - Garbage In, Garbage Out. - Iniciar siempre con una prueba de concepto. - ¿Está el negocio comprometido con un trabajo de calidad? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 34. BIG DATA “Big Data es cuando el tamaño comienza a ser un problema y los datos ya no pueden ser procesados en una sola terminal de cómputo.” - Consenso Popular - © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 35. CONCLUSIONES - Data Science es un proceso Iterativo que requiere de muchas idas y vueltas entre cada etapa - Lo más importante en un Proyecto es la pregunta que se hace para abordar una problemática concreta, más aún que las herramientas que se usen. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 36. PREGUNTAS? ?© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 37. MUCHAS GRACIAS! https://github.com/PiConsulting info@piconsulting.com.ar © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados