SlideShare una empresa de Scribd logo
BIG DATA
Agosto 25 y 26 | Lima – Perú 2017
ANALYTICS SUMMIT
#BIGDATASUMMIT2017
www.DataLatam.com
diego@ixpantia.com
Twitter: @diegomay
Innovación con base en
datos en Silicon Valley
y Latino América
Diego May
Casos y
Mejores prácticas
Source: Matt Turck, Jim Hao & First Mark Capital
Source: Matt Turck, Jim Hao & First Mark Capital
Data Science
Machine Learning
SVM
Cross validation
Random forest
R Studio
Linear regression
Logistic regression
Hadoop
Python
Neural networks
Deep learning
K-means
Statistical significance
Boosting
Source: Matt Turck, Jim Hao & First Mark Capital
1)Sentimiento de
estar abrumados
2) Un
líder
3) Implica un
salto al vacío
3) Implica un
salto al vacío
(y habrá resistencia)
¿Cuales problemas son prioritarios?
¿Con que datos contamos?
¿Cuales problemas son prioritarios?
Productos con
base en datos
¿Con que datos contamos?
Receta ?
Receta ?
Ingredientes
Facebook
Expedia
AirBnB
Stitch Fix
Recursos
(40+) Core
data science
team
(300+) Analistas
en equipos de
producto
Enfoque Largo plazo Corto plazo
Facebook
Facebook
Expedia
AirBnB
Stitch Fix
Recursos
(40+) Core
data science
team
(300+) Analistas
en equipos de
producto
Enfoque Largo plazo Corto plazo
Impacto al negocio
Facebook
Facebook
Expedia
AirBnB
Stitch Fix
Recursos
(40+) Core
data science
team
(300+) Analistas
en equipos de
producto
Enfoque Largo plazo Corto plazo
Facebook
Objetivos y
Métricas
(1) Engagement (2) Growth
(3) Core (4) Utility
Impacto al negocio
Facebook
Expedia
AirBnB
Stitch Fix
Facebook
Expedia
AirBnB
Stitch Fix
Facebook
Expedia
AirBnB
Stitch Fix
Procesos
Facebook
Expedia
AirBnB
Stitch Fix
Colaboración e
Innovación Abierta
Facebook
Expedia
AirBnB
Stitch Fix
● 60 Data Scientists
● Modelo distribuído híbrido
● En equipos de producto
● Branding para atraer talento
● Open Source tools
Data Team
+
Facebook
Expedia
AirBnB
Stitch Fix
Products → sprints, A/B tests, prediction, algorithms
Search → new models, evolution
Talent → policies, recruiting, processes
Hosts preferences → understand, model, ML, prediction
User experience → metrics, evaluation, patterns
Split testing → experimentation
Planning → modeling, prediction, dashboards
● 60 Data Scientists
● Modelo distribuído híbrido
● En equipos de producto
● Branding para atraer talento
● Open Source tools
Data Team
+ Products → sprints, A/B tests, prediction, algorithms
Search → new models, evolution
Talent → policies, recruiting, processes
Hosts preferences → understand, model, ML, prediction
User experience → metrics, evaluation, patterns
Split testing → experimentation
Planning → modeling, prediction, dashboards
Experimentación
Facebook
Expedia
AirBnB
Stitch Fix
Facebook
Expedia
AirBnB
Stitch Fix
Facebook
Expedia
AirBnB
Stitch Fix EL diferenciador
Algoritmos son
Big Data
Data Science
General
Caso 1
Caso 2
En Latam
General
Caso 1
Caso 2
Existencia
de datos
General
Caso 1
Caso 2
Existencia
de datos
Acceso a
datos
General
Caso 1
Caso 2
Existencia
de datos
Acceso a
datos
Cultura
de datos
General
Caso 1
Caso 2
Existencia
de datos
Acceso a
datos
Cultura de
innovación
Cultura
de datos
General
Caso 1
Caso 2
Existencia
de datos
Acceso a
datos
Cultura de
innovación
Cultura
de datos
Habilidades
con datos
General
Caso 1
Caso 2
Existencia
de datos
Acceso a
datos
Cultura de
innovación
Cultura
de datos
Habilidades
con datos
General
Caso 1
Caso 2
Tomar procesos en los que DATA
puede generar eficiencia
Procesos existentes
General
Caso 1
Caso 2
Tomar procesos en los que DATA
puede generar eficiencia
Procesos existentes
Nueva
Lógica
General
Caso 1
Caso 2
Tomar procesos en los que DATA
puede generar eficiencia
Procesos existentes
Nueva
Lógica
General
Caso 1
Caso 2
General
Caso 1
Caso 2
Procesos en Atención Telefónica
General
Caso 1
Caso 2
IVR
Ruteo
Agentes
Ventas
Cliente
Llamados
General
Caso 1
Caso 2
JSON
input
Modelo de
Matching
(API)
JSON
output
IVR
Ruteo
Agentes
Ventas
Cliente
Llamados
General
Caso 1
Caso 2
General
Caso 1
Caso 2
General
Caso 1
Caso 2
General
Caso 1
Caso 2
Proceso de
Innovación con Datos
Los 8 pasos
Tengo datos,
¿ahora?
1. Data Dive
2. Pregunta
3. Hipótesis
1. Data Dive
2. Pregunta
3. Hipótesis
1. Data Dive
2. Pregunta
3. Hipótesis
1. Data Dive
2. Pregunta
3. Hipótesis
Tengo datos,
¿ahora?
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Pipeline
Tengo datos,
¿ahora?
No
Estructurados
Semi
Estructurados
Estructurados
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Pipeline
Tengo datos,
¿ahora?
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
Tengo datos,
¿ahora?
Fuente: E. de Jonge & M. van der Loo, 2013. An introduction to data cleaning with R. Technical report, Statistics Netherlands.
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
Data Cleaning
Data Cleansing
Data Scrubbing
Tidy Data
Interpretación
Comunicación
Tengo datos,
¿ahora?
Fuente: E. de Jonge & M. van der Loo, 2013. An introduction to data cleaning with R. Technical report, Statistics Netherlands.
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
Data Cleaning
Data Cleansing
Data Scrubbing
Tidy Data
Interpretación
Comunicación
Tengo datos,
¿ahora?
Visualizaciones
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
Datos
Reportes
Modelos
[
{
"Nombre": "Frans",
"Apellido": "van Dunné",
"score": 0.68
},
{
"Nombre": "Diego",
"Apellido": "May",
"score": 0.68
}
]
Tengo datos,
¿ahora?
Data Pipeline
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
7. Data Pipeline
7
Tengo datos,
¿ahora?
Analizar y
Modelar
Ingerir y
Almacenar
Organizar
y Limpiar
Data Pipeline
Integrar y
Validar
Incremento de valor de datos
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
7. Data Pipeline
7
Call
Center
Online behaviors
Twitter
Past sales
Industry
Data
Facebook
Client
profiles
Employee
profiles
Data
Model
Visualization
Report
Tengo datos,
¿ahora?
Medir y aprender
1. Data Dive
2. Pregunta
3. Hipótesis
4. Data
5. Data Wrangling
6. Data Products
7. Data Pipeline
8. Medición
Tengo datos,
¿ahora?
¿Cómo incorporamos
Data Science
en la organización?
Incorporando
Data Science
en la
organización IT
Innovación
BI
Nueva
Organización
?
Incorporando
Data Science
en la
organización
?
Gracias!
Diego May
diego@ixpantia.com
@diegomay
www.TuDataCoach.com

Más contenido relacionado

La actualidad más candente

Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
nnakasone
 

La actualidad más candente (20)

BDAS-2017 | Organizaciones Orientadas al dato
BDAS-2017 | Organizaciones Orientadas al datoBDAS-2017 | Organizaciones Orientadas al dato
BDAS-2017 | Organizaciones Orientadas al dato
 
2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
 
Evolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigDataEvolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigData
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponenciales
 
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
 
Business intelligence y Big Data en la ciudad
Business intelligence y Big Data en la ciudadBusiness intelligence y Big Data en la ciudad
Business intelligence y Big Data en la ciudad
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Big data
Big dataBig data
Big data
 
Big Data en salud: Un mundo de posibilidades
Big Data en salud: Un mundo de posibilidadesBig Data en salud: Un mundo de posibilidades
Big Data en salud: Un mundo de posibilidades
 
El Big Data en mi empresa ¿de qué me sirve?
El Big Data en mi empresa  ¿de qué me sirve?El Big Data en mi empresa  ¿de qué me sirve?
El Big Data en mi empresa ¿de qué me sirve?
 
¿Cómo hacer Big Data?
¿Cómo hacer Big Data?¿Cómo hacer Big Data?
¿Cómo hacer Big Data?
 
Big data
Big dataBig data
Big data
 
Introducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistIntroducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientist
 
Big data
Big data Big data
Big data
 
Big Data y el ERP en México
Big Data y el ERP en MéxicoBig Data y el ERP en México
Big Data y el ERP en México
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 

Destacado

BDAS-2017 | DMC Challengue concurso satisfacción universidad
BDAS-2017 | DMC Challengue concurso satisfacción universidadBDAS-2017 | DMC Challengue concurso satisfacción universidad
BDAS-2017 | DMC Challengue concurso satisfacción universidad
Big-Data-Summit
 

Destacado (8)

BDAS-2017 | De los Bots a las Arquitecturas Cognitivas
BDAS-2017 | De los Bots a las Arquitecturas CognitivasBDAS-2017 | De los Bots a las Arquitecturas Cognitivas
BDAS-2017 | De los Bots a las Arquitecturas Cognitivas
 
BDAS-2017 | Maximizing a churn campaign’s profitability with cost sensitive m...
BDAS-2017 | Maximizing a churn campaign’s profitability with cost sensitive m...BDAS-2017 | Maximizing a churn campaign’s profitability with cost sensitive m...
BDAS-2017 | Maximizing a churn campaign’s profitability with cost sensitive m...
 
BDAS-2017 | Lesson learned from the application of data science at BBVA
BDAS-2017 | Lesson learned from the application of data science at BBVABDAS-2017 | Lesson learned from the application of data science at BBVA
BDAS-2017 | Lesson learned from the application of data science at BBVA
 
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos DigitalesBDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
 
BDAS-2017 | Deep Neural Networks Para la Detección de Phishing
BDAS-2017 | Deep Neural Networks Para la Detección de PhishingBDAS-2017 | Deep Neural Networks Para la Detección de Phishing
BDAS-2017 | Deep Neural Networks Para la Detección de Phishing
 
BDAS-2017 | DMC Challengue concurso satisfacción universidad
BDAS-2017 | DMC Challengue concurso satisfacción universidadBDAS-2017 | DMC Challengue concurso satisfacción universidad
BDAS-2017 | DMC Challengue concurso satisfacción universidad
 
BDAS-2017 | Hanldling Target Bias in Predictive Modelling
BDAS-2017 | Hanldling Target Bias in Predictive ModellingBDAS-2017 | Hanldling Target Bias in Predictive Modelling
BDAS-2017 | Hanldling Target Bias in Predictive Modelling
 
Building Innovative Data Products in a Banking Environment
Building Innovative Data Products in a Banking EnvironmentBuilding Innovative Data Products in a Banking Environment
Building Innovative Data Products in a Banking Environment
 

Similar a BDAS-2017 | Innovación con base en datos en Silicon Valley y Latino América

El análisis colaborativo de la información -- Antonio Soto
El análisis colaborativo de la información -- Antonio SotoEl análisis colaborativo de la información -- Antonio Soto
El análisis colaborativo de la información -- Antonio Soto
organizacion_20
 

Similar a BDAS-2017 | Innovación con base en datos en Silicon Valley y Latino América (20)

Data Science: Correlación curricular
Data Science: Correlación curricularData Science: Correlación curricular
Data Science: Correlación curricular
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 
Matemática y Data Science
Matemática y Data ScienceMatemática y Data Science
Matemática y Data Science
 
Smart data el uso inteligente de los datos
Smart data el uso inteligente de los datosSmart data el uso inteligente de los datos
Smart data el uso inteligente de los datos
 
Introduccion a la bigdata y su impacto en la sociedad
Introduccion a la bigdata y su impacto en la sociedadIntroduccion a la bigdata y su impacto en la sociedad
Introduccion a la bigdata y su impacto en la sociedad
 
Introduccion a la bigdata y su impacto en la sociedad
Introduccion a la bigdata y su impacto en la sociedadIntroduccion a la bigdata y su impacto en la sociedad
Introduccion a la bigdata y su impacto en la sociedad
 
Del plan al data paper dgb unam
Del plan al data paper dgb unamDel plan al data paper dgb unam
Del plan al data paper dgb unam
 
Small Data para Educación: Más de un millón de pirámides de población de España
Small Data para Educación: Más de un millón de pirámides de población de EspañaSmall Data para Educación: Más de un millón de pirámides de población de España
Small Data para Educación: Más de un millón de pirámides de población de España
 
BigDataSummitPeru - Big Data y Hadoop
BigDataSummitPeru - Big Data y HadoopBigDataSummitPeru - Big Data y Hadoop
BigDataSummitPeru - Big Data y Hadoop
 
De qué hablamos cuando hablamos de Data Science
De qué hablamos cuando hablamos de Data ScienceDe qué hablamos cuando hablamos de Data Science
De qué hablamos cuando hablamos de Data Science
 
Big data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontologíaBig data o datos masivos en investigación en odontología
Big data o datos masivos en investigación en odontología
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
Tema 3.3 introduccion al data science
Tema 3.3 introduccion al data scienceTema 3.3 introduccion al data science
Tema 3.3 introduccion al data science
 
Datlas - Workshop Coloquio Industria 4.0 UANL
Datlas - Workshop Coloquio Industria 4.0 UANLDatlas - Workshop Coloquio Industria 4.0 UANL
Datlas - Workshop Coloquio Industria 4.0 UANL
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 
People Analytics desde RT – Data 4HR
People Analytics desde RT – Data 4HRPeople Analytics desde RT – Data 4HR
People Analytics desde RT – Data 4HR
 
BIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdfBIG DATA COMPLETO ISBN.pdf
BIG DATA COMPLETO ISBN.pdf
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
El análisis colaborativo de la información -- Antonio Soto
El análisis colaborativo de la información -- Antonio SotoEl análisis colaborativo de la información -- Antonio Soto
El análisis colaborativo de la información -- Antonio Soto
 
Introduccion a big data clase 1
Introduccion a big data clase 1Introduccion a big data clase 1
Introduccion a big data clase 1
 

Más de Big-Data-Summit

BDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptxBDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptx
Big-Data-Summit
 
BDAS-2017 | Analitica visual presentación mlms2
BDAS-2017 | Analitica visual presentación mlms2BDAS-2017 | Analitica visual presentación mlms2
BDAS-2017 | Analitica visual presentación mlms2
Big-Data-Summit
 
BDAS-2017 | Comunidad Data Science
BDAS-2017 | Comunidad Data ScienceBDAS-2017 | Comunidad Data Science
BDAS-2017 | Comunidad Data Science
Big-Data-Summit
 

Más de Big-Data-Summit (13)

SafeHomeFace - Sistema de reconocimiento facial.
SafeHomeFace - Sistema de reconocimiento facial.SafeHomeFace - Sistema de reconocimiento facial.
SafeHomeFace - Sistema de reconocimiento facial.
 
Las 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz DíazLas 10 tendencias principales de BI para el 2018 - Carloz Díaz
Las 10 tendencias principales de BI para el 2018 - Carloz Díaz
 
El big data analytics donde menos te lo esperas - Alex Rayón
El big data analytics donde menos te lo esperas - Alex RayónEl big data analytics donde menos te lo esperas - Alex Rayón
El big data analytics donde menos te lo esperas - Alex Rayón
 
Big Data en el sector inmobiliario - Gonzalo Martín
Big Data en el sector inmobiliario - Gonzalo MartínBig Data en el sector inmobiliario - Gonzalo Martín
Big Data en el sector inmobiliario - Gonzalo Martín
 
Modelo Operativo para grandes proyectos de AI - Ignacio Marrero
Modelo Operativo para grandes proyectos de AI - Ignacio MarreroModelo Operativo para grandes proyectos de AI - Ignacio Marrero
Modelo Operativo para grandes proyectos de AI - Ignacio Marrero
 
La evolución de la analítica descriptiva - Diego Aguirre
La evolución de la analítica descriptiva - Diego AguirreLa evolución de la analítica descriptiva - Diego Aguirre
La evolución de la analítica descriptiva - Diego Aguirre
 
El dato tiene forma y la forma significado - Josep Curto
El dato tiene forma y la forma significado - Josep CurtoEl dato tiene forma y la forma significado - Josep Curto
El dato tiene forma y la forma significado - Josep Curto
 
BDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptxBDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptx
 
BDAS-2017 | Analitica visual presentación mlms2
BDAS-2017 | Analitica visual presentación mlms2BDAS-2017 | Analitica visual presentación mlms2
BDAS-2017 | Analitica visual presentación mlms2
 
BDAS-2017 | Comunidad Data Science
BDAS-2017 | Comunidad Data ScienceBDAS-2017 | Comunidad Data Science
BDAS-2017 | Comunidad Data Science
 
Modelos Predictivos, Big Data Retos y Generación de nuevas soluciones
Modelos Predictivos, Big Data Retos y Generación de nuevas solucionesModelos Predictivos, Big Data Retos y Generación de nuevas soluciones
Modelos Predictivos, Big Data Retos y Generación de nuevas soluciones
 
Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
	Estrategias omnicanal para la mejora de los procesos de comunicación y marke...	Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
Estrategias omnicanal para la mejora de los procesos de comunicación y marke...
 
Convergencia de Analítica con la Experiencia Digital
Convergencia de Analítica con la Experiencia DigitalConvergencia de Analítica con la Experiencia Digital
Convergencia de Analítica con la Experiencia Digital
 

Último

REPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdf
REPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdfREPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdf
REPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdf
IrapuatoCmovamos
 
biofisica ciencias básicas biología.docx
biofisica ciencias básicas biología.docxbiofisica ciencias básicas biología.docx
biofisica ciencias básicas biología.docx
melissa501795
 
Morfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCSMorfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCS
LisaCinnamoroll
 
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad  (2024).pdfPrimeros 70 países por IDH ajustado por desigualdad  (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
JC Díaz Herrera
 
cetoacidosis diabetica en pacientes.pptx
cetoacidosis diabetica en pacientes.pptxcetoacidosis diabetica en pacientes.pptx
cetoacidosis diabetica en pacientes.pptx
tecomedico
 

Último (20)

REPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdf
REPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdfREPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdf
REPORTE 1ER TRIMESTRE EJECUTIVO OBS REGIONAL 2024.pdf
 
RESPUESTAS A PREGUNTAS FRECUENTES SOBRE LA VITIVINICULTURA ARGENTINA.pdf
RESPUESTAS A PREGUNTAS FRECUENTES SOBRE LA VITIVINICULTURA ARGENTINA.pdfRESPUESTAS A PREGUNTAS FRECUENTES SOBRE LA VITIVINICULTURA ARGENTINA.pdf
RESPUESTAS A PREGUNTAS FRECUENTES SOBRE LA VITIVINICULTURA ARGENTINA.pdf
 
PRACTICA 1 SOCIOLOGÍA ANÁLISIS SOCIOLÓGICO.pdf
PRACTICA 1 SOCIOLOGÍA ANÁLISIS SOCIOLÓGICO.pdfPRACTICA 1 SOCIOLOGÍA ANÁLISIS SOCIOLÓGICO.pdf
PRACTICA 1 SOCIOLOGÍA ANÁLISIS SOCIOLÓGICO.pdf
 
Diagnóstico Institucional en psicologia.docx
Diagnóstico  Institucional en psicologia.docxDiagnóstico  Institucional en psicologia.docx
Diagnóstico Institucional en psicologia.docx
 
biofisica ciencias básicas biología.docx
biofisica ciencias básicas biología.docxbiofisica ciencias básicas biología.docx
biofisica ciencias básicas biología.docx
 
Morfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCSMorfofisiopatologia Humana I________ UCS
Morfofisiopatologia Humana I________ UCS
 
Presentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptxPresentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptx
 
El narcisismo actualmente en el mundo 2024
El narcisismo actualmente en el mundo 2024El narcisismo actualmente en el mundo 2024
El narcisismo actualmente en el mundo 2024
 
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad  (2024).pdfPrimeros 70 países por IDH ajustado por desigualdad  (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
 
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNATREGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
 
Bioquímica ilustrada tomo 50- introduccion .pdf
Bioquímica ilustrada tomo 50- introduccion .pdfBioquímica ilustrada tomo 50- introduccion .pdf
Bioquímica ilustrada tomo 50- introduccion .pdf
 
Tecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdfTecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdf
 
Los cantantes más ricos del mundo en mdd U$ (2024).pdf
Los cantantes más ricos del mundo en mdd U$ (2024).pdfLos cantantes más ricos del mundo en mdd U$ (2024).pdf
Los cantantes más ricos del mundo en mdd U$ (2024).pdf
 
Pobreza en el Perú en 2023.pdf practicag
Pobreza en el Perú en 2023.pdf practicagPobreza en el Perú en 2023.pdf practicag
Pobreza en el Perú en 2023.pdf practicag
 
DATOS SOBRE LA VIVIENDA SEGÚN CENSO 2017
DATOS SOBRE LA VIVIENDA SEGÚN CENSO 2017DATOS SOBRE LA VIVIENDA SEGÚN CENSO 2017
DATOS SOBRE LA VIVIENDA SEGÚN CENSO 2017
 
PRESUPUESTO Y/O FINANCIAMIENTO UNIDAD 2 TALLER DE INVESTIGACION
PRESUPUESTO Y/O FINANCIAMIENTO UNIDAD 2 TALLER DE INVESTIGACIONPRESUPUESTO Y/O FINANCIAMIENTO UNIDAD 2 TALLER DE INVESTIGACION
PRESUPUESTO Y/O FINANCIAMIENTO UNIDAD 2 TALLER DE INVESTIGACION
 
Diapositivas del fenómeno del niño 123 resumido
Diapositivas del fenómeno del niño 123 resumidoDiapositivas del fenómeno del niño 123 resumido
Diapositivas del fenómeno del niño 123 resumido
 
cetoacidosis diabetica en pacientes.pptx
cetoacidosis diabetica en pacientes.pptxcetoacidosis diabetica en pacientes.pptx
cetoacidosis diabetica en pacientes.pptx
 
Ciencia de datos desde cero. Pr Joel Grus.pdf · 2da edicion español.pdf
Ciencia de datos desde cero. Pr Joel Grus.pdf · 2da edicion español.pdfCiencia de datos desde cero. Pr Joel Grus.pdf · 2da edicion español.pdf
Ciencia de datos desde cero. Pr Joel Grus.pdf · 2da edicion español.pdf
 
Presentación diagrama de flujo del desarrollo aronautico.pptx
Presentación diagrama de flujo del desarrollo aronautico.pptxPresentación diagrama de flujo del desarrollo aronautico.pptx
Presentación diagrama de flujo del desarrollo aronautico.pptx
 

BDAS-2017 | Innovación con base en datos en Silicon Valley y Latino América

Notas del editor

  1. Muy buenas!!! Gracias por estar aquí hoy
  2. Buenos dias! Esperamos hayan pasado ayer un buen día y que haya sido muy productivo El objetivo del día de ayer era que De la mano de Oldemar tuvieran una visión general a la industria y conceptos principles De la mano del prof Diday pudieran sumergirse en algo técnico para que vean la profundidad existente en distintos nichos del Big Data Luego en los talleres vieron los 2 lenguajes principales de la ciencia de datos Durante el día de hoy → Aplicaciones e implementación Veremos mas la aplicación de Big Data y Ciencia de datos Por la mañana Florian y yo les contaremos cosas acerca de como implementar ciencia de datos Por la tarde verán web mining y seteo de infraetructura para crear productos de datos
  3. Para comenzar el ecosistema es GIGANTE. Hay: muchas empresas con tecnología (MSFT, AWS, Google, IBM), muchos proveedores de servicios (consultoras varias, individuos), muchas soluciones open source (R, Python, Airflow, Luigi, Pachyderm) con distintos tipos de comunidades y distintos grados de madurez A nivel técnico y de Infraestructura, hay bastantes áreas a considerar: Tipo de Datos que manejo (estructurados, no estructurados, semi-estructurados) Tipo de bases de datos a utilizar (SQL, NoSQL, Hadoop) Tipos de análisis que deberé realizar Velocidad a la que debo operar (milisegundos? días?)
  4. Luego llegan otras decisiones sobre Lenguajes: R Python Julia E incluso decisiones sobre tipos de aplicaciones: Queremos clasificar? Queremos agrupar? Queremos asociar? Queremos predecir?
  5. El ecosistema es complejo y en plena evolución… Hay muchos que saben y otros que dicen saber… Existe el sentimiento de ´tengo que hacer algo con Big Data´!!! … → Síndrome del mecánico Sabemos que el carro tiene un problema… Lo único que podemos hacer (si no tenemos el mecánico de confianza) es ir a que nos maten...
  6. Diego - introduccion
  7. Estos procesos son de incertidumbre… Es claro que tenemos datos, y se ve el potencial de lo que se podría hacer… Hay que invertir… y los resultados no son necesariamente inmediatos… A veces hay que poner dinero en infraestructura para ordenar la casa antes de generar nada… Esto requiere un empuje político en todas las organizaciones. He visto esto llegando desde: El CEO o la junta directiva (y en gobiernos desde el ´city council´) Desde alguna gerencia O incluso desde IT con alguien con mucho conocimiento (en estos casos requiriendo ´quick wins´ como estrategia para poder evangelizar)
  8. Y hay incertidumbre: aunque exista un plan Aunque se asignen recursos … no está claro que habrá al final del proyecto inicial
  9. En muchos casos vimos bastante resistencia… El status quo siempre es cómodo… Hay gente que no gana demasiado con buena exposición de datos… Hay gente que simplemente no quiere innovar! Hay personal que cree que va a perder poder Finalmente: Data Science requiere ´inversión´ y ´experimentación´… hay que dar ese salto para invertir y estar dispuestos a experimentar. No todo lo que se genere va a ser de valor… pero es cosa de ir construyendo una cultura en la empresa que ve la oportunidad de sacar valor de los datos ...
  10. En muchos casos vimos bastante resistencia… El status quo siempre es cómodo… Hay gente que no gana demasiado con buena exposición de datos… Hay gente que simplemente no quiere innovar! Hay personal que cree que va a perder poder Finalmente: Data Science requiere ´inversión´ y ´experimentación´… hay que dar ese salto para invertir y estar dispuestos a experimentar. No todo lo que se genere va a ser de valor… pero es cosa de ir construyendo una cultura en la empresa que ve la oportunidad de sacar valor de los datos ...
  11. Para comenzar es preciso hacerse estas 2 preguntas… Incluso cuando ya hay un grupo para hacer ciencia de datos...
  12. Y luego comenzar a desarrollar esos ´productos´ de datos
  13. Explicar que es Stitch Fix
  14. → ¿Por que tienen mas de 65 personas colaborando con las distintas áreas del negocio para innovar constantemente respecto a datos? Las recomendaciones generan: 35 % de ventas en Amazon 50 % de conexiones en LinkedIn 75 % de películas vistas en Netflix 100% de ventas en Stitch Fix
  15. Mucho de lo que me tocó ver en Latam busca: Entender lo que se hace con Big Data en Estados Unidos Buscar formas simples de bajarlo a tierra Generar quick wins para mostrar el valor
  16. Perfilado de usuarios y agentes Análisis y Predicción Data Products
  17. JSON & API may need to be explained
  18. JSON & API may need to be explained
  19. JSON & API may need to be explained
  20. JSON & API may need to be explained
  21. Mencionar que es framework propietario de ixpantia.
  22. Data Persona → + Data Perspective → + Data Process →
  23. MAS SOBRE DATA WRANGLING EJEMPLOS COSAS QUE HAY QUE HACER ALGUN ESQUEMA RELEVANTE PARA Data Wrangling (gustan los esquemas o ´Marcos Conceptuales´ PUEDE SER CON R STUDIO (pero tiene que ser breve)
  24. MAS SOBRE DATA WRANGLING EJEMPLOS COSAS QUE HAY QUE HACER ALGUN ESQUEMA RELEVANTE PARA Data Wrangling (gustan los esquemas o ´Marcos Conceptuales´ PUEDE SER CON R STUDIO (pero tiene que ser breve)
  25. MAS SOBRE DATA WRANGLING EJEMPLOS COSAS QUE HAY QUE HACER ALGUN ESQUEMA RELEVANTE PARA Data Wrangling (gustan los esquemas o ´Marcos Conceptuales´ PUEDE SER CON R STUDIO (pero tiene que ser breve)
  26. Hablar de los distintos tipos de productos de datos. Mostrar para el caso de AM la interfaz web y la API Hasta se podría hacer un llamado a la API Model boundaries: K nearest neighbour classifier with fancy plot as explained on : http://stackoverflow.com/questions/31234621/variation-on-how-to-plot-decision-boundary-of-a-k-nearest-neighbor-classifier-f/31236327
  27. Lo que no se mide no existe en el contexto de innovación con base en datos Ideas: El objetivo es tener impacto. Pero no hay impacto que no mides …. Base Line measurement KPI Monitoring Report in terms of KPI changes Find bottlenecks, optimize, check if questions are answered. What you cannot measure does not exist in a data driven world Gut feeling and intuition → Evidence based decision and actions
  28. Ideas: Saliendo al mundo pronto… Si o si se van a cruzar con datos… No hay un modelo que aplique a todas las organizaciones Different organizations have to take different approaches Cultura de innovación Estructura organizacional Data Access Data literacy Data privacy Existen algunos modelos Centralizado Distribuído Híbrido
  29. Ideas: Saliendo al mundo pronto… Si o si se van a cruzar con datos… No hay un modelo que aplique a todas las organizaciones Different organizations have to take different approaches Cultura de innovación Estructura organizacional Data Access Data literacy Data privacy Existen algunos modelos Centralizado Distribuído Híbrido
  30. Diego - introduccion