SlideShare una empresa de Scribd logo
1 de 15
Descargar para leer sin conexión
Big Data
Tom Sawada
tsawada@intellignos.com
@TomasSawada
Que pensamos que es Big Data?
Que es Big Data?
Que es Big Data?
• Modelos estadísticos aceptados
• Aplicado a un gran volumen de datos
• Mismos desvíos, errores y outliers
• Muchas veces montados sobre software
• y otras veces, no…
Usar modelos estadísticos que probablemente ya aprendimos…
Análisis de correlación (Relación lineal)
R2:$0,7$R:$0,83$
R:$Grado$de$asociación$(fuerza)$entre$las$variables$$ R2:$Explicación$de$la$variación$de$una$variable$respecto$de$la$otra$
Del$siguiente$análisis$se$puede$visualizar$una$fuerte$relación$
entre$las$visitas$y$la$Carga$del$CV.$En$donde$se$afirma$que$
la$variable$“Visitas”$se$encuentra$relacionada$$linealmente$
de$una$manera$fuerte$con$la$variable$dependiente$(0,8).$$De$
acuerdo$a$R2$podemos$indicar$que$el$70%$de$la$Carga$del$
CVs$son$explicadas$por$la$variable$independiente$Visitas.$
Del$siguiente$análisis$$puede$visualizar$una$fuerte$relación$
entre$la$Registración$y$la$Carga$del$CV.$En$donde$se$afirma$
que$la$variable$“Registrados”$se$encuentra$relacionada$en$
forma$directa$con$la$variable$dependiente$$(0,83).$$A$través$
de$R2$podemos$indicar$que$el$65%$de$la$Carga$del$CVs$son$
explicadas$por$la$variable$independiente$Registros.$
Correlación$entre$Visitas$y$Carga$de$CV$
Correlación$entre$Registración$$y$Carga$de$CV$
y$=$0.3282x$+$3752.5$
R²$=$0.65654$
0$
5000$
10000$
15000$
20000$
25000$
30000$
35000$
40000$
45000$
0$ 20000$ 40000$ 60000$ 80000$ 100000$
Carga$de$CV$
Registrados$(Postulantes)$
R2:$0,65$R:$0,81$
y$=$0.0101x$+$938.61$
R²$=$0.69465$
0$
10000$
20000$
30000$
40000$
50000$
$T$$$$ $1,000,000$$ $2,000,000$$ $3,000,000$$ $4,000,000$$
Carga$de$CV$
Visitas$
Análisis de correlación (Relación lineal)
R2:$0,02$R:$0,14$
Del$siguiente$análisis$puede$visualizar$que$no$existe$una$relación$directa$entre$la$inversión$publicitaria$y$la$variables$
independientes$(Visitas$y$Carga$de$CV$desde$tráfico$pago)$$
Análisis$de$Ia$inversión$publicitaria$(Google$Adwords)$vs.$El$volumen$de$visitas$y$el$volumen$de$
Carga$de$CV$
$$0$
$$100,000$
$$200,000$
$$300,000$
$$400,000$
$G$$$$
$1,000,000$$
$2,000,000$$
$3,000,000$$
$4,000,000$$
JulG12$
AugG12$
SepG12$
OctG12$
NovG12$
DecG12$
JanG13$
FebG13$
MarG13$
AprG13$
MayG13$
JunG13$
JulG13$
Visitas$ Inversión$Publicitaria$
y$=$G1.1113x$+$2E+06$
R²$=$0.02139$
$G$$$$
$1,000,000$$
$2,000,000$$
$3,000,000$$
$4,000,000$$
$$0$$$50,000$$$100,000$$$150,000$$$200,000$$$250,000$$$300,000$$$350,000$$$400,000$
Visitas$
Inversión$Publicitaria$
$G$$$$
$2,000$$
$4,000$$
$6,000$$
$$0$
$$100,000$
$$200,000$
$$300,000$
$$400,000$
JulG12$
AugG12$
SepG12$
OctG12$
NovG12$
DecG12$
JanG13$
FebG13$
MarG13$
AprG13$
MayG13$
JunG13$
JulG13$
Inversión$ Carga$de$CV$[TP]$
y$=$G0.0016x$+$3838.3$
R²$=$0.01976$
$G$$$$
$1,000$$
$2,000$$
$3,000$$
$4,000$$
$5,000$$
$6,000$$
100,000$ 150,000$ 200,000$ 250,000$ 300,000$ 350,000$ 400,000$
Carga$CV$[TP]$
Inversión$Publicitaria$
R2:$0,019$R:$0,14$
R:$Grado$de$asociación$(fuerza)$entre$las$variables$$ R2:$Explicación$de$la$variación$de$una$variable$respecto$de$la$otra$
Inversión$ Carga$CV$[TP]$
Visitas$ Inversión$
Cliente Mercenario
(compra ofertas y se queja)
Cliente fidelizado
(compra y recomienda)
Cliente Nuevo c/potenical
(compró y se repagó)
Cliente nuevo s/potenical
(compró oferta no se repagó)
Cliente perezoso
(le cuesta volver, pero al hacerlo compra)
Cliente fisgón
(mira mucho pero compra poco)
Cliente offline
(termina la compra offline)
Cliente estacional
(tiene períodos de compra)
Como se ven nuestros clientes?
Cliente Mercenario
desinvertir
Cliente fidelizado
cosechar
Cliente Nuevo c/potenical
sembrar / invertir
Cliente nuevo s/potenical
fomentar interés sin inversión
Cliente perezoso
activar / mantener activo
Cliente fisgón
generar interés y probar (testing!!!)
Cliente offline
Generar UX ideal según tipo de consumo
Cliente estacional
activar y desactivar según ciclo
Que hacemos con esto?
• Lo nuevo es el volumen de información,
no la metodología.
• El software nos ayuda a correr los
modelos, no a tomar decisiones.
• Importa quien está analizando la
información.
Big Data es una coyuntura, no una
práctica.
Gracias/Thank you
Tom Sawada
Business Consultant
tsawada@intellignos.com

Más contenido relacionado

Similar a Tom Sawada - Intellignos - Big Data

Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Stratebi
 
Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2kdcsb
 
Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2kdcsb
 
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...Neo4j
 
Bases de datos orientadas a grafos
Bases de datos orientadas a grafosBases de datos orientadas a grafos
Bases de datos orientadas a grafosAbraham Paez
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Ris Fernandez
 
Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogotajorge Muchaypiña
 
Modelos de BDD y Modelos de Datos
Modelos de BDD y Modelos de DatosModelos de BDD y Modelos de Datos
Modelos de BDD y Modelos de DatosJosé Padrón
 
Diseño Lógico de la base de datos
Diseño Lógico de la base de datosDiseño Lógico de la base de datos
Diseño Lógico de la base de datoseeencalada
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datosedwin
 
actividad de perfiles de facebook en la ciudad de loja- Mineria de Datos
actividad de perfiles de facebook en la ciudad de loja- Mineria de Datosactividad de perfiles de facebook en la ciudad de loja- Mineria de Datos
actividad de perfiles de facebook en la ciudad de loja- Mineria de DatosLizzb3 Betancourt
 

Similar a Tom Sawada - Intellignos - Big Data (14)

Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2
 
Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2
 
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
 
Bases de datos orientadas a grafos
Bases de datos orientadas a grafosBases de datos orientadas a grafos
Bases de datos orientadas a grafos
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012
 
Modelo relacional
Modelo relacionalModelo relacional
Modelo relacional
 
Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogota
 
Curso Modelamiento De Datos
Curso Modelamiento De DatosCurso Modelamiento De Datos
Curso Modelamiento De Datos
 
Modelos de BDD y Modelos de Datos
Modelos de BDD y Modelos de DatosModelos de BDD y Modelos de Datos
Modelos de BDD y Modelos de Datos
 
Diseño Lógico de la base de datos
Diseño Lógico de la base de datosDiseño Lógico de la base de datos
Diseño Lógico de la base de datos
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
actividad de perfiles de facebook en la ciudad de loja- Mineria de Datos
actividad de perfiles de facebook en la ciudad de loja- Mineria de Datosactividad de perfiles de facebook en la ciudad de loja- Mineria de Datos
actividad de perfiles de facebook en la ciudad de loja- Mineria de Datos
 

Tom Sawada - Intellignos - Big Data

  • 2. Que pensamos que es Big Data?
  • 3.
  • 4.
  • 5. Que es Big Data?
  • 6. Que es Big Data? • Modelos estadísticos aceptados • Aplicado a un gran volumen de datos • Mismos desvíos, errores y outliers • Muchas veces montados sobre software • y otras veces, no…
  • 7.
  • 8. Usar modelos estadísticos que probablemente ya aprendimos…
  • 9. Análisis de correlación (Relación lineal) R2:$0,7$R:$0,83$ R:$Grado$de$asociación$(fuerza)$entre$las$variables$$ R2:$Explicación$de$la$variación$de$una$variable$respecto$de$la$otra$ Del$siguiente$análisis$se$puede$visualizar$una$fuerte$relación$ entre$las$visitas$y$la$Carga$del$CV.$En$donde$se$afirma$que$ la$variable$“Visitas”$se$encuentra$relacionada$$linealmente$ de$una$manera$fuerte$con$la$variable$dependiente$(0,8).$$De$ acuerdo$a$R2$podemos$indicar$que$el$70%$de$la$Carga$del$ CVs$son$explicadas$por$la$variable$independiente$Visitas.$ Del$siguiente$análisis$$puede$visualizar$una$fuerte$relación$ entre$la$Registración$y$la$Carga$del$CV.$En$donde$se$afirma$ que$la$variable$“Registrados”$se$encuentra$relacionada$en$ forma$directa$con$la$variable$dependiente$$(0,83).$$A$través$ de$R2$podemos$indicar$que$el$65%$de$la$Carga$del$CVs$son$ explicadas$por$la$variable$independiente$Registros.$ Correlación$entre$Visitas$y$Carga$de$CV$ Correlación$entre$Registración$$y$Carga$de$CV$ y$=$0.3282x$+$3752.5$ R²$=$0.65654$ 0$ 5000$ 10000$ 15000$ 20000$ 25000$ 30000$ 35000$ 40000$ 45000$ 0$ 20000$ 40000$ 60000$ 80000$ 100000$ Carga$de$CV$ Registrados$(Postulantes)$ R2:$0,65$R:$0,81$ y$=$0.0101x$+$938.61$ R²$=$0.69465$ 0$ 10000$ 20000$ 30000$ 40000$ 50000$ $T$$$$ $1,000,000$$ $2,000,000$$ $3,000,000$$ $4,000,000$$ Carga$de$CV$ Visitas$
  • 10. Análisis de correlación (Relación lineal) R2:$0,02$R:$0,14$ Del$siguiente$análisis$puede$visualizar$que$no$existe$una$relación$directa$entre$la$inversión$publicitaria$y$la$variables$ independientes$(Visitas$y$Carga$de$CV$desde$tráfico$pago)$$ Análisis$de$Ia$inversión$publicitaria$(Google$Adwords)$vs.$El$volumen$de$visitas$y$el$volumen$de$ Carga$de$CV$ $$0$ $$100,000$ $$200,000$ $$300,000$ $$400,000$ $G$$$$ $1,000,000$$ $2,000,000$$ $3,000,000$$ $4,000,000$$ JulG12$ AugG12$ SepG12$ OctG12$ NovG12$ DecG12$ JanG13$ FebG13$ MarG13$ AprG13$ MayG13$ JunG13$ JulG13$ Visitas$ Inversión$Publicitaria$ y$=$G1.1113x$+$2E+06$ R²$=$0.02139$ $G$$$$ $1,000,000$$ $2,000,000$$ $3,000,000$$ $4,000,000$$ $$0$$$50,000$$$100,000$$$150,000$$$200,000$$$250,000$$$300,000$$$350,000$$$400,000$ Visitas$ Inversión$Publicitaria$ $G$$$$ $2,000$$ $4,000$$ $6,000$$ $$0$ $$100,000$ $$200,000$ $$300,000$ $$400,000$ JulG12$ AugG12$ SepG12$ OctG12$ NovG12$ DecG12$ JanG13$ FebG13$ MarG13$ AprG13$ MayG13$ JunG13$ JulG13$ Inversión$ Carga$de$CV$[TP]$ y$=$G0.0016x$+$3838.3$ R²$=$0.01976$ $G$$$$ $1,000$$ $2,000$$ $3,000$$ $4,000$$ $5,000$$ $6,000$$ 100,000$ 150,000$ 200,000$ 250,000$ 300,000$ 350,000$ 400,000$ Carga$CV$[TP]$ Inversión$Publicitaria$ R2:$0,019$R:$0,14$ R:$Grado$de$asociación$(fuerza)$entre$las$variables$$ R2:$Explicación$de$la$variación$de$una$variable$respecto$de$la$otra$ Inversión$ Carga$CV$[TP]$ Visitas$ Inversión$
  • 11. Cliente Mercenario (compra ofertas y se queja) Cliente fidelizado (compra y recomienda) Cliente Nuevo c/potenical (compró y se repagó) Cliente nuevo s/potenical (compró oferta no se repagó) Cliente perezoso (le cuesta volver, pero al hacerlo compra) Cliente fisgón (mira mucho pero compra poco) Cliente offline (termina la compra offline) Cliente estacional (tiene períodos de compra) Como se ven nuestros clientes?
  • 12. Cliente Mercenario desinvertir Cliente fidelizado cosechar Cliente Nuevo c/potenical sembrar / invertir Cliente nuevo s/potenical fomentar interés sin inversión Cliente perezoso activar / mantener activo Cliente fisgón generar interés y probar (testing!!!) Cliente offline Generar UX ideal según tipo de consumo Cliente estacional activar y desactivar según ciclo Que hacemos con esto?
  • 13. • Lo nuevo es el volumen de información, no la metodología. • El software nos ayuda a correr los modelos, no a tomar decisiones. • Importa quien está analizando la información. Big Data es una coyuntura, no una práctica.
  • 14.
  • 15. Gracias/Thank you Tom Sawada Business Consultant tsawada@intellignos.com