BIG DATA PARA DUMMIES
Emilio Arias
Especialista Business Intelligence – Big Data
Stratebi CEO y Conferenciante
emilio.arias@stratebi.com – twitter: @e_arias
La revolución del Big Data
El poder de los
datos y la
información
¿Cuál es tu interés en Big Data?
La revolución del Big Data
Contenidos
 ¿Qué es?
 + Vs. El valor de los datos en un mundo de información
 El tamaño si importa
 Por qué es interesante el Big Data a las empresas
 Tecnología Big Data
Big Data in action
Contenidos
 ¿Qué hacer con Big Data?
 Casos prácticos
 Comunicación, Publicidad y Social Intelligence
 Nuevas Tendencias
La revolución del Big Data
¿Qué es
Big Data?
¿Qué es Big Data?
"Big Data is high-volume, high-velocity and high-
variety information assets that demand cost-
effective, innovative forms of information
processing for enhanced insight and decision
making.”
http://www.gartner.com/it-glossary/big-data/
Gartner, 2012
La revolución del Big Data
Entonces…
¿Qué es el
Big Data?
¿Qué es Big Data?
¿Qué es Big Data?
Volumen
Terabytes, Petabytes, ZetaBytes...
Las dimensiones de los datos han
dejado obsoletas las tecnologías
actuales.
¿Qué es Big Data?
Volumen
1 Bit = Binary Digit
8 Bits = 1 Byte
1.000 Bytes = 1 Kilobyte
1.000 Kilobytes = 1 Megabyte
1.000 Megabytes = 1 Gigabyte
1.000 Gigabytes = 1 Terabyte
1.000 Terabytes = 1 Petabyte
1.000 Petabytes = 1 Exabyte
1.000 Exabytes = 1 Zettabyte
1.000 Zettabytes = 1 Yottabyte
1.000 Yottabytes = 1 Brontobyte
1.000 Brontobytes = 1 Geopbyte
¿Qué es Big Data?
¿Qué es Big Data?
Velocidad
1. Tenemos una alta Velocidad de generación de
datos
2. Y necesitamos una alta Velocidad de
respuesta para procesarlas
¿Qué es Big Data?
¿Qué es Big Data?
Variedad
Los datos han pasado de ser estructurados a semi-estructurados o
completamente no estructurados
● Estructurados: BDRM, tablas
● No estructurados: Texto, imágenes, video
● Semi estructurados: XML, JSON
Tendencia: 10% estructurado - 90% no estructurado
¿Qué es Big Data?
Variedad
¿Qué es Big Data?
Datos vs. Ley de Moore
Data
Moore
La revolución del Big Data
La revolución del Big Data
El valor de los datos
en un mundo de
Información
¿Qué es Big Data?
La revolución del Big Data
La revolución del Big Data
Entendiendo la información…
La revolución del Big Data
La revolución del Big Data
Beneficios en el análisis de datos masivos:
Ventajas competitivas
Optimización de procesos
Incremento ventas
Satisfacción clientes
…
La revolución del Big Data
La cadena de valor del dato
¿Qué es Big Data?
El tamaño si importa
La revolución del Big Data
La revolución del Big Data
¿Qué es Big Data?
¿Qué es Big Data?
La revolución del Big Data
Por qué es
interesante el Big
Data en las
Empresas?
¿Qué es Big Data?
La revolución del Big Data
¿Por qué? ¿Cómo? ¿Quién?
La revolución del Big Data
¿Por qué?
El Big Data no hace magia
Quizás no lo necesitas
Es muy probable que no estés preparado
La revolución del Big Data
¿Cómo?
Los proyectos de Big Data deben responder a una
necesidad de negocio y no a una decisión
tecnológica
El negocio primero
La revolución del Big Data
¿Cómo?
Determina el problema que quieres resolver.
Identifica qué temas preocupan más a tu
organización y busca qué información le puede
ayudar a solucionarlo.
El problema
La revolución del Big Data
¿Cómo?
Entiende cuál es el impacto de esos problemas en
tu organización y desarrolla casos de uso para
ejemplificarlo
Valora el impacto
La revolución del Big Data
¿Cómo?
¿Cómo vas a a medir el éxito de tu proyecto?
¿Cuáles son las principales métricas que vas a
tener que monitorizar durante todo el proyecto?
Con KPIs
Define métricas de éxito
La revolución del Big Data
¿Cómo?
Si el problema se resuelve, ¿qué va a mejorar en tu
organización? ¿Cuánto más va a vender? ¿Cuánto
menos va a gastar? ¿Cómo van a cambiar los
procesos?
Asegura el encaje
La revolución del Big Data
¿Quién?
Data
Scientist
La revolución del Big Data
Tecnología
Big Data
La revolución del Big Data
El contexto del fenómeno
La revolución del Big Data
El contexto del fenómeno
Espíritu Open Source.
Las principales herramientas Big Data son de código abierto e impulsadas por
grandes empresas
La revolución del Big Data
Herramientas
Batch
Real-time
Interactivo
La revolución del Big Data
20142004
Apache
KAFKA
20142004 2010 201120092007
La revolución del Big Data
Herramientas
La revolución del Big Data
¿Qué hacer con Big Data?
Regression Classification Clustering Summarization
Anomaly
detection
Machine LearningMachine Learning
Data MiningData Mining
La revolución del Big Data
Big Data in action
Casos prácticos
Por su carácter transversal, la analítica de datos en
entornos Big Data es de interés para todos los
departamentos de las organizaciones y
prácticamente todos los sectores de negocio
Big Data in action
UtilitiesUtilitiesComercioComercio
BancaBanca MediosMedios
SaludSaludAAPPAAPP
OperacionesOperaciones
MarketingMarketing
EstrategiaEstrategia
FinanzasFinanzas
Recursos humanosRecursos humanos
Big Data in action
Casos prácticos - Marketing
 Segmentación de cliente
 Estimación del gasto de cada cliente en las diferentes categorías de
producto
 Análisis de la churn-rate
 Optimización de la cartera de productos (¿qué productos minimizan la
churn-rate?)
 Recomendadores y cross-selling
 Políticas de fidelización y descuentos
Big Data in action
Casos prácticos – Recursos humanos
 Identificación de talento
 Recomendación de itinerarios de formación
 Métricas de monitorización del talento
 Predicción de la tasa de abandono de los empleados
Big Data in action
Big Data in action
Casos prácticos – Comercio
 Gestión de precios por periodo, artículo y tienda
 Localización óptima de las nuevas tiendas
 Disposición de los productos en las tiendas
 Gestión de inventario
 Gestión de la cesta de la compra
 Análisis de la política de ofertas
Big Data in action
Big Data in action
Ajuste en tiempo real del precio de 73 millones de
artículos, a partir del análisis cruzado de la demanda y el
inventario
Big Data in action
Cadena de restaurantes fast-food que analiza la
composición (longitud, tipología de clientes) de las colas
delante de sus mostradores para determinar qué
productos mostrar en las pantallas que se encuentran
junto a la cola. Cola larga -> productos que se sirven
rápido. Cola corta -> productos más elaborados
Big Data in action
Big Data in action
Un caso de
estudio
en la red:
Privalia
Big Data in action
Diferentes campañas en canales sociales
Big Data in action
Foto publicada en wall ¿Qué analizamos?
Big Data y medios
Contenidos
 El sector de los medios en la era del Big Data
 Nuevos actores y aplicaciones del Big Data en
comunicación y publicidad
 Referentes internacionales
 Tendencias
Big Data en Media.
Ejemplos
Big Data in action
Impacto en doble sentido
Periodismo de datos Mayores ingresos
Big Data in action
Impacto en doble sentido
Big Data in action
El sector de los medios en la era del Big Data
audiencia = f(contenidos) + l(contexto)
La analítica de datos en entornos Big Data permite definir
modelos para maximizar la audiencia como resultado de
la adaptación de contenidos y la computación del
contexto.
Big Data in action
Estrechar la distancia
entre el cliente y el
negocio
Big Data in action
Referentes internacionales
Captura masiva de la interacción con el usuario (BBC
iPlayer)
Generación automática de contenido enriquecido
semánticamente
Big Data in action
Referentes internacionales
Micro-categorización de contenidos a partir de las
aportaciones de los usuarios (76.987 géneros)
Personalización de contenidos para micro-segmentos de
audiencia
Big Data in action
Referentes internacionales
Optimización de contenido, verificación de la eficacia de
la publicidad, regulación de la localización de la
publicidad.
Personalización de contenidos para micro-segmentos de
audiencia
Big Data in action
Nuevas
Tendencias
1. Business Intelligence ha muerto, Viva Business Analytics!!
BI + Big Data + Análisis Predictivo
2. Datos abiertos, no cerrados. Open Data!!
3. Cambio en el ‘statu quo’ de competidores (google,
Facebook…
4. Open Source es el futuro
5. Real Time (quiero mis datos… ya!!)
6. Big Data. Ha venido para quedarse
7. Redes Sociales. El nuevo ‘deep blue data’
8. Mobile Analytics
O es mobile o no
es nada!!
9. Análisis Predictivo.
El futuro ya no es lo que era
10. Periodismo de datos
11. Visualizacion
12. Smart ‘Data’ Cities
13. IoT (cuando ‘las cosas’ cobran vida)
Gracias !! No veo lógico rechazar datos porque parezcan increíbles.
Fred Hoyle (1915-2001) Astrofísico y escritor británico.
Resulta una gran verdad que el destino es una ley cuyo significado se nos escapa, porque nos faltan una inmensidad de datos.
Ferdinand Galiani (1728-1787) Diplomático y economista italiano.
La vida es el arte de sacar conclusiones suficientes a partir de datos insuficientes.
Samuel Butler (novelista) (1835-1902) Novelista inglés.
Duda siempre de ti mismo, hasta que los datos no dejen lugar a dudas.
Louis Pasteur (1822-1895) Químico y microbiólogo francés.

Big Data para Dummies

  • 1.
  • 2.
    Emilio Arias Especialista BusinessIntelligence – Big Data Stratebi CEO y Conferenciante emilio.arias@stratebi.com – twitter: @e_arias
  • 3.
  • 4.
    El poder delos datos y la información ¿Cuál es tu interés en Big Data?
  • 5.
    La revolución delBig Data Contenidos  ¿Qué es?  + Vs. El valor de los datos en un mundo de información  El tamaño si importa  Por qué es interesante el Big Data a las empresas  Tecnología Big Data
  • 6.
    Big Data inaction Contenidos  ¿Qué hacer con Big Data?  Casos prácticos  Comunicación, Publicidad y Social Intelligence  Nuevas Tendencias
  • 7.
    La revolución delBig Data ¿Qué es Big Data?
  • 8.
    ¿Qué es BigData? "Big Data is high-volume, high-velocity and high- variety information assets that demand cost- effective, innovative forms of information processing for enhanced insight and decision making.” http://www.gartner.com/it-glossary/big-data/ Gartner, 2012
  • 9.
    La revolución delBig Data Entonces… ¿Qué es el Big Data?
  • 10.
  • 11.
    ¿Qué es BigData? Volumen Terabytes, Petabytes, ZetaBytes... Las dimensiones de los datos han dejado obsoletas las tecnologías actuales.
  • 12.
    ¿Qué es BigData? Volumen 1 Bit = Binary Digit 8 Bits = 1 Byte 1.000 Bytes = 1 Kilobyte 1.000 Kilobytes = 1 Megabyte 1.000 Megabytes = 1 Gigabyte 1.000 Gigabytes = 1 Terabyte 1.000 Terabytes = 1 Petabyte 1.000 Petabytes = 1 Exabyte 1.000 Exabytes = 1 Zettabyte 1.000 Zettabytes = 1 Yottabyte 1.000 Yottabytes = 1 Brontobyte 1.000 Brontobytes = 1 Geopbyte
  • 13.
  • 14.
    ¿Qué es BigData? Velocidad 1. Tenemos una alta Velocidad de generación de datos 2. Y necesitamos una alta Velocidad de respuesta para procesarlas
  • 15.
  • 16.
    ¿Qué es BigData? Variedad Los datos han pasado de ser estructurados a semi-estructurados o completamente no estructurados ● Estructurados: BDRM, tablas ● No estructurados: Texto, imágenes, video ● Semi estructurados: XML, JSON Tendencia: 10% estructurado - 90% no estructurado
  • 17.
    ¿Qué es BigData? Variedad
  • 18.
    ¿Qué es BigData? Datos vs. Ley de Moore Data Moore
  • 19.
  • 20.
    La revolución delBig Data El valor de los datos en un mundo de Información
  • 21.
  • 22.
  • 23.
    La revolución delBig Data Entendiendo la información…
  • 24.
  • 25.
    La revolución delBig Data Beneficios en el análisis de datos masivos: Ventajas competitivas Optimización de procesos Incremento ventas Satisfacción clientes …
  • 26.
    La revolución delBig Data La cadena de valor del dato
  • 27.
    ¿Qué es BigData? El tamaño si importa
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
    La revolución delBig Data Por qué es interesante el Big Data en las Empresas?
  • 34.
  • 35.
    La revolución delBig Data ¿Por qué? ¿Cómo? ¿Quién?
  • 36.
    La revolución delBig Data ¿Por qué? El Big Data no hace magia Quizás no lo necesitas Es muy probable que no estés preparado
  • 37.
    La revolución delBig Data ¿Cómo? Los proyectos de Big Data deben responder a una necesidad de negocio y no a una decisión tecnológica El negocio primero
  • 38.
    La revolución delBig Data ¿Cómo? Determina el problema que quieres resolver. Identifica qué temas preocupan más a tu organización y busca qué información le puede ayudar a solucionarlo. El problema
  • 39.
    La revolución delBig Data ¿Cómo? Entiende cuál es el impacto de esos problemas en tu organización y desarrolla casos de uso para ejemplificarlo Valora el impacto
  • 40.
    La revolución delBig Data ¿Cómo? ¿Cómo vas a a medir el éxito de tu proyecto? ¿Cuáles son las principales métricas que vas a tener que monitorizar durante todo el proyecto? Con KPIs Define métricas de éxito
  • 41.
    La revolución delBig Data ¿Cómo? Si el problema se resuelve, ¿qué va a mejorar en tu organización? ¿Cuánto más va a vender? ¿Cuánto menos va a gastar? ¿Cómo van a cambiar los procesos? Asegura el encaje
  • 42.
    La revolución delBig Data ¿Quién? Data Scientist
  • 43.
    La revolución delBig Data Tecnología Big Data
  • 44.
    La revolución delBig Data El contexto del fenómeno
  • 45.
    La revolución delBig Data El contexto del fenómeno Espíritu Open Source. Las principales herramientas Big Data son de código abierto e impulsadas por grandes empresas
  • 46.
    La revolución delBig Data Herramientas Batch Real-time Interactivo
  • 47.
    La revolución delBig Data 20142004 Apache KAFKA 20142004 2010 201120092007
  • 48.
    La revolución delBig Data Herramientas
  • 49.
    La revolución delBig Data ¿Qué hacer con Big Data? Regression Classification Clustering Summarization Anomaly detection Machine LearningMachine Learning Data MiningData Mining
  • 50.
  • 51.
    Big Data inaction Casos prácticos Por su carácter transversal, la analítica de datos en entornos Big Data es de interés para todos los departamentos de las organizaciones y prácticamente todos los sectores de negocio
  • 52.
    Big Data inaction UtilitiesUtilitiesComercioComercio BancaBanca MediosMedios SaludSaludAAPPAAPP OperacionesOperaciones MarketingMarketing EstrategiaEstrategia FinanzasFinanzas Recursos humanosRecursos humanos
  • 53.
    Big Data inaction Casos prácticos - Marketing  Segmentación de cliente  Estimación del gasto de cada cliente en las diferentes categorías de producto  Análisis de la churn-rate  Optimización de la cartera de productos (¿qué productos minimizan la churn-rate?)  Recomendadores y cross-selling  Políticas de fidelización y descuentos
  • 54.
    Big Data inaction Casos prácticos – Recursos humanos  Identificación de talento  Recomendación de itinerarios de formación  Métricas de monitorización del talento  Predicción de la tasa de abandono de los empleados
  • 55.
  • 56.
    Big Data inaction Casos prácticos – Comercio  Gestión de precios por periodo, artículo y tienda  Localización óptima de las nuevas tiendas  Disposición de los productos en las tiendas  Gestión de inventario  Gestión de la cesta de la compra  Análisis de la política de ofertas
  • 57.
  • 58.
    Big Data inaction Ajuste en tiempo real del precio de 73 millones de artículos, a partir del análisis cruzado de la demanda y el inventario
  • 59.
    Big Data inaction Cadena de restaurantes fast-food que analiza la composición (longitud, tipología de clientes) de las colas delante de sus mostradores para determinar qué productos mostrar en las pantallas que se encuentran junto a la cola. Cola larga -> productos que se sirven rápido. Cola corta -> productos más elaborados
  • 60.
  • 61.
    Big Data inaction Un caso de estudio en la red: Privalia
  • 62.
    Big Data inaction Diferentes campañas en canales sociales
  • 63.
    Big Data inaction Foto publicada en wall ¿Qué analizamos?
  • 64.
    Big Data ymedios Contenidos  El sector de los medios en la era del Big Data  Nuevos actores y aplicaciones del Big Data en comunicación y publicidad  Referentes internacionales  Tendencias Big Data en Media. Ejemplos
  • 65.
    Big Data inaction Impacto en doble sentido Periodismo de datos Mayores ingresos
  • 66.
    Big Data inaction Impacto en doble sentido
  • 67.
    Big Data inaction El sector de los medios en la era del Big Data audiencia = f(contenidos) + l(contexto) La analítica de datos en entornos Big Data permite definir modelos para maximizar la audiencia como resultado de la adaptación de contenidos y la computación del contexto.
  • 68.
    Big Data inaction Estrechar la distancia entre el cliente y el negocio
  • 69.
    Big Data inaction Referentes internacionales Captura masiva de la interacción con el usuario (BBC iPlayer) Generación automática de contenido enriquecido semánticamente
  • 70.
    Big Data inaction Referentes internacionales Micro-categorización de contenidos a partir de las aportaciones de los usuarios (76.987 géneros) Personalización de contenidos para micro-segmentos de audiencia
  • 71.
    Big Data inaction Referentes internacionales Optimización de contenido, verificación de la eficacia de la publicidad, regulación de la localización de la publicidad. Personalización de contenidos para micro-segmentos de audiencia
  • 72.
    Big Data inaction Nuevas Tendencias
  • 73.
    1. Business Intelligenceha muerto, Viva Business Analytics!! BI + Big Data + Análisis Predictivo
  • 74.
    2. Datos abiertos,no cerrados. Open Data!!
  • 75.
    3. Cambio enel ‘statu quo’ de competidores (google, Facebook…
  • 76.
    4. Open Sourcees el futuro
  • 77.
    5. Real Time(quiero mis datos… ya!!)
  • 78.
    6. Big Data.Ha venido para quedarse
  • 79.
    7. Redes Sociales.El nuevo ‘deep blue data’
  • 80.
    8. Mobile Analytics Oes mobile o no es nada!!
  • 81.
    9. Análisis Predictivo. Elfuturo ya no es lo que era
  • 82.
  • 83.
  • 84.
  • 85.
    13. IoT (cuando‘las cosas’ cobran vida)
  • 86.
    Gracias !! Noveo lógico rechazar datos porque parezcan increíbles. Fred Hoyle (1915-2001) Astrofísico y escritor británico. Resulta una gran verdad que el destino es una ley cuyo significado se nos escapa, porque nos faltan una inmensidad de datos. Ferdinand Galiani (1728-1787) Diplomático y economista italiano. La vida es el arte de sacar conclusiones suficientes a partir de datos insuficientes. Samuel Butler (novelista) (1835-1902) Novelista inglés. Duda siempre de ti mismo, hasta que los datos no dejen lugar a dudas. Louis Pasteur (1822-1895) Químico y microbiólogo francés.