SlideShare una empresa de Scribd logo
www.consultec.es
Introducción a Big Data
www.consultec.es
¿Quiénes somos?
Gorka Armentia
Developer
garmentia@consultec.es
@joruus
MCSA: SQL Server 2012
MCSD: Application Lifecycle Management
Constantin Cuciurean
Developer
ccuciurean@consultec.es
MCSA: SQL Server 2012
MCSD: Web Applications
Índice
1. Introducción
1. ¿Qué no es Big Data?
2. Situación actual
3. ¿Y entonces qué es Big Data exactamente?
4. Las 3 Vs de Big Data
5. Retos actuales
2. Big Data llevado a la práctica
1. Utilidades
2. Ejemplo real: Walmart
3. ¿Qué mueve Big Data?
1. Características Técnicas
2. Software
3. Markets de Datos
4. Hadoop
5. Microsoft HDInsight
4. Demos
www.consultec.es
Introducción
“Big Data” es desde hace dos o tres años una de las grandes
tendencias dentro del mundo de la tecnología y del marketing, uno
de esos “buzzwords” que en un momento dado empiezan a
propagarse y aparecer por todo internet, las grandes empresas se
interesan por ello, se crea una industria alrededor y, de repente,
todo el mundo sabe lo que es Big Data. O no …
BIG DATA
www.consultec.es
¿Qué no es Big Data?
Antes de empezar, lo primero es desengañarnos.
• Big Data no es una base de datos enorme
• Big Data no es un data warehouse enorme
• Big Data no es una nueva forma de Business Intelligence
• Big Data no es llevar las base de datos a la nube
• …
www.consultec.es
Situación actual
Bases de
Datos
Relacionales
Bases de
Datos
Analíticas
(Data
Warehouse)
Archivos
(XML,
Logs, …)
ERP/CRM
Redes Sociales
Base de
Datos NoSQL
APIs
Sensores
RFID
Información
generada por
apps móviles
Y mucho más.
Y lo que está
por venir …
Big Data
GPS
Internet de
las Cosas
Información
generada por
máquinas
eMails
www.consultec.es
¿Y entonces qué es Big Data exactamente?
• Definiciones encontradas en internet
• Información que tiene un orden de magnitud más grande de lo que
estamos acostumbrados.
• Información que es muy grande, se mueve muy rápido y no se ajusta a
las estructuras de las base de datos actuales.
• Es un conjunto de datos cuyo tamaño está más allá de la capacidad de la
mayoría de los software utilizados para capturar, gestionar y procesar la
información dentro de un lapso tolerable de tiempo.
www.consultec.es
Las 3 Vs de Big Data
Volume: grandes volúmenes de información
• Se está pasando de hablar en Gigabytes o Terabytes a tamaños de datos de
Petabytes, Exabytes o Zettabytes. Volúmenes que se nos escapan.
www.consultec.es
Las 3 Vs de Big Data
Variety: información de tipos muy diversos
• Ya no solo tenemos información estructurada en Bases de Datos o Archivos.
Ahora empezamos a tener información con tipos diferentes y totalmente
desestructurada.
www.consultec.es
Las 3 Vs de Big Data
Velocity: velocidad con la que se genera la información
• La velocidad a la que se genera esta información hace imposible gestionarla
con sistemas de base de datos convencionales. Las empresas y las personas
ya no quieren estar al día, quieren “estar al segundo”.
www.consultec.es
Retos actuales
• Dar sentido al gran volumen de datos
• Necesitamos las herramientas adecuadas para dar sentido de la abrumadora
cantidad de datos generados por la disminución de los costos de hardware y de las
fuentes de datos “complejas”.
• La comprensión de una variedad cada vez mayor de datos
• Debemos poder analizar datos tanto relacionales como no relacionales. Más del 85%
de los datos capturados son desestructurados.
• Habilitación de análisis en tiempo real de los datos
• Los nuevos generadores de datos (Twitter, Facebook, Apps, …) están produciendo
volúmenes de datos sin precedentes y en tiempo real, lo que no se puede analizar
eficazmente mediante procesos por lotes normales.
www.consultec.es
Utilidades
Toma de decisiones
El valor del Big Data no es la información, sino la nueva forma de toma de
decisiones basada en evidencias y datos empíricos.
Tomar decisiones en base a datos empíricos y tendencias
Tomar decisiones en base a corazonadas, instinto o
experiencias pasadas
www.consultec.es
Utilidades
Experimentación
Una vez recopilados los datos que nos
interesan, la experimentación y la
exploración de los mismos puede
mostrarnos información que a primera vista
nunca hubiésemos encontrado o que nunca
se nos hubiese ocurrido buscar.
www.consultec.es
Utilidades
Transparencia
Compartir y hacer accesible grandes volúmenes de datos a las partes interesadas
y de manera oportuna puede crear un enorme valor y aumentar la eficiencia.
www.consultec.es
Utilidades
Innovación
Permite crear nuevos productos y servicios, mejorar los existentes e, incluso, crear
nuevos modelos de negocio.
www.consultec.es
Ejemplo real: Walmart
• Walmart es una multinacional de grandes almacenes
• Es la segunda mayor empresa del mundo por ingresos
www.consultec.es
Ejemplo real: Walmart
• Algunos datos:
• 200 millones de clientes a la semana
• 10700 tiendas
• 27 países
• 2 millones de trabajadores
• 1,5 millones de transacciones por hora
• Varios Terabytes de información generada en tiempo real
• Base de datos de 3 Petabytes
www.consultec.es
Ejemplo real: Walmart
Guardando todas las compras de todos los clientes se dieron cuenta que
en época de huracanes los Walmart de las zonas afectadas vendían más
cajas de Pop-Tarts que en otras épocas.
Se indicó a los gerentes de las tiendas que en esas épocas pusiesen los
Pop-Tarts en la entrada de las tiendas.
Resultado: Aumento extraordinario de las ventas
¿A quién se le hubiese ocurrido cruzar los
datos de ventas con los datos meteorológicos
o con los calendarios de huracanes?
www.consultec.es
Ejemplo real: Walmart
Hanna twitea:
“I love Salt!”.
En unos segundos el Tweet llega a los sistemas de Walmart, se analiza y
unos minutos más tarde le llega a una amiga suya el siguiente email:
“Buenos días!
Nos pediste que te avisásemos cuando fuese el cumpleaños
de Hanna. Pues ya está aquí y acaba de tweetear algo
bueno sobre la película “Salt” de Angelina Jolie.
¿Quieres regalarle algo relacionado con ello?
Tenemos algunas sugerencias que hacerte …”
www.consultec.es
Ejemplo real: Walmart
• Social Genome
Base de conocimiento que captura entidades y relaciones del mundo
social.
Obtiene información de su base de datos, de otros datos tanto públicos
como privados y de redes sociales.
A partir de ahí identifican entidades “interesantes” y las relacionan
entre sí, consiguiendo toda la información de la que son capaces.
Es un sistema vivo, en constante evolución.
www.consultec.es
Ejemplo real: Walmart
• Entidades: • Relaciones
• Una persona interesada en un tema
• Una persona que asiste a un evento
• Un evento sobre un tema
• Una asociación entre empresa y
producto
www.consultec.es
Ejemplo real: Walmart
• Resumiendo
www.consultec.es
Características Técnicas
Arquitectura
• Alta escalabilidad
• Procesamiento paralelo
• Baja latencia
• Datos no estructurados y estructurados
• NoSQL
• By-pass de datos – Alta disponibilidad
www.consultec.es
Markets de Datos
Además de las fuentes de datos que tengamos en nuestra organización:
bases de datos, emails, logs, documentos, etc … Podemos acceder a
grandes volúmenes de datos (Data Sets) en los markets.
Hay gratuitos y de pago.
www.consultec.es
Hadoop
• Es una plataforma diseñada para almacenar y analizar grandes
volúmenes de datos de diferentes tipos. Basada en Google
Map/Reduce y Google Filesystem.
• Map/Reduce:
• Map: recoger los datos, estructurarlos, extraer la
información interesante, etc … para poder trabajar con
ellos.
Los trabajos se distribuyen en los nodos para
procesarse paralelamente.
• Reduce: combina la información generada en los Map.
• HDFS (Hadoop Distributed File System):
• Sistema de archivos distribuidos, con replicación
automática y optimizado para lectura. Cada fichero se
particiona y se distribuye en todos los servidores.
www.consultec.es
Hadoop
• Otros proyectos alrededor de Hadoop
• Hive: Data Warehouse sobre Hadoop con lenguaje HiveQL (“SQL”).
• Pig: Lenguaje de script para consulta y análisis de la información. Desarrollado
por Yahoo!.
• Sqoop: Framework para la integración de bases de datos relacionales con
Hadoop
• Flume: Servicio para recolectar, agregar y mover grandes volúmenes de datos
de eventos/logs y streaming.
• …
www.consultec.es
Microsoft HDInsight
• Servicio basado en Hadoop.
• Dos versiones:
• Windows Azure HDInsight (on-demand)
• HDInsight Server (on-premise)
www.consultec.es
Microsoft HDInsight
• Acceso a todo tipo de usuarios, incluidos desarrolladores y
profesionales IT. Fácil instalación, administración y configuración.
• Integración con herramientas conocidas como Excel, PowerPivot,
PowerView, SQL Server Analysis Services o Reporting Services.
• .NET SDK para Hadoop (a través e NuGet):
• Map/Reduce
• LINQ to Hive
• WebHDFS Client
www.consultec.es
Microsoft HDInsight
www.consultec.es
¿Dudas?
Gorka Armentia
Developer
garmentia@consultec.es
@joruus
MCSA: SQL Server 2012
MCSD: Application Lifecycle Management
Constantin Cuciurean
Developer
ccuciurean@consultec.es
MCSA: SQL Server 2012
MCSD: Web Applications
www.consultec.es
Gracias!

Más contenido relacionado

La actualidad más candente

Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
Grupo DIRCOM
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
Emilio del Prado
 
Big data
Big data Big data
2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza
KEEDIO
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
Carlos Cuesta
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
KEEDIO
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos
Luis Joyanes
 
Big Data
Big DataBig Data
Big Data
Grupo DIRCOM
 
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesDesayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
amdia
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponenciales
Leonardo Clavijo
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
Manuel Alejandro Carrero Aponte
 
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
Big-Data-Summit
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
Granada Giménez-Vacas
 
CRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoCRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminado
Andres Karp
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big Data
Grupo DIRCOM
 
Big data
Big dataBig data
Big data
TaniaQu
 
Big data
Big dataBig data
Big data
marianaflorez20
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales
.. ..
 
Estado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCEstado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOC
Josep Curto
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?
Carla Buj
 

La actualidad más candente (20)

Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
 
Big data
Big data Big data
Big data
 
2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos
 
Big Data
Big DataBig Data
Big Data
 
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesDesayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponenciales
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
 
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
 
CRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoCRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminado
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big Data
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales
 
Estado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCEstado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOC
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?
 

Destacado

Big Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy GrailBig Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy GrailJason A. Metz
 
Trabajo de huawey
Trabajo de huaweyTrabajo de huawey
Trabajo de huawey
andreyperezperez
 
Huawei diapositiva
Huawei diapositivaHuawei diapositiva
Huawei diapositiva
andreyperezperez
 
Huawei
HuaweiHuawei
Huawei en Entel Summit 2010
Huawei en Entel Summit 2010Huawei en Entel Summit 2010
Huawei en Entel Summit 2010
Entel
 
Big Data World
Big Data WorldBig Data World
Big Data World
Hossein Zahed
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
EOI Escuela de Organización Industrial
 

Destacado (8)

Big Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy GrailBig Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy Grail
 
Empresa nike
Empresa nikeEmpresa nike
Empresa nike
 
Trabajo de huawey
Trabajo de huaweyTrabajo de huawey
Trabajo de huawey
 
Huawei diapositiva
Huawei diapositivaHuawei diapositiva
Huawei diapositiva
 
Huawei
HuaweiHuawei
Huawei
 
Huawei en Entel Summit 2010
Huawei en Entel Summit 2010Huawei en Entel Summit 2010
Huawei en Entel Summit 2010
 
Big Data World
Big Data WorldBig Data World
Big Data World
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 

Similar a Big Data Introducción

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
Luis Fernando Aguas Bucheli
 
Trabajo de-big-data
Trabajo de-big-dataTrabajo de-big-data
Trabajo de-big-data
Lucy Mego Saavedra
 
El big data
El big dataEl big data
El big data
SusanaLoaiza1
 
Que es big data
Que es big dataQue es big data
Que es big data
Sergio Sanchez
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
Eduardo Castro
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
JavierNavarrete43
 
Big data
Big dataBig data
Big data
Big dataBig data
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
JuanCarlosRomanPerez1
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
DatKnoSys
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
Ernesto Mislej
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
Big Data Colombia
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
Ris Fernandez
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
Eduardo Castro
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
Eduardo Castro
 
Big data
Big dataBig data
big data
big  databig  data
big data
harvi5966
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big Data
Alfredo Vela Zancada
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
laubritez2001
 

Similar a Big Data Introducción (20)

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Trabajo de-big-data
Trabajo de-big-dataTrabajo de-big-data
Trabajo de-big-data
 
El big data
El big dataEl big data
El big data
 
Que es big data
Que es big dataQue es big data
Que es big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Big data
Big dataBig data
Big data
 
big data
big  databig  data
big data
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big Data
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
 

Último

Presentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptxPresentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptx
hlscomunicaciones
 
ORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesietORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesiet
Maria Apellidos
 
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNATREGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
yafethcarrillo
 
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxDiapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
WalterOrdoez22
 
TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666
LizetTiradoRodriguez
 
Tecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdfTecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdf
uriel132
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
ManuelaReina3
 
MATERIAS PRIMAS DE ORIGEN ORGÁNICO.pdf
MATERIAS PRIMAS DE ORIGEN   ORGÁNICO.pdfMATERIAS PRIMAS DE ORIGEN   ORGÁNICO.pdf
MATERIAS PRIMAS DE ORIGEN ORGÁNICO.pdf
uriel132
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
JC Díaz Herrera
 
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
EliseoLuisRamrez
 
Licencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chileLicencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chile
franciscasalinaspobl
 
Ojiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datosOjiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datos
JaimeYael
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
Emisor Digital
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
JosMuoz943377
 
Flujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotelFlujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotel
f4llenangel345
 
SISTEMA PRIVADO DE PENSIONES- de la cruz.pptx
SISTEMA PRIVADO DE PENSIONES- de la cruz.pptxSISTEMA PRIVADO DE PENSIONES- de la cruz.pptx
SISTEMA PRIVADO DE PENSIONES- de la cruz.pptx
mogollonespinoza17
 
Desarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento InformaticaDesarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento Informatica
floralbaortega88
 
Mapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptxMapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptx
diegoandrerodriguez2
 
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad  (2024).pdfPrimeros 70 países por IDH ajustado por desigualdad  (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
JC Díaz Herrera
 
Presentación diagrama de flujo del desarrollo aronautico.pptx
Presentación diagrama de flujo del desarrollo aronautico.pptxPresentación diagrama de flujo del desarrollo aronautico.pptx
Presentación diagrama de flujo del desarrollo aronautico.pptx
cmrodriguezortiz1103
 

Último (20)

Presentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptxPresentación Cuenta Pública HLS 2023.pptx
Presentación Cuenta Pública HLS 2023.pptx
 
ORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesietORIENTACIONES PSIET orientación sobre el pesiet
ORIENTACIONES PSIET orientación sobre el pesiet
 
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNATREGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
REGIMEN MYPE TRIBUTARIO HECHO PARA APORTES PARA LA SUNAT
 
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxDiapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en Honduraspptx
 
TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666TABla de detracciones 123456 antonela tirado 653266666666666
TABla de detracciones 123456 antonela tirado 653266666666666
 
Tecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdfTecnologia de materiales T01- Agregados.docx (1).pdf
Tecnologia de materiales T01- Agregados.docx (1).pdf
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
 
MATERIAS PRIMAS DE ORIGEN ORGÁNICO.pdf
MATERIAS PRIMAS DE ORIGEN   ORGÁNICO.pdfMATERIAS PRIMAS DE ORIGEN   ORGÁNICO.pdf
MATERIAS PRIMAS DE ORIGEN ORGÁNICO.pdf
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
 
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
1- PRESENTACION DE ORIENTACIONES DE LA ORDENANZA 04-2023.11.04.24.pptx
 
Licencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chileLicencias por enfermedad de hijo menor de 2 años chile
Licencias por enfermedad de hijo menor de 2 años chile
 
Ojiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datosOjiva porcentual para el análisis de datos
Ojiva porcentual para el análisis de datos
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
 
Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
 
Flujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotelFlujograma: Reserva de habitación en un hotel
Flujograma: Reserva de habitación en un hotel
 
SISTEMA PRIVADO DE PENSIONES- de la cruz.pptx
SISTEMA PRIVADO DE PENSIONES- de la cruz.pptxSISTEMA PRIVADO DE PENSIONES- de la cruz.pptx
SISTEMA PRIVADO DE PENSIONES- de la cruz.pptx
 
Desarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento InformaticaDesarrollo de Habilidades de Pensamiento Informatica
Desarrollo de Habilidades de Pensamiento Informatica
 
Mapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptxMapa-conceptual-del-Neoclasicismo-4.pptx
Mapa-conceptual-del-Neoclasicismo-4.pptx
 
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad  (2024).pdfPrimeros 70 países por IDH ajustado por desigualdad  (2024).pdf
Primeros 70 países por IDH ajustado por desigualdad (2024).pdf
 
Presentación diagrama de flujo del desarrollo aronautico.pptx
Presentación diagrama de flujo del desarrollo aronautico.pptxPresentación diagrama de flujo del desarrollo aronautico.pptx
Presentación diagrama de flujo del desarrollo aronautico.pptx
 

Big Data Introducción

  • 2. www.consultec.es ¿Quiénes somos? Gorka Armentia Developer garmentia@consultec.es @joruus MCSA: SQL Server 2012 MCSD: Application Lifecycle Management Constantin Cuciurean Developer ccuciurean@consultec.es MCSA: SQL Server 2012 MCSD: Web Applications
  • 3. Índice 1. Introducción 1. ¿Qué no es Big Data? 2. Situación actual 3. ¿Y entonces qué es Big Data exactamente? 4. Las 3 Vs de Big Data 5. Retos actuales 2. Big Data llevado a la práctica 1. Utilidades 2. Ejemplo real: Walmart 3. ¿Qué mueve Big Data? 1. Características Técnicas 2. Software 3. Markets de Datos 4. Hadoop 5. Microsoft HDInsight 4. Demos
  • 4. www.consultec.es Introducción “Big Data” es desde hace dos o tres años una de las grandes tendencias dentro del mundo de la tecnología y del marketing, uno de esos “buzzwords” que en un momento dado empiezan a propagarse y aparecer por todo internet, las grandes empresas se interesan por ello, se crea una industria alrededor y, de repente, todo el mundo sabe lo que es Big Data. O no … BIG DATA
  • 5. www.consultec.es ¿Qué no es Big Data? Antes de empezar, lo primero es desengañarnos. • Big Data no es una base de datos enorme • Big Data no es un data warehouse enorme • Big Data no es una nueva forma de Business Intelligence • Big Data no es llevar las base de datos a la nube • …
  • 6. www.consultec.es Situación actual Bases de Datos Relacionales Bases de Datos Analíticas (Data Warehouse) Archivos (XML, Logs, …) ERP/CRM Redes Sociales Base de Datos NoSQL APIs Sensores RFID Información generada por apps móviles Y mucho más. Y lo que está por venir … Big Data GPS Internet de las Cosas Información generada por máquinas eMails
  • 7. www.consultec.es ¿Y entonces qué es Big Data exactamente? • Definiciones encontradas en internet • Información que tiene un orden de magnitud más grande de lo que estamos acostumbrados. • Información que es muy grande, se mueve muy rápido y no se ajusta a las estructuras de las base de datos actuales. • Es un conjunto de datos cuyo tamaño está más allá de la capacidad de la mayoría de los software utilizados para capturar, gestionar y procesar la información dentro de un lapso tolerable de tiempo.
  • 8. www.consultec.es Las 3 Vs de Big Data Volume: grandes volúmenes de información • Se está pasando de hablar en Gigabytes o Terabytes a tamaños de datos de Petabytes, Exabytes o Zettabytes. Volúmenes que se nos escapan.
  • 9. www.consultec.es Las 3 Vs de Big Data Variety: información de tipos muy diversos • Ya no solo tenemos información estructurada en Bases de Datos o Archivos. Ahora empezamos a tener información con tipos diferentes y totalmente desestructurada.
  • 10. www.consultec.es Las 3 Vs de Big Data Velocity: velocidad con la que se genera la información • La velocidad a la que se genera esta información hace imposible gestionarla con sistemas de base de datos convencionales. Las empresas y las personas ya no quieren estar al día, quieren “estar al segundo”.
  • 11. www.consultec.es Retos actuales • Dar sentido al gran volumen de datos • Necesitamos las herramientas adecuadas para dar sentido de la abrumadora cantidad de datos generados por la disminución de los costos de hardware y de las fuentes de datos “complejas”. • La comprensión de una variedad cada vez mayor de datos • Debemos poder analizar datos tanto relacionales como no relacionales. Más del 85% de los datos capturados son desestructurados. • Habilitación de análisis en tiempo real de los datos • Los nuevos generadores de datos (Twitter, Facebook, Apps, …) están produciendo volúmenes de datos sin precedentes y en tiempo real, lo que no se puede analizar eficazmente mediante procesos por lotes normales.
  • 12. www.consultec.es Utilidades Toma de decisiones El valor del Big Data no es la información, sino la nueva forma de toma de decisiones basada en evidencias y datos empíricos. Tomar decisiones en base a datos empíricos y tendencias Tomar decisiones en base a corazonadas, instinto o experiencias pasadas
  • 13. www.consultec.es Utilidades Experimentación Una vez recopilados los datos que nos interesan, la experimentación y la exploración de los mismos puede mostrarnos información que a primera vista nunca hubiésemos encontrado o que nunca se nos hubiese ocurrido buscar.
  • 14. www.consultec.es Utilidades Transparencia Compartir y hacer accesible grandes volúmenes de datos a las partes interesadas y de manera oportuna puede crear un enorme valor y aumentar la eficiencia.
  • 15. www.consultec.es Utilidades Innovación Permite crear nuevos productos y servicios, mejorar los existentes e, incluso, crear nuevos modelos de negocio.
  • 16. www.consultec.es Ejemplo real: Walmart • Walmart es una multinacional de grandes almacenes • Es la segunda mayor empresa del mundo por ingresos
  • 17. www.consultec.es Ejemplo real: Walmart • Algunos datos: • 200 millones de clientes a la semana • 10700 tiendas • 27 países • 2 millones de trabajadores • 1,5 millones de transacciones por hora • Varios Terabytes de información generada en tiempo real • Base de datos de 3 Petabytes
  • 18. www.consultec.es Ejemplo real: Walmart Guardando todas las compras de todos los clientes se dieron cuenta que en época de huracanes los Walmart de las zonas afectadas vendían más cajas de Pop-Tarts que en otras épocas. Se indicó a los gerentes de las tiendas que en esas épocas pusiesen los Pop-Tarts en la entrada de las tiendas. Resultado: Aumento extraordinario de las ventas ¿A quién se le hubiese ocurrido cruzar los datos de ventas con los datos meteorológicos o con los calendarios de huracanes?
  • 19. www.consultec.es Ejemplo real: Walmart Hanna twitea: “I love Salt!”. En unos segundos el Tweet llega a los sistemas de Walmart, se analiza y unos minutos más tarde le llega a una amiga suya el siguiente email: “Buenos días! Nos pediste que te avisásemos cuando fuese el cumpleaños de Hanna. Pues ya está aquí y acaba de tweetear algo bueno sobre la película “Salt” de Angelina Jolie. ¿Quieres regalarle algo relacionado con ello? Tenemos algunas sugerencias que hacerte …”
  • 20. www.consultec.es Ejemplo real: Walmart • Social Genome Base de conocimiento que captura entidades y relaciones del mundo social. Obtiene información de su base de datos, de otros datos tanto públicos como privados y de redes sociales. A partir de ahí identifican entidades “interesantes” y las relacionan entre sí, consiguiendo toda la información de la que son capaces. Es un sistema vivo, en constante evolución.
  • 21. www.consultec.es Ejemplo real: Walmart • Entidades: • Relaciones • Una persona interesada en un tema • Una persona que asiste a un evento • Un evento sobre un tema • Una asociación entre empresa y producto
  • 23. www.consultec.es Características Técnicas Arquitectura • Alta escalabilidad • Procesamiento paralelo • Baja latencia • Datos no estructurados y estructurados • NoSQL • By-pass de datos – Alta disponibilidad
  • 24. www.consultec.es Markets de Datos Además de las fuentes de datos que tengamos en nuestra organización: bases de datos, emails, logs, documentos, etc … Podemos acceder a grandes volúmenes de datos (Data Sets) en los markets. Hay gratuitos y de pago.
  • 25. www.consultec.es Hadoop • Es una plataforma diseñada para almacenar y analizar grandes volúmenes de datos de diferentes tipos. Basada en Google Map/Reduce y Google Filesystem. • Map/Reduce: • Map: recoger los datos, estructurarlos, extraer la información interesante, etc … para poder trabajar con ellos. Los trabajos se distribuyen en los nodos para procesarse paralelamente. • Reduce: combina la información generada en los Map. • HDFS (Hadoop Distributed File System): • Sistema de archivos distribuidos, con replicación automática y optimizado para lectura. Cada fichero se particiona y se distribuye en todos los servidores.
  • 26. www.consultec.es Hadoop • Otros proyectos alrededor de Hadoop • Hive: Data Warehouse sobre Hadoop con lenguaje HiveQL (“SQL”). • Pig: Lenguaje de script para consulta y análisis de la información. Desarrollado por Yahoo!. • Sqoop: Framework para la integración de bases de datos relacionales con Hadoop • Flume: Servicio para recolectar, agregar y mover grandes volúmenes de datos de eventos/logs y streaming. • …
  • 27. www.consultec.es Microsoft HDInsight • Servicio basado en Hadoop. • Dos versiones: • Windows Azure HDInsight (on-demand) • HDInsight Server (on-premise)
  • 28. www.consultec.es Microsoft HDInsight • Acceso a todo tipo de usuarios, incluidos desarrolladores y profesionales IT. Fácil instalación, administración y configuración. • Integración con herramientas conocidas como Excel, PowerPivot, PowerView, SQL Server Analysis Services o Reporting Services. • .NET SDK para Hadoop (a través e NuGet): • Map/Reduce • LINQ to Hive • WebHDFS Client
  • 30. www.consultec.es ¿Dudas? Gorka Armentia Developer garmentia@consultec.es @joruus MCSA: SQL Server 2012 MCSD: Application Lifecycle Management Constantin Cuciurean Developer ccuciurean@consultec.es MCSA: SQL Server 2012 MCSD: Web Applications