Expert Day 2013 - Trabaja al tope con tus datos BIG DATA

TRABAJA AL TOPE CON TUS DATOS: BIG DATA
Julio Avellaneda

John Alexander Bulla Torres

Twitter
Blog

Twitter
@JohnBulla
Blog
http://bit.ly/johnbulla
Linkedin http://www.linkedin.com/in/johnbulla

MVP ASP.NET/IIS
Core Group BDotNet
MCT | MCSD | MCTS | MCP
@julitogtu
http://julitogtu.com

PASS – Regional Mentor Latin America
Director BDotNet
MCS | MCP | MCTS

@b_dotnet
@julitogtu
@johnbulla

http://www.facebook.com/ComunidadBDotNet

Big Data – La revolución en los datos

Los datos digitales crecerán

40x próxima década

En 2015, servicios de nube pública tendrán
de crecimiento neto en gasto de ti

46%

Qué es Big Data?

"Big data" es un término aplicado a
conjuntos de datos que superan la
capacidad del software habitual para
ser capturados, gestionados y
procesados en un tiempo razonable.

Qué es Big Data?
Big data es una colección de conjuntos de
datos tan grande y complejo que se vuelve
difícil para trabajar con el uso de
herramientas de gestión de base de datos
tradicionales. Las dificultades incluyen la
captura, almacenamiento, búsqueda,
intercambio, análisis y visualización.
Fuente: Eduardo Castro MVP – SQL Saturday #247 Bogotá

Qué es Big Data?
Big Data: “ Barreras para que una
organización o equipo puedan
almacenar, procesar y acceder todos los
datos que necesitan para operar con
eficiencia, tomar decisiones, reducir
riesgos, etc.”
Fuente: SolidQ

Las 4 V’s
Volumen
Velocidad
Variedad
Variabilidad

Ejemplos de Big Data
12 Tb
día

21 Pb
Hadoop
cluster

7 Pb
mes

1 Tb

7 Tb

tweets/dia

datos/dia

75
Million

4 Billion

scores/day

14 Tb
Hadoop
cluster

Graph
edg/day

Escenarios de Business Analytics
• Análisis sencillo de gran cantidad de datos no estructurados:
Microsoft HDInsight
• Análisis sencillo de datos en memoria: Microsoft StreamInsight
• Análisis en profundidad: SQL Server y Self-Service BI

¿Qué es Hadoop?
• Plataforma de almacenamiento de datos y análisis para Big
Data
• Open Source
• Optimizado para manejar
• Datos masivos a través de paralelismo
• Variedad de datos (Estructurados, No-estructurados, Menos
estructurados)
• Uso de hardware económico
• No para OLTP / OLAP

Hadoop - Ventajas
Escalable

Escala linealmente en capacidad de almacenamiento y
computación

Tolerante a Fallos

Proporcionado por el Sistema de ficheros distribuido y el
framework de lectura

Procesamiento distribuido

Sigue la estrategia de divide y vencerás

HDInsight
• Project Isotope
• Proporciona Apache Hadoop en
• Windows Server
• Windows Azure
• Active Directory & System Center

HDInsight

Mahout

Pegasus
Pig

Flume

Hive

Hive ODBC

Map Reduce
HDFS

Sqoop

Windows Azure & Windows Server

JDBC

Microsoft
BI
Platform

Explorando datos no-relacionales
Hadoop cluster en HDP para Windows y HDInsight
Windows Azure



Gestión de datos no-relacionels



Basado 100% Apache



Simplicidad de gestión en Windows



Traer Hadoop para software, appliance,
cloud

Demo

HDInsight en Windows Azure

ExpertDay
http://expertday.org

Julio Avellaneda
MVP ASP.NET/IIS
Core Group BDotNet
MCT | MCSD | MCTS | MCP

John Alexander Bulla Torres

Twitter
Blog

Twitter
@JohnBulla
Blog
http://bit.ly/johnbulla
Linkedin http://www.linkedin.com/in/johnbulla

@julitogtu
http://julitogtu.com

PASS – Regional Mentor Latin America
Director BDotNet
MCS | MCP | MCTS

Muchas Gracias

Expert Day 2013 - Trabaja al tope con tus datos BIG DATA

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Expert Day 2013 - Trabaja al tope con tus datos BIG DATA

Similar a Expert Day 2013 - Trabaja al tope con tus datos BIG DATA (20)

Más de John Bulla

Más de John Bulla (20)

Último

Último (20)

Expert Day 2013 - Trabaja al tope con tus datos BIG DATA