Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
1. TRABAJA AL TOPE CON TUS DATOS: BIG DATA
Julio Avellaneda
John Alexander Bulla Torres
Twitter
Blog
Twitter
@JohnBulla
Blog
http://bit.ly/johnbulla
Linkedin http://www.linkedin.com/in/johnbulla
MVP ASP.NET/IIS
Core Group BDotNet
MCT | MCSD | MCTS | MCP
@julitogtu
http://julitogtu.com
PASS – Regional Mentor Latin America
Director BDotNet
MCS | MCP | MCTS
7. Big Data – La revolución en los datos
Los datos digitales crecerán
40x próxima década
En 2015, servicios de nube pública tendrán
de crecimiento neto en gasto de ti
46%
8. Qué es Big Data?
"Big data" es un término aplicado a
conjuntos de datos que superan la
capacidad del software habitual para
ser capturados, gestionados y
procesados en un tiempo razonable.
9. Qué es Big Data?
Big data es una colección de conjuntos de
datos tan grande y complejo que se vuelve
difícil para trabajar con el uso de
herramientas de gestión de base de datos
tradicionales. Las dificultades incluyen la
captura, almacenamiento, búsqueda,
intercambio, análisis y visualización.
Fuente: Eduardo Castro MVP – SQL Saturday #247 Bogotá
10. Qué es Big Data?
Big Data: “ Barreras para que una
organización o equipo puedan
almacenar, procesar y acceder todos los
datos que necesitan para operar con
eficiencia, tomar decisiones, reducir
riesgos, etc.”
Fuente: SolidQ
12. Ejemplos de Big Data
12 Tb
día
21 Pb
Hadoop
cluster
7 Pb
mes
1 Tb
7 Tb
tweets/dia
datos/dia
75
Million
4 Billion
scores/day
14 Tb
Hadoop
cluster
Graph
edg/day
13. Escenarios de Business Analytics
• Análisis sencillo de gran cantidad de datos no estructurados:
Microsoft HDInsight
• Análisis sencillo de datos en memoria: Microsoft StreamInsight
• Análisis en profundidad: SQL Server y Self-Service BI
14. ¿Qué es Hadoop?
• Plataforma de almacenamiento de datos y análisis para Big
Data
• Open Source
• Optimizado para manejar
• Datos masivos a través de paralelismo
• Variedad de datos (Estructurados, No-estructurados, Menos
estructurados)
• Uso de hardware económico
• No para OLTP / OLAP
15. Hadoop - Ventajas
Escalable
Escala linealmente en capacidad de almacenamiento y
computación
Tolerante a Fallos
Proporcionado por el Sistema de ficheros distribuido y el
framework de lectura
Procesamiento distribuido
Sigue la estrategia de divide y vencerás
16. HDInsight
• Project Isotope
• Proporciona Apache Hadoop en
• Windows Server
• Windows Azure
• Active Directory & System Center
18. Explorando datos no-relacionales
Hadoop cluster en HDP para Windows y HDInsight
Windows Azure
Gestión de datos no-relacionels
Basado 100% Apache
Simplicidad de gestión en Windows
Traer Hadoop para software, appliance,
cloud
30. Julio Avellaneda
MVP ASP.NET/IIS
Core Group BDotNet
MCT | MCSD | MCTS | MCP
John Alexander Bulla Torres
Twitter
Blog
Twitter
@JohnBulla
Blog
http://bit.ly/johnbulla
Linkedin http://www.linkedin.com/in/johnbulla
@julitogtu
http://julitogtu.com
PASS – Regional Mentor Latin America
Director BDotNet
MCS | MCP | MCTS
Muchas Gracias