Azure Spark - Big Data - Coresic 2016

Spark Big Data en Azure
HDInsight
MVP Nicolas Nakasone /
nicolas.nakasone@outlook.com/@nicolasnakasone

Big Data es sinónimo de
Grandes Cantidades de Datos
BIG DATA

BIG DATA
• ¿Cuánta data genera un vuelo comercial entre Londres
y Nueva York en dispositivos electrónicos?
• 640 TB

• ¿Cuántos USB Angry Bird necesitaremos para
almacenar BIG Data?

Tecnologia para Manejar Big Data

¿Qué es hadoop?
• Hadoop consiste de dos servicios principales:
• Almacenamiento de Datos usando el Hadoop Distributed File
System (HDFS)
• Procesamiento de Datos Paralelo de Alto Desempeño usando una
técnica llamada MapReduce.

Spark
• Trabaja en Memoria
• 100 x más rapido que Map Reduce
• Soporta Tolerancia a Fallos

Spark
• Spark SQL
• Spark Streaming
• Mlib (Machine Learning)
• GraphX

Jupiter
• Herramienta utilizada por los cientificos de datos
• Puede utilizar diferentes lenguajes de programacion
(Python, R, Julia, Scala)
• Integracion con Big Data - Spark

Demo – Spark en Acción
https://www.youtube.com/watch?v=fUmgd58Xe58

Azure Spark - Big Data - Coresic 2016

Azure Spark - Big Data - Coresic 2016

Más contenido relacionado

La actualidad más candente

Destacado

Similar a Azure Spark - Big Data - Coresic 2016

Más de nnakasone

Último

Azure Spark - Big Data - Coresic 2016