SlideShare una empresa de Scribd logo
1 de 34
Jorge Muchaypiña Gutierrez
Business Intelligence Specialist
MTA, MCP, MCSA, MCSE BI, CSM
Azure Data Lake
Azure
#GlobalAzure
Que es un Big Data?
"Big Data es como el sexo adolescente:
todos hablan acerca de ello, nadie sabe
realmente como hacerlo,
todos piensan que todos lo están haciendo,
por lo que todo el mundo dice que lo esta
haciendo“
Dan Ariely
#GlobalAzure
Volumen
#GlobalAzure
Exabyte
(EB)
1018
Petabyte (PB)
1015
Terabyte (TB)
1012
Zettabyte
(ZB)
1021
Volumen
#GlobalAzure
Velocidad
#GlobalAzure
Variedad
#GlobalAzure
The 3 Azure Data Lake Services
HDInsight Analytics Store
Clusters as a service Big data queries as a
service
Hyper-scale Storage
optimized for analytics
#GlobalAzure
Apache Hadoop
#GlobalAzure
Apache Hadoop
◦
◦
◦
HDFS
Name Node Data Nodes
Hadoop Cluster
#GlobalAzure
Map Reduce
• Estrategia divide y
vencerás:
• Map() – divider en problemas
más pequeños
• Reduce() – combinar los
resultados
………
Do work() Do work() Do work()
#GlobalAzure
• Infraestructura como un Servicio(IaaS)
 Hadoop en una VM
 Hortonworks
 Cloudera
 MapR
• Plataforma como un Servicio(PaaS)
 Azure HDInsight(Cluster as a Service)
 Azure Data Lake Store and Analytics
Big Data sobre Azure
#GlobalAzure
HDInsight
#GlobalAzure
Que es un Data Lake?
“Un simple almacenamiento de toda la
data...desde la data cruda(que implica una
copia exacta del origen de datos)
a los datos transformados que son usados de
varias formas incluyendo reportes,
visualizaciones, analítica y maquinas de
aprendizaje.”
#GlobalAzure
Azure Data Lake
Integrando, plataforma de Big Data Storage + Analytics
Diseñado de las experiencias del mundo real
 Office 365, Skype, Bing, etc.
Aprovechar tecnologías y habilidades existentes
Beneficios de un Servicio Local Azure
 Elasticidad, aprovisionando dinámicamente los recursos que necesitamos
 Capacidad de almacenamiento infinito
 Enfocado en extracción significante de la data, no en la infraestructura
#GlobalAzure
Built on Open-Source
#GlobalAzure
Azure Ecosystem Integration
#GlobalAzure
Azure Data Lake Store
HDFS como servicio
Almacenamiento durable
Una variedad de escenarios
◦ Alta Capacidad
◦ Alta Frecuencia
◦ Alto Rendimiento
Data se almacena en su formato nativo
◦ Formatos de almacenamiento estructurado, semiestructurado y no
estructurado
#GlobalAzure
Azure HDInsight
Administrado, nube escalable de Hadoop como un Servicio
Complemento complete de las tecnologías de Apache.
Spark, Storm, HBase, etc.
Se centran en consultas y datos, no infraestructura
Pagas por solo lo que necesitas usar
Aprovechar las herramientas existentes
◦ Hive, Pig, Sqoop, R, etc.
#GlobalAzure
Azure Data Lake Analytics
Complemento al ecosistema HDInsight y Hadoop.
Lo escalas dinámicamente para coincidir con complejidad de
tamaño y consulta de datos
Construido en Apache YARN
Unidad de interacción es un trabajo de análisis.
U-SQL: Lenguaje de consulta arraigada entre SQL y C#
#GlobalAzure
U-SQL
Basado en SQL y C#
◦ Tipos y expresiones C#
◦ Tablas, vistas, funciones de Windows.
◦ Funciones definidas por el usuario/operadores/agregaciones en C.
Trabajo típico
1. Leer la data de archivos/tabla/ origenes federados
2. Transforma las filas en un pipeline.
3. Filas de salida a tablas o filas.
#GlobalAzure #GABogota
@orders =
EXTRACT
OrderId int,
Customer string,
Date DateTime,
Amount float
FROM "/input/orders.txt"
USING Extractors.Tsv();
OUTPUT @orders
TO "/output/orders_copy.txt"
USING Outputters.Tsv();
Apply Schema on read
From a file in an ADL Store
Easy delimited text handling
Write out
Read the input, write it directly to output (just a simple copy)
Rowset
#GlobalAzure #GABogota
@customers =
SELECT Customer.ToUpper() AS Customer
FROM @orders
WHERE Customer.Contains("Contoso");
C# Expression
Transforming Rowsets
C# Expression
Use WHERE for filtering
#GlobalAzure #GABogota
@orders =
SELECT *
FROM @orders
WHERE Customer.Contains("Contoso");
Refining Rowsets
#GlobalAzure #GABogota
@rows =
SELECT
OrdersDB.Helpers.Normalize(Customer) AS Customer,
Amount AS Amount
FROM @orders;
Use your own helper
functions
Use Your own C# methods
#GlobalAzure #GABogota
@rows =
SELECT
Customer,
SUM(Amount) AS TotalAmount
FROM @orders
GROUP BY Customer;
Many other aggregations are
possible. You can define your
own aggregator with C#!
Grouping & Aggregation
#GlobalAzure #GABogota
@rows =
SELECT
Customer,
SUM(Amount) AS TotalAmount
FROM @orders
GROUP BY Customer
HAVING TotalAmount > 1000000;
HAVING filters the output of a
GROUP BY
Grouping & Aggregation (2)
#GlobalAzure
DECLARE values for later use
DECLARE @text1 string = "Hello World";
DECLARE @text2 string = @"Hello World";
DECLARE @text3 char = 'a';
DECLARE @text4 string = "BEGIN" + @text1 + "END";
DECLARE @text5 string = string.Format("BEGIN{0}END", @text1);
DECLARE @numeric1 sbyte = 0;
DECLARE @numeric2 short = 1;
DECLARE @numeric3 int = 2;
DECLARE @numeric4 long = 3L;
DECLARE @numeric5 float = 4.0f;
DECLARE @numeric6 double = 5.0;
DECLARE @d1 DateTime = System.DateTime.Parse("1979/03/31");
DECLARE @d2 DateTime = DateTime.Now;
DECLARE @misc1 bool = true;
DECLARE @misc2 Guid = System.Guid.Parse("BEF7A4E8-F583-4804-9711-7E608215EBA6");
DECLARE @misc4 byte [] = new byte[] { 0, 1, 2, 3, 4};
text
numeric
Date/time
Other
#GlobalAzure
Creating Constant Rowsets in Script
@departments =
SELECT * FROM
(VALUES
(31, "Sales"),
(33, "Engineering"),
(34, "Clerical"),
(35, "Marketing")
) AS
D( DepID, DepName );
#GlobalAzure
Sorting a rowset
@customers
SELECT *
FROM @customers
ORDER BY Amount ASC
FETCH FIRST 3 ROWS;
SELECT with ORDER BY
requires a FETCH FIRST!
#GlobalAzure
Sorting on OIUTPUT
OUTPUT @customers
TO @"/output.tsv"
ORDER BY Amount ASC
USING Outputters.Tsv();
#GlobalAzure
DEMO
Data Platform Day
#GlobalAzure
PREGUNTAS…
Data Platform Day
#GlobalAzure
Referencias:
MVA Iniciando con Big Data
https://mva.microsoft.com/es-es/training-courses/iniciando-con-big-data-16872?l=PumTmRs8C_6405192810
Big Data University
https://bigdatauniversity.com/
Microsoft Azure HDInsight Big Data Analyst - edx
https://www.edx.org/xseries/microsoft-azure-hdinsight-big-data-analyst
Processing Big Data with Hadoop in Azure - edx
https://www.edx.org/course/processing-big-data-hadoop-azure-microsoft-dat202-1x-0
#GlobalAzure
Muchas Gracias

Más contenido relacionado

La actualidad más candente

Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IUrko Zurutuza
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Stratebi
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack Guillermo Alvarado Mejía
 
CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosJohn Bulla
 

La actualidad más candente (9)

Azure Data Lake
Azure Data LakeAzure Data Lake
Azure Data Lake
 
Hadoop
HadoopHadoop
Hadoop
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack
 
Introducción a hadoop
Introducción a hadoopIntroducción a hadoop
Introducción a hadoop
 
Couch db
Couch dbCouch db
Couch db
 
CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datos
 

Similar a Global Azure Bootcamp - Jorge Muchaypiña G.

Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogotajorge Muchaypiña
 
IntroduccióN A Sql Server 2005
IntroduccióN A Sql Server 2005IntroduccióN A Sql Server 2005
IntroduccióN A Sql Server 2005oswchavez
 
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4Julián Castiblanco
 
Global Azure Latinoamérica 2021 - Power BI y Data Lake
Global Azure Latinoamérica 2021 - Power BI y Data LakeGlobal Azure Latinoamérica 2021 - Power BI y Data Lake
Global Azure Latinoamérica 2021 - Power BI y Data LakedbLearner
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryRaul Martin Sarachaga Diaz
 
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data science
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data scienceGAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data science
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data scienceAdrián Del Rincón López
 
Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL ServerEduardo Castro
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseJoseph Lopez
 
Herramienta de Almacén de Datos e Inteligencia de Reportes
Herramienta de Almacén de Datos e Inteligencia de ReportesHerramienta de Almacén de Datos e Inteligencia de Reportes
Herramienta de Almacén de Datos e Inteligencia de ReportesNicolás Pace
 
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nubeIndustria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nubeRodrigo Corral
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 

Similar a Global Azure Bootcamp - Jorge Muchaypiña G. (20)

Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogota
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
Azure data lake
Azure data lakeAzure data lake
Azure data lake
 
IntroduccióN A Sql Server 2005
IntroduccióN A Sql Server 2005IntroduccióN A Sql Server 2005
IntroduccióN A Sql Server 2005
 
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
 
Servicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWSServicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWS
 
BigData
BigDataBigData
BigData
 
Global Azure Latinoamérica 2021 - Power BI y Data Lake
Global Azure Latinoamérica 2021 - Power BI y Data LakeGlobal Azure Latinoamérica 2021 - Power BI y Data Lake
Global Azure Latinoamérica 2021 - Power BI y Data Lake
 
Azure DataFactory
Azure DataFactoryAzure DataFactory
Azure DataFactory
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data Factory
 
Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS
 
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data science
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data scienceGAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data science
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data science
 
Introducción a polybase en SQL Server
Introducción a polybase en SQL ServerIntroducción a polybase en SQL Server
Introducción a polybase en SQL Server
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
Herramienta de Almacén de Datos e Inteligencia de Reportes
Herramienta de Almacén de Datos e Inteligencia de ReportesHerramienta de Almacén de Datos e Inteligencia de Reportes
Herramienta de Almacén de Datos e Inteligencia de Reportes
 
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nubeIndustria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
 
Explorando los Sabores de Azure DW
Explorando los Sabores de Azure DWExplorando los Sabores de Azure DW
Explorando los Sabores de Azure DW
 
Taller 2
Taller 2Taller 2
Taller 2
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 

Más de jorge Muchaypiña

Azure days - Power BI Premium per User
Azure days - Power BI Premium per UserAzure days - Power BI Premium per User
Azure days - Power BI Premium per Userjorge Muchaypiña
 
Microsoft ignite 2021 data culture
Microsoft ignite 2021   data cultureMicrosoft ignite 2021   data culture
Microsoft ignite 2021 data culturejorge Muchaypiña
 
Businessintelligence vs businessanalytics
Businessintelligence vs businessanalyticsBusinessintelligence vs businessanalytics
Businessintelligence vs businessanalyticsjorge Muchaypiña
 
SQL Server Analysis Services
SQL Server Analysis ServicesSQL Server Analysis Services
SQL Server Analysis Servicesjorge Muchaypiña
 
Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End jorge Muchaypiña
 
Business intelligence vs business analytics
Business intelligence vs business analyticsBusiness intelligence vs business analytics
Business intelligence vs business analyticsjorge Muchaypiña
 
24 Horas Pass Spanish - minería de texto y análisis de sentimiento(cognitive...
24 Horas Pass Spanish -  minería de texto y análisis de sentimiento(cognitive...24 Horas Pass Spanish -  minería de texto y análisis de sentimiento(cognitive...
24 Horas Pass Spanish - minería de texto y análisis de sentimiento(cognitive...jorge Muchaypiña
 
SQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis ServicesSQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis Servicesjorge Muchaypiña
 
SQL Saturday Costa Rica BI - Text mining con r en power bi
SQL Saturday Costa Rica BI - Text mining con r en power biSQL Saturday Costa Rica BI - Text mining con r en power bi
SQL Saturday Costa Rica BI - Text mining con r en power bijorge Muchaypiña
 
Microsoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power biMicrosoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power bijorge Muchaypiña
 
Text Mining con R en PowerBI - Global Spanish
Text Mining con R en PowerBI -  Global Spanish Text Mining con R en PowerBI -  Global Spanish
Text Mining con R en PowerBI - Global Spanish jorge Muchaypiña
 
Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.jorge Muchaypiña
 
Text mining con r en power bi - Jorge Muchaypiña G.
Text mining con r en power bi - Jorge Muchaypiña G.Text mining con r en power bi - Jorge Muchaypiña G.
Text mining con r en power bi - Jorge Muchaypiña G.jorge Muchaypiña
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016jorge Muchaypiña
 
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...jorge Muchaypiña
 

Más de jorge Muchaypiña (18)

Azure days - Power BI Premium per User
Azure days - Power BI Premium per UserAzure days - Power BI Premium per User
Azure days - Power BI Premium per User
 
Microsoft ignite 2021 data culture
Microsoft ignite 2021   data cultureMicrosoft ignite 2021   data culture
Microsoft ignite 2021 data culture
 
Businessintelligence vs businessanalytics
Businessintelligence vs businessanalyticsBusinessintelligence vs businessanalytics
Businessintelligence vs businessanalytics
 
SQL Server Analysis Services
SQL Server Analysis ServicesSQL Server Analysis Services
SQL Server Analysis Services
 
Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End
 
Business intelligence vs business analytics
Business intelligence vs business analyticsBusiness intelligence vs business analytics
Business intelligence vs business analytics
 
24 Horas Pass Spanish - minería de texto y análisis de sentimiento(cognitive...
24 Horas Pass Spanish -  minería de texto y análisis de sentimiento(cognitive...24 Horas Pass Spanish -  minería de texto y análisis de sentimiento(cognitive...
24 Horas Pass Spanish - minería de texto y análisis de sentimiento(cognitive...
 
SQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis ServicesSQL Saturday Lima - Analysis Services
SQL Saturday Lima - Analysis Services
 
SQL Saturday Costa Rica BI - Text mining con r en power bi
SQL Saturday Costa Rica BI - Text mining con r en power biSQL Saturday Costa Rica BI - Text mining con r en power bi
SQL Saturday Costa Rica BI - Text mining con r en power bi
 
Microsoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power biMicrosoft flow integrado con sql server y power bi
Microsoft flow integrado con sql server y power bi
 
Introduccion a PowerBI
Introduccion a PowerBIIntroduccion a PowerBI
Introduccion a PowerBI
 
Text Mining con R en PowerBI - Global Spanish
Text Mining con R en PowerBI -  Global Spanish Text Mining con R en PowerBI -  Global Spanish
Text Mining con R en PowerBI - Global Spanish
 
Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.Stretch data base - Jorge Muchaypiña G.
Stretch data base - Jorge Muchaypiña G.
 
Text mining con r en power bi - Jorge Muchaypiña G.
Text mining con r en power bi - Jorge Muchaypiña G.Text mining con r en power bi - Jorge Muchaypiña G.
Text mining con r en power bi - Jorge Muchaypiña G.
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016
 
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
 
SQL Azure Datawarehouse
SQL Azure DatawarehouseSQL Azure Datawarehouse
SQL Azure Datawarehouse
 
Azure SQL Database
Azure SQL DatabaseAzure SQL Database
Azure SQL Database
 

Último

guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 

Último (16)

guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 

Global Azure Bootcamp - Jorge Muchaypiña G.

Notas del editor

  1. Key point here is that data can be stored in raw source form and then transformed as needed to support various use cases. Data can exist in binary, tabular, document, delimited text, etc. form. Not mentioned here is one of the key capabilities of ADL… the ability to federate data from external sources and query over it without explicit copying (which might be useful/necessary in situations involving sensitive or frequently changing data).
  2. Key points: ADL was not invented out of thin air… based on real-world experiences of real-world product teams at Microsoft Based on open-source technologies to which you can immediately apply existing skills like Pig, Hive, etc… AND/OR you can choose to opt into newer MS-specific offerings like U-SQL that offer unique features and potentially smaller learning curve ADL abstracts infrastructure so that your analytics storage and jobs scale with your needs… literally Big Data-as-a-service
  3. ADL Store can be used on its own (without ADL Analytics)… its just “HDFS-in-the-cloud” at its heart. Similarly ADL Analytics can be used without touching data in an ADL Store (to query storage blobs, or perhaps against federated SQL Databases). Of course, they work very well together and will typically be used together.
  4. Federate data from external sources - SQL Data Warehouse, SQL Database, IaaS-hosted SQL Server Move data into Data Lake Store - Azure Data Factory for ETL, Azure Stream Analytics for streaming data Power BI for query visualization Azure Data Catalog for data publishing and discovery Active Directory for user management and permissions
  5. Beyond ADL Analytics, ADL Store can work as a source data repository for HDInsight; there are plans to further integrate it with other standalone open-source technologies in the Hadoop ecosystem like Spark, Storm, etc.
  6. HDInsight is based on the popular Hortonworks Hadoop platform and provides a wide range of data storage and analysis capabilities, ranging from real-time stream processing to OLTP, predictive modeling, and interactive analytics. Like ADL Store and ADL Analytics, HDInsight abstracts away infrastructure configuration and management and lets you focus on core data analysis tasks like ingest, transformation, query, and visualization. It scales up or down automatically as data size and query complexity requires. HDInsight also supports both Windows and Linux cluster types, which maximizes opportunities to port existing code and skillsets.
  7. http://hortonworks.com/apache/yarn/ “YARN is the architectural center of Hadoop that allows multiple data processing engines such as interactive SQL, real-time streaming, data science and batch processing to handle data stored in a single platform, unlocking an entirely new approach to analytics.” From http://hadoop.apache.org/: “[YARN is] a framework for job scheduling and cluster resource management.” The above also happens to be a good abstract description of ADL Analytics… it schedules and manages jobs and the cluster of machines used to execute those jobs. In the case of ADL Analytics a “job” is a U-SQL query issued against one or more configured data sources.
  8. Good overview of U-SQL can be found here: http://usql.io/ “U-SQL is built on the learnings from Microsoft’s internal experience with SCOPE and existing languages such as T-SQL, ANSI SQL, and Hive. For example, we base our SQL and programming language integration and the execution and optimization framework for U-SQL on SCOPE, which currently runs hundred thousands of jobs each day internally. We also align the metadata system (databases, tables, etc.), the SQL syntax, and language semantics with T-SQL and ANSI SQL, the query languages most of our SQL Server customers are familiar with. And we use C# data types and the C# expression language so you can seamlessly write C# predicates and expressions inside SELECT statements and use C# to add your custom logic. Finally, we looked to Hive and other Big Data languages to identify patterns and data processing requirements and integrate them into our framework.”