SlideShare una empresa de Scribd logo
1 de 27
¿Listos? ... Data Warehousing en la Nube
Raúl Saráchaga, Business Intelligence Consultant at Kaits Consulting
Raúl Saráchaga
Biografía
Consultor en Business Intelligence y Analytics en Kaits Consulting
Database Administrator
Instructor para Cursos de Certificación Microsoft.
Speaker en eventos organizados por PASS, Power BI User Group Lima, Perú BI
& Analytics Group
https://www.facebook.com/
aprendebi/
@raulsarachaga
aprendebi.wordpress.com
Certificaciones
Agenda
03 AZURE DATA WAREHOUSE
Guía donde aprenderá las principales características de este servicio PaaS
02 DATA WAREHOUSE EN LA NUBE
Explorar como se llevarían arquitecturas en la nube con servicios PaaS
01 DATA WAREHOUSE TRADICIONAL
Un breve repaso de como se implementan soluciones de BI
04 CONSIDERACIONES
Algunas cosas que tenemos que tener en cuenta si queremos utilizar este servicio
05 TÚ PREGUNTAS..YO RESPONDO
Tú preguntas… Yo respondo
Visualización de
Datos
Acceso a DatosOn-premises Data
Sources
SQL Database
XLS / XLSX / CSV /
TXT / PBIX / +
Modelo
Semántico
Integración Almacenamiento
Data
Warehouse
Staging
Metadata
Arquitectura Tradicional de un DW
Acceso a Datos Visualización de
Datos
On-premises Data
Sources
CSV / TXT
Azure
Analysis Services
Metadata
Integración Almacenamiento
Azure SQL Data
Warehouse
Azure Data
Lake Store
Power BI
Excel
Azure SQL Data
Base
PolybaseAzure Data
Factory
Azure
Storage
Blob
Azure Data
Factory
Azure Data
Factory
Arquitectura de un DW en la Nube
On-premises Data
Modern BI & Analytics
 Se recomienda que los archivos de orígenes sean
archivos planos como .csv o .txt.
On-premises
Data Sources
Integración
Modern BI & Analytics
 Azure Data Lake Store:
 Almacenamiento optimizado para grandes
cargas de trabajo de análisis de datos
 Azure Storage Blob:
 Almacén de objetos de propósito general
para una amplia variedad de escenarios de
almacenamiento.
 Las tecnologías podría utilizarse como capas de
stage.
Integración
Azure Data
Lake Store
Azure
Storage
Blob
Almacenamiento
Modern BI & Analytics
 Azure Data Warehouse:
 Solución especializada para grandes
volúmenes de datos.
 Procesamiento MPP (Massively Parallel
Processing).
 Mejor tiempo de respuesta en el
procesamiento de datos.
 Puede encenderse o apagar el servicio para
reducción de costos.
Almacenamient
o
Azure SQL Data
Warehouse
Almacenamiento
Modern BI & Analytics
 Azure Analysis Services:
 Solución que tiene como base un motor
analítico de eficacia probada de Microsoft
SQL Server Analysis Services.
 Permite crear un modelo semántico con un
lenguaje más cercano al usuario final.
 Servicio especializado en la creación KPIs.
Acceso a Datos
Azure
Analysis Services
Acceso a Datos
Almacenamiento
Modern BI & Analytics
 Azure SQL Database:
 Base de Datos transaccional de Microsoft.
 Permite almacenar información de los distintos
procesos que con ejecutados durante el proceso
de ELT en la solución de Data Warehouse.
Metadata
Azure SQL Data
Base
MUÉSTRAME LA FUERZA DE AZURE DW
¿QUÉ TIPO DE SOLUCIÓN EN LA NUBE PODEMOS CREAR?
Saas
Azure
Public
Cloud
Office 365Office 365
AzureAzure
MEJORAR EL RENDIMIENTO EN SOLUCIONES DE BI
3 PUNTOS CLAVE SOBRE AZURE DW
Control
Node
Compute
Node
Compute
Node
Compute
Node
Compute
Node
SQL
DB
SQL
DB
SQL
DB
SQL
DB
Blob storage [WASB(S)]
Massively Parallel
Processing (MPP) Engine
Azure Infrastructure and
Storage
DMS
DMS DMS DMS DMS
Arquitectura MPP
Almacenamiento Azure
SQL Data Warehouse utiliza el almacenamiento de Azure para mantener sus datos de una
forma segura.
Los datos en sí están fragmentados en distribuciones para optimizar el rendimiento del
sistema.
SQL Data Warehouse admite las distribuciones:
• HASH
• ROUND ROBIN
• REPLICATE
Nodos
El nodo de control es el cerebro del Azure DW.
Es la interfaz que interactúa con todas las
aplicaciones y conexiones.
El motor MPP se ejecuta en el nodo Control para
optimizar y coordinar consultas paralelas.
Cuando se envía una consulta a SQL Data
Warehouse, el nodo Control la transforma en
consultas que se ejecutarán en paralelo.
Los nodos de computo proporcionan la potencia
computacional.
La cantidad de nodos de cómputo oscila entre 1 y
60, y está determinada por el nivel de
servicio(DWU).
Compute NodeControl Node
Distribuciones de Tablas
Para el tipo de distribución hash se necesita
elegir primero una columna, por la cual se le
indicará como deseamos que sea distribuida la
data.
Se recomienda de este tipo de distribución para
tablas del tipo Fact Tables
Todas la data es repartida aleatoriamente en
todas las distribuciones
Recomendado para base de datos staging
*Si no se indica el tipo de distribución en una
tabla, será distribuida por Round Robin.
Round RobinHash
Distribuciones de Tablas
Una tabla replicada tiene una copia completa de
la tabla accesible en cada nodo de computo.
La replicación de una tabla elimina la necesidad
de transferir datos entre los nodos computo
antes de una unión o agregación. Como la tabla
tiene varias copias, las tablas replicadas
funcionan mejor cuando el tamaño de la tabla es
inferior a 2 GB comprimidos.
Replicate
Nivel de Rendimiento
Separa las capas de cálculo y almacenamiento en
la arquitectura.
Esta opción se destaca en las cargas de trabajo
que pueden aprovechar al máximo la separación
entre cálculo y almacenamiento
Utiliza discos de estado sólido que mantiene los
datos accedidos con más frecuencia cerca de las
CPU, que es exactamente donde lo quiere
Optimized for ComputeOptimized for Elasticity
DWU100 DWU400 DWU1000 DWU2000
Nodos Control 1 1 1 1
Nodos Cómputo 1 4 10 20
Total # Distribuciones 60 60 60 60
Distribución/Nodo 60 15 6 3
Data Warehouse Units
¿Qué es un DWU?
Es una abstracción de :
 CPU
 Memoria
 IOPS
Nota: El valor mínimo es de 100 y el máximo de 6000
Desplegar un Azure DW
Portal Azure
Podemos hacer la creación por medio del portal de Azure
Power Shell
Necesitamos tener habilitados los módulos de Azure.
TSQL
Podemos lanzarlo el query desde Management Studio o Visual Studio 2013 (superior)
Índices en Azure DW
En SQL Data Warehouse los clustered
columnstore index son automaticamente creados
en una tabla.
Mejora el performance especialmente cuando se
realizan agregaciones.
Los índices cluster pueden superar a las tablas
columnstore cuando es necesario recuperar una
sola fila.
Para las consultas en las que se requiere una sola
o muy poca búsqueda de filas para obtener un
rendimiento con rapidez, considere un índice de
clúster o un índice nonclustered
Clustered and NonClustered IndexClustered Column Store Index
Es una característica ya
habilitada en Azure DW.
Tambien es soportado desde
SQL 2016.
Nos permite consumer datos
desde un repositorio de Big
Data ( Data Lake, Blob
Storage)
Es un Servicio de Azure, el
cual me permite mover
data de un repositorio a
otro. Me permite realizar
limpieza y
transformaciones
apoyandose en otras
tecnologías como USQL.
Es la herramienta ETL de
Microsoft. Tiene tasks
especiales para Azure DW,
pero se necesita tener
instalado el Azure Pack para
la version de Data Tools.
Actualmente estos tasks son
sorportados a partir de SQL
Data Tools 2010.
Migración de Datos
Polybase Azure Data Factory SSIS
Consideraciones
2 billones de tablas por base de
datos.
1024 columnas por tabla Un máximo de 8 060 bytes por
fila.
Columnas Primary Key, Foreign
Key no son soportados
Los collations a nivel de columna
si son soportados
Se recomienda utilizar la última
version de Management
Studio(17.x)
DEMO
Referencias
https://docs.microsoft.com/en-us/azure/sql-data-warehouse/
https://www.edx.org/es/course/delivering-data-warehouse-cloud-microsoft-dat220x-2
https://www.pluralsight.com/courses/azure-sql-data-warehouse-first-look
https://aprendebi.wordpress.com/category/azure-sql-data-warehouse/
¿DUDAS O
PREGUNTAS?
GRACIAS POR
PARTICIPAR

Más contenido relacionado

La actualidad más candente

Escalabilidad Analysis Services 2012
Escalabilidad Analysis Services 2012Escalabilidad Analysis Services 2012
Escalabilidad Analysis Services 2012Eduardo Castro
 
Data Amp 2017 - Whats New in SQL Server 2017
Data Amp 2017 - Whats New in SQL Server 2017Data Amp 2017 - Whats New in SQL Server 2017
Data Amp 2017 - Whats New in SQL Server 2017dbLearner
 
Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End jorge Muchaypiña
 
SQL Server Analysis Services
SQL Server Analysis ServicesSQL Server Analysis Services
SQL Server Analysis Servicesjorge Muchaypiña
 
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datos
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datosMS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datos
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datosJoseph Lopez
 
Sql azure data warehouse gab jorge muchaypina
Sql azure data warehouse gab   jorge muchaypinaSql azure data warehouse gab   jorge muchaypina
Sql azure data warehouse gab jorge muchaypinaMUG Perú
 
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineAplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineJoseph Lopez
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureSpanishPASSVC
 
Que hay de nuevo en SQL 2016 Analysis Services
Que hay de nuevo en SQL 2016 Analysis ServicesQue hay de nuevo en SQL 2016 Analysis Services
Que hay de nuevo en SQL 2016 Analysis ServicesEduardo Castro
 
Novedades SQL Server 2012 para desarrolladores
Novedades SQL Server 2012 para desarrolladoresNovedades SQL Server 2012 para desarrolladores
Novedades SQL Server 2012 para desarrolladoresEnrique Catala Bañuls
 
SQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de DatosSQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de DatosJoseph Lopez
 
Comparación entre microsoft sql server express edition 2012 y oracle
Comparación entre microsoft sql server express edition 2012 y oracleComparación entre microsoft sql server express edition 2012 y oracle
Comparación entre microsoft sql server express edition 2012 y oracleOsmar Zaragoza
 
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Joseph Lopez
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008Will Flores Soto
 
Introduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch DatabasesIntroduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch DatabasesEduardo Castro
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzureSpanishPASSVC
 
10 Tips ‘n’ Tricks for DBAs
10 Tips ‘n’ Tricks for DBAs10 Tips ‘n’ Tricks for DBAs
10 Tips ‘n’ Tricks for DBAsdbLearner
 
Novedades SQL Azure v12
Novedades SQL Azure v12Novedades SQL Azure v12
Novedades SQL Azure v12SolidQ
 

La actualidad más candente (20)

Escalabilidad Analysis Services 2012
Escalabilidad Analysis Services 2012Escalabilidad Analysis Services 2012
Escalabilidad Analysis Services 2012
 
Explorando los Sabores de Azure DW
Explorando los Sabores de Azure DWExplorando los Sabores de Azure DW
Explorando los Sabores de Azure DW
 
Data Amp 2017 - Whats New in SQL Server 2017
Data Amp 2017 - Whats New in SQL Server 2017Data Amp 2017 - Whats New in SQL Server 2017
Data Amp 2017 - Whats New in SQL Server 2017
 
Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End
 
SQL Server Analysis Services
SQL Server Analysis ServicesSQL Server Analysis Services
SQL Server Analysis Services
 
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datos
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datosMS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datos
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datos
 
Sql azure data warehouse gab jorge muchaypina
Sql azure data warehouse gab   jorge muchaypinaSql azure data warehouse gab   jorge muchaypina
Sql azure data warehouse gab jorge muchaypina
 
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineAplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y Azure
 
Que hay de nuevo en SQL 2016 Analysis Services
Que hay de nuevo en SQL 2016 Analysis ServicesQue hay de nuevo en SQL 2016 Analysis Services
Que hay de nuevo en SQL 2016 Analysis Services
 
Novedades SQL Server 2012 para desarrolladores
Novedades SQL Server 2012 para desarrolladoresNovedades SQL Server 2012 para desarrolladores
Novedades SQL Server 2012 para desarrolladores
 
SQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de DatosSQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de Datos
 
Comparación entre microsoft sql server express edition 2012 y oracle
Comparación entre microsoft sql server express edition 2012 y oracleComparación entre microsoft sql server express edition 2012 y oracle
Comparación entre microsoft sql server express edition 2012 y oracle
 
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008
 
Explorando los Sabores con Azure DW
Explorando los Sabores con Azure DWExplorando los Sabores con Azure DW
Explorando los Sabores con Azure DW
 
Introduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch DatabasesIntroduccion a SQL Server 2016 Stretch Databases
Introduccion a SQL Server 2016 Stretch Databases
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft Azure
 
10 Tips ‘n’ Tricks for DBAs
10 Tips ‘n’ Tricks for DBAs10 Tips ‘n’ Tricks for DBAs
10 Tips ‘n’ Tricks for DBAs
 
Novedades SQL Azure v12
Novedades SQL Azure v12Novedades SQL Azure v12
Novedades SQL Azure v12
 

Similar a Azure SQL Data Warehouse - 24 horas de PASS

Enterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudEnterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudRaul Martin Sarachaga Diaz
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryRaul Martin Sarachaga Diaz
 
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...SpanishPASSVC
 
Unidad 2. actividad 4
Unidad 2. actividad 4Unidad 2. actividad 4
Unidad 2. actividad 4melasa7
 
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negociosAzure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negociosJuan Alvarado
 
Lo nuevo de sql server 2008. madrigal
Lo nuevo de sql server 2008. madrigalLo nuevo de sql server 2008. madrigal
Lo nuevo de sql server 2008. madrigalmelasa7
 
Base de datos ventajas y desventajas
Base de datos ventajas y desventajasBase de datos ventajas y desventajas
Base de datos ventajas y desventajasMartin Macario
 

Similar a Azure SQL Data Warehouse - 24 horas de PASS (20)

Enterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudEnterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the Cloud
 
Explorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data FactoryExplorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data Factory
 
Azure DataFactory
Azure DataFactoryAzure DataFactory
Azure DataFactory
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data Factory
 
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
 
Base de datos
Base de datosBase de datos
Base de datos
 
Taller2
Taller2Taller2
Taller2
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Unidad 2. actividad 4
Unidad 2. actividad 4Unidad 2. actividad 4
Unidad 2. actividad 4
 
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negociosAzure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
 
Sql
SqlSql
Sql
 
Azure SQL Database
Azure SQL DatabaseAzure SQL Database
Azure SQL Database
 
Lo nuevo de sql server 2008. madrigal
Lo nuevo de sql server 2008. madrigalLo nuevo de sql server 2008. madrigal
Lo nuevo de sql server 2008. madrigal
 
Oracle vs. sql server terminado
Oracle vs. sql server   terminadoOracle vs. sql server   terminado
Oracle vs. sql server terminado
 
Exposicion_Terabyte.pptx
Exposicion_Terabyte.pptxExposicion_Terabyte.pptx
Exposicion_Terabyte.pptx
 
Oracle vs. sql server terminado
Oracle vs. sql server   terminadoOracle vs. sql server   terminado
Oracle vs. sql server terminado
 
Base de datos ventajas y desventajas
Base de datos ventajas y desventajasBase de datos ventajas y desventajas
Base de datos ventajas y desventajas
 
SQL Azure Datawarehouse
SQL Azure DatawarehouseSQL Azure Datawarehouse
SQL Azure Datawarehouse
 
Tipos de bases de datos
Tipos de bases de datosTipos de bases de datos
Tipos de bases de datos
 
Tipos de bases de datos
Tipos de bases de datosTipos de bases de datos
Tipos de bases de datos
 

Más de Raul Martin Sarachaga Diaz

Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Raul Martin Sarachaga Diaz
 

Más de Raul Martin Sarachaga Diaz (20)

Webinar_Data Integration en Alibaba Cloud.pdf
Webinar_Data Integration en Alibaba Cloud.pdfWebinar_Data Integration en Alibaba Cloud.pdf
Webinar_Data Integration en Alibaba Cloud.pdf
 
Data Modeling with Power BI
Data Modeling with Power BIData Modeling with Power BI
Data Modeling with Power BI
 
Modelo Tabulares con Azure SSAS
Modelo Tabulares con Azure SSASModelo Tabulares con Azure SSAS
Modelo Tabulares con Azure SSAS
 
Dashboards de Alto Impacto con Power BI
Dashboards de Alto Impacto con Power BIDashboards de Alto Impacto con Power BI
Dashboards de Alto Impacto con Power BI
 
Data Model with Power BI
Data Model with Power BIData Model with Power BI
Data Model with Power BI
 
DevOps SQL Server
DevOps SQL ServerDevOps SQL Server
DevOps SQL Server
 
Azure Data Lake
Azure Data LakeAzure Data Lake
Azure Data Lake
 
Azure SQL Databases para DBAs
Azure SQL Databases para DBAsAzure SQL Databases para DBAs
Azure SQL Databases para DBAs
 
Creacion de Cubos Tabulares en SSAS 2016
Creacion de Cubos Tabulares en SSAS 2016Creacion de Cubos Tabulares en SSAS 2016
Creacion de Cubos Tabulares en SSAS 2016
 
Data Modeling With Power BI
Data Modeling With Power BIData Modeling With Power BI
Data Modeling With Power BI
 
Explorando los Sabores de Power Query
Explorando los Sabores de Power QueryExplorando los Sabores de Power Query
Explorando los Sabores de Power Query
 
El Despertar de la Fuerza con SSRS 2016
El Despertar de la Fuerza con SSRS 2016El Despertar de la Fuerza con SSRS 2016
El Despertar de la Fuerza con SSRS 2016
 
Azure SQL Database para DBAs
Azure SQL Database para DBAsAzure SQL Database para DBAs
Azure SQL Database para DBAs
 
Tus Datos en la Nube con Azure SQL Database
Tus Datos en la Nube con Azure SQL DatabaseTus Datos en la Nube con Azure SQL Database
Tus Datos en la Nube con Azure SQL Database
 
Analisis de Sentimientos con Power BI
Analisis de Sentimientos con Power BIAnalisis de Sentimientos con Power BI
Analisis de Sentimientos con Power BI
 
Datos Siempre Actualizados con Power BI
Datos Siempre Actualizados con Power BIDatos Siempre Actualizados con Power BI
Datos Siempre Actualizados con Power BI
 
De 0 a 100 con Azure Machine Learning
De 0 a 100 con Azure Machine LearningDe 0 a 100 con Azure Machine Learning
De 0 a 100 con Azure Machine Learning
 
Introduccion Azure Machine Learning
Introduccion Azure Machine LearningIntroduccion Azure Machine Learning
Introduccion Azure Machine Learning
 
Explorando los Sabores de SSIS 2016
Explorando los Sabores de SSIS 2016Explorando los Sabores de SSIS 2016
Explorando los Sabores de SSIS 2016
 
Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016
 

Último

ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...JaquelineJuarez15
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 

Último (20)

ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sof
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 

Azure SQL Data Warehouse - 24 horas de PASS

  • 1. ¿Listos? ... Data Warehousing en la Nube Raúl Saráchaga, Business Intelligence Consultant at Kaits Consulting
  • 2. Raúl Saráchaga Biografía Consultor en Business Intelligence y Analytics en Kaits Consulting Database Administrator Instructor para Cursos de Certificación Microsoft. Speaker en eventos organizados por PASS, Power BI User Group Lima, Perú BI & Analytics Group https://www.facebook.com/ aprendebi/ @raulsarachaga aprendebi.wordpress.com Certificaciones
  • 3. Agenda 03 AZURE DATA WAREHOUSE Guía donde aprenderá las principales características de este servicio PaaS 02 DATA WAREHOUSE EN LA NUBE Explorar como se llevarían arquitecturas en la nube con servicios PaaS 01 DATA WAREHOUSE TRADICIONAL Un breve repaso de como se implementan soluciones de BI 04 CONSIDERACIONES Algunas cosas que tenemos que tener en cuenta si queremos utilizar este servicio 05 TÚ PREGUNTAS..YO RESPONDO Tú preguntas… Yo respondo
  • 4. Visualización de Datos Acceso a DatosOn-premises Data Sources SQL Database XLS / XLSX / CSV / TXT / PBIX / + Modelo Semántico Integración Almacenamiento Data Warehouse Staging Metadata Arquitectura Tradicional de un DW
  • 5. Acceso a Datos Visualización de Datos On-premises Data Sources CSV / TXT Azure Analysis Services Metadata Integración Almacenamiento Azure SQL Data Warehouse Azure Data Lake Store Power BI Excel Azure SQL Data Base PolybaseAzure Data Factory Azure Storage Blob Azure Data Factory Azure Data Factory Arquitectura de un DW en la Nube
  • 6. On-premises Data Modern BI & Analytics  Se recomienda que los archivos de orígenes sean archivos planos como .csv o .txt. On-premises Data Sources
  • 7. Integración Modern BI & Analytics  Azure Data Lake Store:  Almacenamiento optimizado para grandes cargas de trabajo de análisis de datos  Azure Storage Blob:  Almacén de objetos de propósito general para una amplia variedad de escenarios de almacenamiento.  Las tecnologías podría utilizarse como capas de stage. Integración Azure Data Lake Store Azure Storage Blob
  • 8. Almacenamiento Modern BI & Analytics  Azure Data Warehouse:  Solución especializada para grandes volúmenes de datos.  Procesamiento MPP (Massively Parallel Processing).  Mejor tiempo de respuesta en el procesamiento de datos.  Puede encenderse o apagar el servicio para reducción de costos. Almacenamient o Azure SQL Data Warehouse
  • 9. Almacenamiento Modern BI & Analytics  Azure Analysis Services:  Solución que tiene como base un motor analítico de eficacia probada de Microsoft SQL Server Analysis Services.  Permite crear un modelo semántico con un lenguaje más cercano al usuario final.  Servicio especializado en la creación KPIs. Acceso a Datos Azure Analysis Services
  • 10. Acceso a Datos Almacenamiento Modern BI & Analytics  Azure SQL Database:  Base de Datos transaccional de Microsoft.  Permite almacenar información de los distintos procesos que con ejecutados durante el proceso de ELT en la solución de Data Warehouse. Metadata Azure SQL Data Base
  • 11. MUÉSTRAME LA FUERZA DE AZURE DW ¿QUÉ TIPO DE SOLUCIÓN EN LA NUBE PODEMOS CREAR?
  • 12. Saas Azure Public Cloud Office 365Office 365 AzureAzure MEJORAR EL RENDIMIENTO EN SOLUCIONES DE BI 3 PUNTOS CLAVE SOBRE AZURE DW
  • 13. Control Node Compute Node Compute Node Compute Node Compute Node SQL DB SQL DB SQL DB SQL DB Blob storage [WASB(S)] Massively Parallel Processing (MPP) Engine Azure Infrastructure and Storage DMS DMS DMS DMS DMS Arquitectura MPP
  • 14. Almacenamiento Azure SQL Data Warehouse utiliza el almacenamiento de Azure para mantener sus datos de una forma segura. Los datos en sí están fragmentados en distribuciones para optimizar el rendimiento del sistema. SQL Data Warehouse admite las distribuciones: • HASH • ROUND ROBIN • REPLICATE
  • 15. Nodos El nodo de control es el cerebro del Azure DW. Es la interfaz que interactúa con todas las aplicaciones y conexiones. El motor MPP se ejecuta en el nodo Control para optimizar y coordinar consultas paralelas. Cuando se envía una consulta a SQL Data Warehouse, el nodo Control la transforma en consultas que se ejecutarán en paralelo. Los nodos de computo proporcionan la potencia computacional. La cantidad de nodos de cómputo oscila entre 1 y 60, y está determinada por el nivel de servicio(DWU). Compute NodeControl Node
  • 16. Distribuciones de Tablas Para el tipo de distribución hash se necesita elegir primero una columna, por la cual se le indicará como deseamos que sea distribuida la data. Se recomienda de este tipo de distribución para tablas del tipo Fact Tables Todas la data es repartida aleatoriamente en todas las distribuciones Recomendado para base de datos staging *Si no se indica el tipo de distribución en una tabla, será distribuida por Round Robin. Round RobinHash
  • 17. Distribuciones de Tablas Una tabla replicada tiene una copia completa de la tabla accesible en cada nodo de computo. La replicación de una tabla elimina la necesidad de transferir datos entre los nodos computo antes de una unión o agregación. Como la tabla tiene varias copias, las tablas replicadas funcionan mejor cuando el tamaño de la tabla es inferior a 2 GB comprimidos. Replicate
  • 18. Nivel de Rendimiento Separa las capas de cálculo y almacenamiento en la arquitectura. Esta opción se destaca en las cargas de trabajo que pueden aprovechar al máximo la separación entre cálculo y almacenamiento Utiliza discos de estado sólido que mantiene los datos accedidos con más frecuencia cerca de las CPU, que es exactamente donde lo quiere Optimized for ComputeOptimized for Elasticity
  • 19. DWU100 DWU400 DWU1000 DWU2000 Nodos Control 1 1 1 1 Nodos Cómputo 1 4 10 20 Total # Distribuciones 60 60 60 60 Distribución/Nodo 60 15 6 3 Data Warehouse Units ¿Qué es un DWU? Es una abstracción de :  CPU  Memoria  IOPS Nota: El valor mínimo es de 100 y el máximo de 6000
  • 20. Desplegar un Azure DW Portal Azure Podemos hacer la creación por medio del portal de Azure Power Shell Necesitamos tener habilitados los módulos de Azure. TSQL Podemos lanzarlo el query desde Management Studio o Visual Studio 2013 (superior)
  • 21. Índices en Azure DW En SQL Data Warehouse los clustered columnstore index son automaticamente creados en una tabla. Mejora el performance especialmente cuando se realizan agregaciones. Los índices cluster pueden superar a las tablas columnstore cuando es necesario recuperar una sola fila. Para las consultas en las que se requiere una sola o muy poca búsqueda de filas para obtener un rendimiento con rapidez, considere un índice de clúster o un índice nonclustered Clustered and NonClustered IndexClustered Column Store Index
  • 22. Es una característica ya habilitada en Azure DW. Tambien es soportado desde SQL 2016. Nos permite consumer datos desde un repositorio de Big Data ( Data Lake, Blob Storage) Es un Servicio de Azure, el cual me permite mover data de un repositorio a otro. Me permite realizar limpieza y transformaciones apoyandose en otras tecnologías como USQL. Es la herramienta ETL de Microsoft. Tiene tasks especiales para Azure DW, pero se necesita tener instalado el Azure Pack para la version de Data Tools. Actualmente estos tasks son sorportados a partir de SQL Data Tools 2010. Migración de Datos Polybase Azure Data Factory SSIS
  • 23. Consideraciones 2 billones de tablas por base de datos. 1024 columnas por tabla Un máximo de 8 060 bytes por fila. Columnas Primary Key, Foreign Key no son soportados Los collations a nivel de columna si son soportados Se recomienda utilizar la última version de Management Studio(17.x)
  • 24. DEMO

Notas del editor

  1. https://docs.microsoft.com/en-us/azure/sql-data-warehouse/massively-parallel-processing-mpp-architecture
  2. https://docs.microsoft.com/en-us/azure/sql-data-warehouse/massively-parallel-processing-mpp-architecture
  3. https://docs.microsoft.com/en-us/azure/sql-data-warehouse/massively-parallel-processing-mpp-architecture
  4. https://docs.microsoft.com/en-us/azure/sql-data-warehouse/performance-tiers