SlideShare una empresa de Scribd logo
1 de 16
Descargar para leer sin conexión
Delivering a Data
Warehouse in the
Cloud
(Azure SQL Data Warehouse)
Ahias Portillo
MVP en Plataforma de datos | Mentor en Primus Data
Agradecimiento a los patrocinadores
Gold
Silver
Geek
Agenda
• ¿Qué es?, ¿Como Funciona?, ¿Como lo
implemento?
• Demo
Nueva arquitectura BI basada en la Nube
Cuento de hadas de un Datawarehouse
¿Qué es Azure SQL Data Warehouse?
• Una plataforma como servicio en la nube de Azure.
• Procesamiento masivo en paralelo (MPP).
• Computación y almacenamiento distribuido.
• Escala hacia arriba y hacia abajo en unos minutos.
• Pausar de recursos, Ahorro.
• Admite un subconjunto de T-SQL.
• Join con datos externos como Azure Blob Storage / HDFS.
(SMP vs. MPP)
(SMP vs. MPP)
• Utiliza muchas CPU separadas en paralelo para ejecutar un solo programa.
• Nada compartido: cada CPU tiene su propia memoria y disco (escalamiento
horizontal).
• Los segmentos se comunican usando una red de alta velocidad entre nodos.
MPP - Massively
Parallel Processing
• Múltiples CPUs utilizadas para completar procesos individuales simultáneamente.
• Todas las CPU comparten la misma memoria, discos y controladores de red.
• Todas las implementaciones de SQL Server hasta ahora han sido SMP.
• En su mayoría, la solución se encuentra en una SAN compartida.
SMP - Symmetric
Multiprocessing
Arquitectura de Azure SQL DW
https://azure.microsoft.com/en-
us/documentation/articles/sql-data-
warehouse-overview-what-is
Dist_DB_1
Dist_DB_2
Dist_DB_15
…
Dist_DB_16
Dist_DB_17
Dist_DB_30
…
…
…
…
Dist_DB_46
Dist_DB_47
Dist_DB_60
…
Distribuciones
•Las bases de datos almacenan una o mas tablas de forma
distribuida.
•Los datos se almacenan en 60 bases, las cuales pueden
estar en nodos diferentes.
•Los datos pueden ser distribuidos por medio de Hash.
•Los datos pueden ser distribuidos por medio de Round-
Robin.
Distribución por HASH
•Divide los datos basado en un algoritmo de hashing.
•Un mismo valor siempre genera un hash de distribución igual.
•Rendimiento para tablas muy grandes.
•Puede existir problemas para tablas con valores de alta frecuencia.
Distribución por Round-Robin
•Los datos se distribuyen de manera uniforme entre los
nodos.
•Mas fácil de implementar, no es necesario saber nada
sobre los datos.
•Útil para dimensiones y hechos que no poseen una buena
columna de distribución por hash.
•Se incurrirá en más movimiento de datos cuando se
realicen los querys.
Control
ComputeStorage
Distribución de queries
Data Warehouse Units (DWUs)
•Los DWU indican los recursos CPU, memoria e IOPS, que se asignan
a la instancia de Azure SQL DW.
•DWU 100 – 6000.
•¿Cuántos nodos de cómputo usa tu instancia?.
•Cuántas consultas simultáneas puede ejecutar su instancia.
•Cuantos procesos en paralelo.
•El límite de tamaño de las transacciones.
DEMO
¿Preguntas?

Más contenido relacionado

La actualidad más candente

Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End jorge Muchaypiña
 
Azure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_anguloAzure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_anguloAdrian Miranda
 
Bases de datos
Bases de datosBases de datos
Bases de datoslu_pis
 
Act4 basesdedatos oscar_varona
Act4 basesdedatos oscar_varonaAct4 basesdedatos oscar_varona
Act4 basesdedatos oscar_varonaOscar Varona
 
No sql la nueva era
No sql la nueva eraNo sql la nueva era
No sql la nueva eraJuan Navas
 
Big table por Matias tesoriero
Big table por Matias tesorieroBig table por Matias tesoriero
Big table por Matias tesorieromtesoriero
 
Apache Cassandra - Base de datos
Apache Cassandra - Base de datosApache Cassandra - Base de datos
Apache Cassandra - Base de datosZteeven Zalinas
 
Optimización de aplicaciones web con base de datos NoSQL In-Memory
Optimización de aplicaciones web con base de datos NoSQL In-MemoryOptimización de aplicaciones web con base de datos NoSQL In-Memory
Optimización de aplicaciones web con base de datos NoSQL In-MemoryGonzalo Chacaltana
 
Manual apache cassandra y comandos en la shell
Manual apache cassandra y comandos en la shellManual apache cassandra y comandos en la shell
Manual apache cassandra y comandos en la shellKevin López
 

La actualidad más candente (20)

NoSQL Cassandra
NoSQL CassandraNoSQL Cassandra
NoSQL Cassandra
 
Global azure bootcamp SQL Azure End to End
Global azure bootcamp   SQL Azure End to End Global azure bootcamp   SQL Azure End to End
Global azure bootcamp SQL Azure End to End
 
Exadata ejecutivo
Exadata ejecutivoExadata ejecutivo
Exadata ejecutivo
 
BI en Sql Server 2014
BI en Sql Server 2014BI en Sql Server 2014
BI en Sql Server 2014
 
Panorama BigData (OpenExpo2017)
Panorama BigData (OpenExpo2017)Panorama BigData (OpenExpo2017)
Panorama BigData (OpenExpo2017)
 
Azure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_anguloAzure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_angulo
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Act4 basesdedatos oscar_varona
Act4 basesdedatos oscar_varonaAct4 basesdedatos oscar_varona
Act4 basesdedatos oscar_varona
 
Hypertable ld
Hypertable ldHypertable ld
Hypertable ld
 
No sql la nueva era
No sql la nueva eraNo sql la nueva era
No sql la nueva era
 
Virtualizacion
VirtualizacionVirtualizacion
Virtualizacion
 
Base de datos
Base de datos Base de datos
Base de datos
 
Devops Madrid Marzo - Caso de uso en AWS
Devops Madrid Marzo - Caso de uso en AWSDevops Madrid Marzo - Caso de uso en AWS
Devops Madrid Marzo - Caso de uso en AWS
 
Big table por Matias tesoriero
Big table por Matias tesorieroBig table por Matias tesoriero
Big table por Matias tesoriero
 
MongoDB - Madrid Devops Febrero
MongoDB - Madrid Devops FebreroMongoDB - Madrid Devops Febrero
MongoDB - Madrid Devops Febrero
 
Apache Cassandra - Base de datos
Apache Cassandra - Base de datosApache Cassandra - Base de datos
Apache Cassandra - Base de datos
 
Kascuter & co
Kascuter & coKascuter & co
Kascuter & co
 
Optimización de aplicaciones web con base de datos NoSQL In-Memory
Optimización de aplicaciones web con base de datos NoSQL In-MemoryOptimización de aplicaciones web con base de datos NoSQL In-Memory
Optimización de aplicaciones web con base de datos NoSQL In-Memory
 
Manual apache cassandra y comandos en la shell
Manual apache cassandra y comandos en la shellManual apache cassandra y comandos en la shell
Manual apache cassandra y comandos en la shell
 
MongoDB: la BBDD NoSQL más popular del mercado
MongoDB: la BBDD NoSQL más popular del mercadoMongoDB: la BBDD NoSQL más popular del mercado
MongoDB: la BBDD NoSQL más popular del mercado
 

Similar a Delivering a Data Warehouse in the Cloud with Azure SQL DW

Similar a Delivering a Data Warehouse in the Cloud with Azure SQL DW (20)

Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
Principales bases de datos
Principales bases de datosPrincipales bases de datos
Principales bases de datos
 
Polybase
PolybasePolybase
Polybase
 
Base de dato
Base de  dato Base de  dato
Base de dato
 
Base de dato act4
Base de  dato act4Base de  dato act4
Base de dato act4
 
Topicos de adm modificado
Topicos de adm modificadoTopicos de adm modificado
Topicos de adm modificado
 
Base de datos
Base de datosBase de datos
Base de datos
 
Principales bases de datos
Principales bases de datosPrincipales bases de datos
Principales bases de datos
 
Base de datos
Base de datos Base de datos
Base de datos
 
Presentacion
PresentacionPresentacion
Presentacion
 
Base de datos
Base de datosBase de datos
Base de datos
 
Act4 base de_datos_canto_josé
Act4 base de_datos_canto_joséAct4 base de_datos_canto_josé
Act4 base de_datos_canto_josé
 
Explorando los Sabores con Azure DW
Explorando los Sabores con Azure DWExplorando los Sabores con Azure DW
Explorando los Sabores con Azure DW
 
Introducción Azure Synapse Analytics
Introducción Azure Synapse AnalyticsIntroducción Azure Synapse Analytics
Introducción Azure Synapse Analytics
 
Base de Datos
Base de DatosBase de Datos
Base de Datos
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos CBTis 75
Base de datos CBTis 75Base de datos CBTis 75
Base de datos CBTis 75
 
Base de datos
Base de datos Base de datos
Base de datos
 

Más de JOSE AHIAS LOPEZ PORTILLO

Mi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning StudioMi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning StudioJOSE AHIAS LOPEZ PORTILLO
 
01 - DAX de principiante a experto con Power BI: Introducción a DAX
01 - DAX de principiante a experto con Power BI: Introducción a DAX01 - DAX de principiante a experto con Power BI: Introducción a DAX
01 - DAX de principiante a experto con Power BI: Introducción a DAXJOSE AHIAS LOPEZ PORTILLO
 
Instalación de Sql Server 2019 On-Premises.
Instalación de Sql Server 2019 On-Premises.Instalación de Sql Server 2019 On-Premises.
Instalación de Sql Server 2019 On-Premises.JOSE AHIAS LOPEZ PORTILLO
 
Mi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logísticaMi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logísticaJOSE AHIAS LOPEZ PORTILLO
 
70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_Introducción
70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_Introducción70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_Introducción
70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_IntroducciónJOSE AHIAS LOPEZ PORTILLO
 
Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01
Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01
Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01JOSE AHIAS LOPEZ PORTILLO
 
Introducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con MicrosoftIntroducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con MicrosoftJOSE AHIAS LOPEZ PORTILLO
 
Transformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivelTransformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivelJOSE AHIAS LOPEZ PORTILLO
 
Sql Saturday Guatemala 2018-Mas rápido y Mas Furioso Windowing Functions & Co...
Sql Saturday Guatemala 2018-Mas rápido y Mas FuriosoWindowing Functions & Co...Sql Saturday Guatemala 2018-Mas rápido y Mas FuriosoWindowing Functions & Co...
Sql Saturday Guatemala 2018-Mas rápido y Mas Furioso Windowing Functions & Co...JOSE AHIAS LOPEZ PORTILLO
 
Fast and Furious: Discovering Windowing Function
Fast and Furious: Discovering Windowing FunctionFast and Furious: Discovering Windowing Function
Fast and Furious: Discovering Windowing FunctionJOSE AHIAS LOPEZ PORTILLO
 
Sql Server - Troubleshooting De Bloqueos (Parte I)
Sql Server - Troubleshooting De Bloqueos (Parte I)Sql Server - Troubleshooting De Bloqueos (Parte I)
Sql Server - Troubleshooting De Bloqueos (Parte I)JOSE AHIAS LOPEZ PORTILLO
 
Sql Saturday CR - Introducción al Optimizador
Sql Saturday CR - Introducción al OptimizadorSql Saturday CR - Introducción al Optimizador
Sql Saturday CR - Introducción al OptimizadorJOSE AHIAS LOPEZ PORTILLO
 
Modelos de recuperación de desastre híbridos (On premise / Cloud)
Modelos de recuperación de desastre híbridos (On premise / Cloud)Modelos de recuperación de desastre híbridos (On premise / Cloud)
Modelos de recuperación de desastre híbridos (On premise / Cloud)JOSE AHIAS LOPEZ PORTILLO
 
SQLSaturday Guatemala - SOS de Alto de rendimiento con Window Functions
SQLSaturday Guatemala - SOS de Alto de rendimiento con Window FunctionsSQLSaturday Guatemala - SOS de Alto de rendimiento con Window Functions
SQLSaturday Guatemala - SOS de Alto de rendimiento con Window FunctionsJOSE AHIAS LOPEZ PORTILLO
 
Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014JOSE AHIAS LOPEZ PORTILLO
 

Más de JOSE AHIAS LOPEZ PORTILLO (20)

Mi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning StudioMi primer modelo de clasificación con Azure Machine Learning Studio
Mi primer modelo de clasificación con Azure Machine Learning Studio
 
002 - Introducción a DAX
002 - Introducción a DAX002 - Introducción a DAX
002 - Introducción a DAX
 
01 - DAX de principiante a experto con Power BI: Introducción a DAX
01 - DAX de principiante a experto con Power BI: Introducción a DAX01 - DAX de principiante a experto con Power BI: Introducción a DAX
01 - DAX de principiante a experto con Power BI: Introducción a DAX
 
Instalación de Sql Server 2019 On-Premises.
Instalación de Sql Server 2019 On-Premises.Instalación de Sql Server 2019 On-Premises.
Instalación de Sql Server 2019 On-Premises.
 
Mi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logísticaMi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logística
 
70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_Introducción
70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_Introducción70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_Introducción
70-761 Consultas de datos con Transact-SQL(SQL Server 2019)_Introducción
 
Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01
Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01
Exam 70-761 Querying Data with Transact-SQL: Ambiente parte 01
 
Introducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con MicrosoftIntroducción a Ciencia de datos con Microsoft
Introducción a Ciencia de datos con Microsoft
 
Dax paso a paso con Power BI
Dax paso a paso con Power BIDax paso a paso con Power BI
Dax paso a paso con Power BI
 
Transformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivelTransformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivel
 
Sql Saturday Guatemala 2018-Mas rápido y Mas Furioso Windowing Functions & Co...
Sql Saturday Guatemala 2018-Mas rápido y Mas FuriosoWindowing Functions & Co...Sql Saturday Guatemala 2018-Mas rápido y Mas FuriosoWindowing Functions & Co...
Sql Saturday Guatemala 2018-Mas rápido y Mas Furioso Windowing Functions & Co...
 
Fast and Furious: Discovering Windowing Function
Fast and Furious: Discovering Windowing FunctionFast and Furious: Discovering Windowing Function
Fast and Furious: Discovering Windowing Function
 
Sql Server - Troubleshooting De Bloqueos (Parte I)
Sql Server - Troubleshooting De Bloqueos (Parte I)Sql Server - Troubleshooting De Bloqueos (Parte I)
Sql Server - Troubleshooting De Bloqueos (Parte I)
 
Preguntando a sql server con DMV
Preguntando a sql server con DMVPreguntando a sql server con DMV
Preguntando a sql server con DMV
 
Sql Saturday CR - Introducción al Optimizador
Sql Saturday CR - Introducción al OptimizadorSql Saturday CR - Introducción al Optimizador
Sql Saturday CR - Introducción al Optimizador
 
Modelos de recuperación de desastre híbridos (On premise / Cloud)
Modelos de recuperación de desastre híbridos (On premise / Cloud)Modelos de recuperación de desastre híbridos (On premise / Cloud)
Modelos de recuperación de desastre híbridos (On premise / Cloud)
 
BI para todos
BI para todosBI para todos
BI para todos
 
SQLSaturday Guatemala - SOS de Alto de rendimiento con Window Functions
SQLSaturday Guatemala - SOS de Alto de rendimiento con Window FunctionsSQLSaturday Guatemala - SOS de Alto de rendimiento con Window Functions
SQLSaturday Guatemala - SOS de Alto de rendimiento con Window Functions
 
Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014
 
Sql Saturday Costa Rica-SSAS Tabular Model
Sql Saturday Costa Rica-SSAS Tabular ModelSql Saturday Costa Rica-SSAS Tabular Model
Sql Saturday Costa Rica-SSAS Tabular Model
 

Delivering a Data Warehouse in the Cloud with Azure SQL DW

  • 1. Delivering a Data Warehouse in the Cloud (Azure SQL Data Warehouse) Ahias Portillo MVP en Plataforma de datos | Mentor en Primus Data
  • 2. Agradecimiento a los patrocinadores Gold Silver Geek
  • 3. Agenda • ¿Qué es?, ¿Como Funciona?, ¿Como lo implemento? • Demo
  • 4. Nueva arquitectura BI basada en la Nube
  • 5. Cuento de hadas de un Datawarehouse
  • 6. ¿Qué es Azure SQL Data Warehouse? • Una plataforma como servicio en la nube de Azure. • Procesamiento masivo en paralelo (MPP). • Computación y almacenamiento distribuido. • Escala hacia arriba y hacia abajo en unos minutos. • Pausar de recursos, Ahorro. • Admite un subconjunto de T-SQL. • Join con datos externos como Azure Blob Storage / HDFS.
  • 8. (SMP vs. MPP) • Utiliza muchas CPU separadas en paralelo para ejecutar un solo programa. • Nada compartido: cada CPU tiene su propia memoria y disco (escalamiento horizontal). • Los segmentos se comunican usando una red de alta velocidad entre nodos. MPP - Massively Parallel Processing • Múltiples CPUs utilizadas para completar procesos individuales simultáneamente. • Todas las CPU comparten la misma memoria, discos y controladores de red. • Todas las implementaciones de SQL Server hasta ahora han sido SMP. • En su mayoría, la solución se encuentra en una SAN compartida. SMP - Symmetric Multiprocessing
  • 9. Arquitectura de Azure SQL DW https://azure.microsoft.com/en- us/documentation/articles/sql-data- warehouse-overview-what-is Dist_DB_1 Dist_DB_2 Dist_DB_15 … Dist_DB_16 Dist_DB_17 Dist_DB_30 … … … … Dist_DB_46 Dist_DB_47 Dist_DB_60 …
  • 10. Distribuciones •Las bases de datos almacenan una o mas tablas de forma distribuida. •Los datos se almacenan en 60 bases, las cuales pueden estar en nodos diferentes. •Los datos pueden ser distribuidos por medio de Hash. •Los datos pueden ser distribuidos por medio de Round- Robin.
  • 11. Distribución por HASH •Divide los datos basado en un algoritmo de hashing. •Un mismo valor siempre genera un hash de distribución igual. •Rendimiento para tablas muy grandes. •Puede existir problemas para tablas con valores de alta frecuencia.
  • 12. Distribución por Round-Robin •Los datos se distribuyen de manera uniforme entre los nodos. •Mas fácil de implementar, no es necesario saber nada sobre los datos. •Útil para dimensiones y hechos que no poseen una buena columna de distribución por hash. •Se incurrirá en más movimiento de datos cuando se realicen los querys.
  • 14. Data Warehouse Units (DWUs) •Los DWU indican los recursos CPU, memoria e IOPS, que se asignan a la instancia de Azure SQL DW. •DWU 100 – 6000. •¿Cuántos nodos de cómputo usa tu instancia?. •Cuántas consultas simultáneas puede ejecutar su instancia. •Cuantos procesos en paralelo. •El límite de tamaño de las transacciones.
  • 15. DEMO