Este documento describe Azure SQL Datawarehouse, un almacén de datos relacional como servicio administrado por Microsoft que permite escalar el almacenamiento e infraestructura desde pequeñas hasta grandes cantidades de datos. Usa un motor de procesamiento paralelo masivo para distribuir los datos y la computación a través de nodos de control y proceso. Los datos se almacenan en Azure Blob storage para carga sin costos de procesamiento.
3. SQL Azure Datawarehouse
Saas
Azure
Public
Cloud
Office 365Office 365
AzureAzure
Un almacén de datos relacional como un servicio (PAAS), totalmente gestionado por Microsoft.
Soporta desde lo mas pequeña a lo mas grande de la data según la necesidad.
5. SQL Server
Analysis Services
SQL Server Database Engine
Microsoft SQL Server Integration Services
SQL Server Master Data Services
1011000110
SQL Server Data Quality
Services
Microsoft SQL Azure
and the Windows Azure
Marketplace
Microsoft SharePoint
Server
Microsoft PowerPivot
Technologies
Microsoft Excel
• Data Mining Add-In
• PowerPivot Add-In
• MDS Add-In
Power View
SQL Server
Reporting Services
Reports, KPIs, and Dashboards
DataWarehousingBusinessIntelligence
DataWarehouse On - Premiese
6. Arquitectura SQL Azure Datawarehouse
Nodo
De Control
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
SQL
DB
SQL
DB
SQL
DB
SQL
DB
Blob storage [WASB(S)]
Calculo
Escalamiento de calculo
arriba y abajo
(SLA <= 60 segundos).
Pausa, Detener, Comenzar.
Almacenar
Carga datos a WASB sin
costos de calculo.
Motor de Procesamiento
paralelo masivo(MPP)
Almacenamiento e
Infraestructura de Azure
100 DWU < > 000 DWU
Almacenamiento y calculo se junta, lo
que permite un verdadero servicio
elastico y carga para calculo y
almacenamiento.
Aplicacion o
conexion de
usuario
Carga de Datos
(SSIS, REST, OLE, ADO, ODBC,
WebHDFS, AZCopy, PS) DMS
DMS DMS DMS DMS
DMS(servicio de
movimiento de
datos) se ejecuta en
todos los nodos de
la base de datos.
7. Azure SQL Data Warehouse – Nodo de Control
Nodo
De Control
SQL
DB
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
SQL
DB
SQL
DB
SQL
DB
SQL
DB
Blob storage [WASB(S)]
Motor de Procesamiento
paralelo masivo(MPP)
HDInsight
Nodo
De Control
SQL DB
• Terminales para Conexión
• Regular Puerto SQL(TCP 1433)
• Persiste no hay dato
usuario(solo metadata)
• Coordina la actividad de calculo
usando MPP.
8. Azure SQL Data Warehouse – Nodos de Proceso
Nodo
De Control
SQL
DB
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
SQL
DB
SQL
DB
SQL
DB
SQL
DB
Blob storage [WASB(S)]
Motor de Procesamiento
paralelo masivo(MPP)
Nodos
De Procesos
Azure SQL Database
SQL DB
Un incremento de DWU
aumentara el numero de
nodos computacionales.
9. Azure SQL Data Warehouse – Blob storage
Nodo
De Control
SQL
DB
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
Nodo
De Proceso
SQL
DB
SQL
DB
SQL
DB
SQL
DB
Blob storage [WASB(S)]
Motor de Procesamiento
paralelo masivo(MPP)
• Almacenamiento RA-GRS
• +PBs de
Almacenamiento
• Recopila datos sin
incurrir costos de
proceso