Adjunto la presentación de la charla dada el 17 de mayo como parte del Capitulo Virtual de Pass en español. Pronto podrán ver el video en el canal de YouTube. También los invito a visitar el canal de BILATAM también en YouTube, donde pueden encontrar más videos sobre Azure, BI y bases de datos en general.
1. SQL Data Warehouse desde cada ángulo
17 de Mayo 2017 (12 pm GMT -5)
Adrian Miranda
Resumen:
La sesión se enfocará en demostrar como
provisionar una base de datos SQL DW,
diseño de tablas y carga de datos, monitoreo
y consideraciones de administración, así
como la integración con Polybase y como
proteger los datos existentes.
Está por comenzar: Próximos Eventos
Moderador: Julian Castiblanco
SQL 2016 Basic Availability
Groups multisubnet failover
en Azure
24 de Mayo
Kenneth Ureña
2. Manténgase conectado a nosotros!
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
4. 4
Oportunidades de Voluntariado
PASS no pudiera existir sin personas apasionadas y
dedicadas de todas partes del mundo que dan de su
tiempo como voluntarios.
Se un voluntario ahora!!
Para identificar oportunidades locales visita
volunteer.sqlpass.org
Recuerda actualizar tu perfil en las secciones de
“MyVolunteering” y MyPASS para mas detalles.
6. SQL Data Warehouse desde cada ángulo
17 de Mayo de 2017
Adrián Miranda
Administrador de base de datos con mas de 14 años de experiencia en el modelaje, diseño e
implementación de soluciones de datos. Amplia trayectoria integrando múltiples
plataformas de datos, así como el diseño de soluciones utilizando Microsoft Azure.
Youtube: youtube.com/BILATAM
Facebook: facebook.com/CloudLatam
Twitter: @JMCJOSEAD
Moderador: Kenneth Ureña
7. 7
Agenda
SQL Data Warehouse
• Inicios
• Demo : Provisionamiento
• Diseño de tablas / Demo
• Cargas de Datos / Integración con Polybase /
Demo
• Consideraciones de Administración
• Protección de los datos
11. 11
SQL DW
Si usted está pensando en
Sistemas OLTP
Frecuentes lecturas / escrituras
Multiples Select (Ejecutados
secuencialmente)
Procesamiento fila por fila
12. 12
SQL DW - MPP
SMP – Symmetric
Multiprocessing
MPP – Massively Parallel
Processing
Lo que trabajamos hoy en día.
• Compartimos recursos
• CPU
• Memoria
• Disco
Concepto de “Share nothing”
Cada servidor controla sus recursos y
opera de forma separada
13. SQL DW - DWU
1313
Con qué está relacionado?
Recursos como
Memoria
CPU
IOPS
Medición de Métricas
Scan / Agregation, Cargas, CTAS
Pueden ser cambiadas en tiempo
real (*)
14. SQL DW - DWU
14
DWU
100
DWU
200
DWU
300
DWU
400
DWU
500
DWU
600
… … DWU
2000
De acuerdo a la configuración así se usan
• Engine Nodes
• Worker Nodes
• Total # of Distributions
• Distributions / Node
• Concurrency Slots
18. Diseño de Tablas
18
Hash Round Robin
Inserta de manera aleatoria.
Joins entre tablas que tienen que ir de PK a
FK. Ejem: Dimensiones.
Si necesitan hacer cargas de muchos datos
en un área Stage, sería la mejor
configuración.
Inserta basado en el valor de una columna
que sirve como elemento diferenciador.
Se pueden utilizar para Fact tables.
Se pueden usar para Summarized tables.
Importante, los puntos anteriores son
válidos si y solo sí cuentan con una
columna que permita agrupar valores en
común.
Si un Full Scan no tiene un buen
rendimiento.
19. Consideraciones para el diseño de tablas
Tablas se crean con Page Compression de forma predeterminada.
Round Robin también es el valor predeterminado en la opción de
distribución de datos.
No hay limite de filas, es determinado por el storage.
1024 columnas por tabla
2 billones de tablas por base de datos
19
Distribución = Round Robin
21. SQL 2016 Basic Availability Groups multisubnet failover
en Azure
24 de Mayo (12 pm GMT -5)
Kenneth Ureña
Resúmen:
Próximo Evento
Notas del editor
Con esto no estamos diciendo que el enfoque esté mal, para nada, siempre va a ser un gran enfoque, pero nos tenemos que poner a pensar en la siguiente pregunta. Qué necesito para tener una solución de BI On-Premise?
Tomemos en consideración la cantidad de datos con que se cuenta hoy en día. La variedad de datos que tenemos con que contamos, que no son solo los datos estructurados si no también los datos no estructurados.
Recordar mencionar la problemática actual con el tema del manejo de datos y análisis en tiempo real en sistemas transaccionales.
SQL DW funciona de la siguiente manera, existe un cerebro y está el músculo, o sea los que completan el trabajo. SQL DW viene siendo el cerebro y AZURE SQL Database viene siendo el musculo que hace el trabajo.
Como funciona la distribución?
A cada tabla se le asignan 60 buckets
A cada tabla se le asignan 60 buckets
Mencionar que no se soporta Identity, tampoco se soporta PK y FK ni tipos de datos como XML, SQL_Variant, Text, CLR