Este documento presenta Fast Track Data Warehouse (FTDW) como una guía de referencia para diseñar un almacén de datos balanceado y con buena relación coste-eficiencia. Explica los componentes generales de una arquitectura FTDW y cómo validar su eficiencia. También cubre temas como la distribución y geometría de datos, la carga inicial y incremental de datos, y compara FTDW con otras soluciones como Parallel Data Warehouse.
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Fast Track 3.0 en arquitecturas DW
1.
2. BI206
Como encaja Fast Track 3.0 en la
arquitectura de nuestro
datawarehouse
Un español, un mexicano y un tico
Mentores
SQL Server MVPs
α{nos_falta_el_gringo_para_el_chiste@solidq.com}
3. FTDW en Arquitecturas DW
AGENDA
αIntroducción del estado del arte
αFast Track Data Warehouse
αApéndice: Parallel Data Warehouse
7. Fast Track Scope
Supporting Systems BI Data Storage Systems Presentation Layer Systems
Integration Analysis Services
Services ETL Cubes
Presentation Data
Presentation Data
Web Analytic Tools
Data Path Reporting Services
SharePoint Services
Dedicated SAN, Microsoft Office SharePoint
Storage Array Data Warehouse PerformancePoint
Data Staging, Excel Services
Bulk Loading
Reference Architecture Scope (dashed)
9. ¿Qué es
Fast Track Data Warehouse?
αMÉTODO para diseñar un DW balanceado
β Excelente coste-eficiencia-beneficio
αBUENAS PRÁCTICAS para
β Configurar sistema
β Diseñar datos,
β Cargar datos (inicial e incrementales)
αLos fabricantes aportan CONFIGURACIONES de referencia
α«Para todo lo demás Mastercard»
β NO es la única solución de Microsoft para DW
β SÓLO para BDs Relacionales: no SSAS, SSIS, SSRS
10. FTDW – Elección de Máquina
αEl tamaño importa (mínimo)
β En V3.0: 96GB de RAM; 12 cores; 1 bandeja con 22 discos
αEntrevista inicial
β Conocer arquitectura objetivo
γ Decir NO para evitar expectativas imposibles de cumplir
β Conocer el volumen que se necesita, que incluye
γ Tamaño de BD (datos + índices), Tempdb, Staging, crecimiento y archiving
β Cálculos
γ Después aplicar ajustes
11. Componentes Generales
y cuellos de botella
DISK DISK
SQL SERVER
CPU CORES
A
FC SWITCH
FC
SERVER
WINDOWS
A
CACHE
HBA B LUN
CACHE
A STORAGE A
B CONTROLLER B DISK DISK
FC A
HBA B
B
LUN
CPU Feed Rate SQL Server HBA Port Rate Switch Port Rate SP Port Rate LUN Read Rate Disk Feed Rate
Read Ahead Rate
12. Validaciones de Eficiencia de
la Máquina
αPruebas sintéticas de E/S
γ SQLIO, Perfmon
αPruebas de Eficiencia
de SQL Server
γ MCR Indicadores Nominales
δ 140-290 MB/sec
γ BCR la vida misma
δ 80% de MCR
14. Definir Distribución de datos
LUN 1 LUN 2 LUN 3 LUN16
Permanent FG
Permanant_DB
Permanent_1.ndf Permanent_2.ndf Permanent_3.ndf Permanent_16.ndf
Stage FG
Database
Stage
Stage_1.ndf Stage_2.ndf Stage_3.ndf Stage_16.ndf
Local Drive 1
TempDB
TempDB.mdf (25GB) TempDB_02.ndf (25GB) TempDB_03ndf (25GB) TempDB_16.ndf (25GB)
Log LUN 1
Permanent DB
Log
Stage DB Log
15. Definir Geometría de datos
αHeaps
β Cuando se lee tabla entera: no hay filtros
β Como paso intermedio antes de ir a destino
β Transformaciones complejas que generan fragmentación
β Cuando el rendimiento es aceptable vs clustered
αTablas Clustered
β Estándar en FTDW
αParticionado
β Rendimiento, Fragmentación, Manegabilidad, Cargas concurrentes
αCompresión de datos
16. Carga de Datos
αObjetivo
β Sequencialidad de los datos
αConsideraciones arquitectura datos
β Maximizar datos secuenciales
β Minimizar fragmentación
β Operaciones concurrentes generan fragmentación
β UPDATEs y DELETEs pueden introducir fragmentación
αConsideraciones arquitectura proceso
β Origen: archivo, ODBC
β Transaction: Bulk o Row
β Formato: Ordenado, sin ordenar, 1 archivo, varios archivos
β Recursos:
γ CPU, Memoria
19. Posicionamiento DW MS
PDW con
Hub-and-spoke
Escalabilidad
Complejidad 4
HA por defecto
SW-HW integración
3
PDW
SQL Server 2008
Fast Track
Arquitecturas de Referencia
2
SQL Server 2008
1
20. PDW: Arquitectura
Database Servers Storage Nodes
Control Nodes
SQL
Active / Passive
SQL
Client Drivers SQL
SQL
SQL
Management Servers
Dual Fiber Channel
SQL
Dual Infiniband
Data Center
Monitoring SQL
SQL
Landing Zone
SQL
ETL Load Interface
SQL
Backup Node
SQL
Corporate Backup
Solution Spare Database Server
Corporate Network Private Network
21. FTDW en Arquitecturas DW
RESUMEN
αIntroducción del estado del arte
αFast Track Data Warehouse
β Guía de Referencia
β Evaluación predecible
β Adaptable a necesidades
β Una de las soluciones
αApéndice: Parallel Data Warehouse
β Nuevo Producto (DatAllegro)
β Para grandes de verdad: cientos de Teras
22.
23. No olvideis rellenar las evaluaciones en el Portal
del Summit!
Nos encontrareis en la zona de exposición en los
siguientes horarios
Javier, Jesús y Eladio
Mentors SolidQ