Aplicaciones difusas manejo de grandes volúmenes de datos

Aplicaciones Difusas:
Manejo de Grandes
Volúmenes de Datos
Autor(es): • Mtr. Luis Fernando Aguas

Very Large Tables (VLT)
• Gran cantidad de datos
• Millones/Billones de filas
• Datos estructurados
• OLTP(Procesamiento de Transacciones En Línea)
• Aplicaciones de misión crítica
• Sistemas con elevado número de TPS
• Sistemas con tracking/Logging
• DataWarehouse
• Repositorio histórico de procesos de negocio
• Procesos de carga perdiódicos

Desafíos de las VLT (Very Large
Tables)
Transaccional
Reportes
Índices
Estadísticas
Historificación
RendimientoMantenimiento

Desafíos: Mantenimiento de
Índices
• Imprescindible para evitar fragmentación
• Sobrecarga E/S
• Full Scan de las tablas
• Escritura intensiva en Log
• CPU
• Bloqueos
• Soluciones actuales:
• Reorganización vs. Rebuild
• Particionado de datos

Índices (II)
• Rebuild Online a nivel de partición
• Lock Priority
• Prioridad del proceso
• MAX_DURATION
• ABORT_AFTER_WAIT
• Reducimos Bloqueos
• Mayor control de Bloqueos

Estadísticas
• Ayudan al optimizador -> Planes de ejecución
• Histogramas
• Aconsejable FULLSCAN
• Requieren de E/S
• Impactan en performance
• Soluciones actuales:
• Actualizar estadísticas con muestreos de datos
• Estrategia de actualizaciones
• Varias ventanas de mantenimiento

Estadísticas
Con SQL Server
• Estadísticas Incrementales
• Basadas en particionado de datos
• Definición explícita

Desafíos: Rendimiento consultas
Soluciones actuales
• Índices de cobertura
• Compresión
• Código T-SQL Eficiente
OLTP
Insert/Delete/Update
Select by Key (1 row)
24 x 7 x 365
DataWarehouse
Consultas de negocio
Group By / MAX(),
MIN()…
Cargas periódicas
Híbridos
Cargas de trabajo mixtas
Impacto en rendimiento

Desafíos: Rendimiento consultas
Con SQL Server
• Índices columnares
• Mejoras desde 2012
• Clustered Columnstore Indexes
• Read-Write
• Nuevo tipo de compresión de datos

Desafíos: Historificación de datos
• Movimiento de datos “no activos”
• Almacenamiento de alto rendimiento
• limitado y caro
• Posibles soluciones actuales
• Particionado + Compresión
• Particionado + Compresión + Tabla Hist
• Particionado + compresión + BBDD hist
• Particionado + compresión + Servidor hist
• Otras….

Particionado + Compresión
<=M-6 M-5 M-2M-3M-4 >= MM-1
Particiones comprimidas (PAGE)
Datos “no activos”
Filegroup Readonly
Almacenamiento bajo rendimiento
Particiones sin compresión
Datos “activos”
Primary Filegroup
Almacenamiento Alto rendimiento
dbo.Ventas

Particionado + Compresión + Tabla
Hist
M-2 >= MM-1
dbo.Ventas
<=M-6 M-5 M-3M-4
dbo.Hist_Ventas
Particiones comprimidas (PAGE)
Filegroup Readonly
Almacenamiento bajo rendimiento
Datos “activos”
Primary Filegroup
Switch IN/OUT

Particionado + Compresión +
BBDD Hist
M-2 >= MM-1
dbo.Ventas
STG
dbo.Stg_Ventas
Step1
Switch
OUT
Hist
BBDD
Step2
Movimiento Datos
SSIS/Otros
<=M-6 M-5 M-3M-4
dbo.Hist_Ventas
OnPremise/Azure

Particionado + Compresión +
Columnar
M-2 >= MM-1
dbo.Ventas
STG
dbo.Stg_Ventas
Particiones comprimidas
Columnstore vs. Columnstore_Archive
Almacenamiento alto rendimiento
Datos “activos”
Primary Filegroup
Step1
Switch OUT
<=M-6 M-5 M-3M-4
Step2
Switch IN

Aplicaciones difusas manejo de grandes volúmenes de datos

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Aplicaciones difusas manejo de grandes volúmenes de datos

Similar a Aplicaciones difusas manejo de grandes volúmenes de datos (20)

Más de Luis Fernando Aguas Bucheli

Más de Luis Fernando Aguas Bucheli (20)

Último

Último (6)

Aplicaciones difusas manejo de grandes volúmenes de datos

Notas del editor