2. Ahias Portillo
• Mentor en Primus Data, Costa Rica.
• Consultor con más de 14 años de experiencia en el área de
Inteligencia de negocios y base datos.
• Proyectos realizados Centro América, Republica
Dominicana y Estados Unidos.
• Conferencias impartidas en: Centro América, Panamá,
Estados Unidos, México y España.
• Master en Tecnologías de Base de datos, Cenfotec, Costa
Rica.
• Master en Ciencia de Datos, UOC, España.
• Egresado Master en Estadística para la investigación, UCA,
El Salvador.
• Certificado en Microsoft profesional en Ciencia de Datos.
• Certificado en Microsoft profesional en Big Data.
7. Distribuciones
• Las bases de datos almacenan una o mas tablas de
forma distribuida.
• Los datos se almacenan en 60 bases, las cuales pueden
estar en nodos diferentes.
• Los datos pueden ser distribuidos por medio de Hash.
• Los datos pueden ser distribuidos por medio de Round-
Robin.
• Los datos pueden replicados.
8. Distribución por HASH
• Divide los datos basado en un algoritmo de hashing.
• Un mismo valor siempre genera un hash de distribución
igual.
• Rendimiento para tablas muy grandes.
• Puede existir problemas para tablas con valores de alta
frecuencia.
9. Distribución por Round-Robin
• Los datos se distribuyen de manera uniforme entre los
nodos.
• Mas fácil de implementar, no es necesario saber nada
sobre los datos.
• Útil para dimensiones y hechos que no poseen una
buena columna de distribución por hash.
• Se incurrirá en más movimiento de datos cuando se
realicen los querys.
13. Data Warehouse Units (DWUs)
• Los DWU indican los recursos CPU, memoria e IOPS, que se
asignan a la instancia de Azure SQL DW.
• Gen1DWU 100 – 6000./Gen2 DWU1000c-30000c
• ¿Cuántos nodos de cómputo usa tu instancia?.
• ¿ Cuántas consultas simultáneas puede ejecutar su instancia?.
• ¿ Cuantos procesos en paralelo?.
• El límite de tamaño de las transacciones.