Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataJohn Bulla
En esta sesión veremos una introducción al nuevo lenguaje de U-SQL, que une las ventajas de SQL con el poder expresivo de su propio código donde millones de desarrolladores SQL y .NET ahora pueden procesar y analizar todos sus datos con los conocimientos que ya tienen. El apoyo del lenguaje U-SQL en Azure Data Lake Tools para Visual Studio incluye ayuda técnica para la creación, depuración y rendimiento avanzado de funciones de análisis para aumentar la productividad al optimizar los trabajos que se ejecutan a través de miles de nodos.
Introducción a Hadoop y sus herramientas. Presentación de las herramientas de integración que ofrece SQL Server Integration Services 2016 con Hadoop y HDInsight
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataJohn Bulla
En esta sesión veremos una introducción al nuevo lenguaje de U-SQL, que une las ventajas de SQL con el poder expresivo de su propio código donde millones de desarrolladores SQL y .NET ahora pueden procesar y analizar todos sus datos con los conocimientos que ya tienen. El apoyo del lenguaje U-SQL en Azure Data Lake Tools para Visual Studio incluye ayuda técnica para la creación, depuración y rendimiento avanzado de funciones de análisis para aumentar la productividad al optimizar los trabajos que se ejecutan a través de miles de nodos.
Introducción a Hadoop y sus herramientas. Presentación de las herramientas de integración que ofrece SQL Server Integration Services 2016 con Hadoop y HDInsight
Charla impartida por Marco Antonio Sanz Molina Prados, Fundador de CloudAppi, que repasa las tecnologías más habituales del mundo Big Data y su aplicación en el desarrollo de las Apis.
En la ponencia se tratan os siguientes puntos:
• Arquitectura Lambda
• Arquitectura de APIs
• Bases de datos noSQL
• Datawarehouses Big Data
• Ejemplos de arquitecturas
Escala de forma segura. Desde tu portátil hasta numerosos nodos o despliegues para diversos casos de uso y clústeres, nuestros expertos de Elastic te ayudarán a la hora de escalar Elasticsearch.
Conociendo los servicios adicionales en big dataSpanishPASSVC
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación.
En esta plática exploraremos el modelo que Amazon utiliza para innovar. Compartiremos como lo ha aplicado en distintos negocios enfocados en diferentes mercados, cuáles son los pilares de su modelo de innovación, y como este modelo está íntimamente ligado a su cultura y procesos de negocio.
Por: Alejandro Flores
Escala de forma segura. Desde tu portátil hasta numerosos nodos o despliegues para diversos casos de uso y clústeres, nuestros expertos de Elastic te ayudarán a la hora de escalar Elasticsearch.
Una sencilla y simple exposición rápida de lo que es el servicio de las bases de datos NoSQL en Microsoft Azure "Azure DocumentDB" yéndonos desde las conceptualizaciones y cimientos conceptuales básicos hasta entender y validar como trabajar con modelo de datos JSON document para la creación de documentos repositorios así como de procedimientos almacenados en JavaScript como plataforma de servicio en Azure para con ellos, aplicarlos en las empresas de hoy. Estan tod@s cordialmente invitados a la misma.
En esta presentación Guillermo Taylor, John Bulla y Julián Castiblanco, hablan sobre algunas de las mejores características de sQL Server 2016, como migrar a SQL Databas, características de sql database y en general varios tips para DBA's en arquitecturas híbridas
Taller: Limpieza y preparación de datos con Optimus y Apache SparkSoftware Guru
En este taller, impartido por uno de los desarrolladores de Optimus, aprenderás a realizar limpieza y preparación de datos utilizando Optimus en conjunto con Apache Spark y Python (PySpark).
Por Favio Vázquez
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Joseph Lopez
Muchas de las empresas y corporaciones en la actualidad, se encuentran moviendo sus plataformas de datos a la nube a velocidades sin precedentes nunca antes vista, haciendo de esto para todos los que conformamos el ecosistema de IT Pro, DBA's y desarrolladores de soluciones empresariales, una fuente de investigación y estudio para desarrollar destrezas en el conocimiento de todas estas nuevas tecnologías a implementar en estos escenarios. En la presente conferencia les estaré a todos impartiendo los conceptos apropiados de como utilizar la Plataforma de Datos de Microsoft en estos contextos empresariales de manera simple y sencilla sin tanto tecnicismos ni vocabularios avanzados.
Esta charla forma parte de la gira de speaker online y el video de la podras encontrar en canal ventana de tecnologia en youtube
https://ivanmartinezm.wordpress.com/2017/09/03/5ta-fecha-gira-online-speaker-latinoamerica/
Charla impartida por Marco Antonio Sanz Molina Prados, Fundador de CloudAppi, que repasa las tecnologías más habituales del mundo Big Data y su aplicación en el desarrollo de las Apis.
En la ponencia se tratan os siguientes puntos:
• Arquitectura Lambda
• Arquitectura de APIs
• Bases de datos noSQL
• Datawarehouses Big Data
• Ejemplos de arquitecturas
Escala de forma segura. Desde tu portátil hasta numerosos nodos o despliegues para diversos casos de uso y clústeres, nuestros expertos de Elastic te ayudarán a la hora de escalar Elasticsearch.
Conociendo los servicios adicionales en big dataSpanishPASSVC
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación.
En esta plática exploraremos el modelo que Amazon utiliza para innovar. Compartiremos como lo ha aplicado en distintos negocios enfocados en diferentes mercados, cuáles son los pilares de su modelo de innovación, y como este modelo está íntimamente ligado a su cultura y procesos de negocio.
Por: Alejandro Flores
Escala de forma segura. Desde tu portátil hasta numerosos nodos o despliegues para diversos casos de uso y clústeres, nuestros expertos de Elastic te ayudarán a la hora de escalar Elasticsearch.
Una sencilla y simple exposición rápida de lo que es el servicio de las bases de datos NoSQL en Microsoft Azure "Azure DocumentDB" yéndonos desde las conceptualizaciones y cimientos conceptuales básicos hasta entender y validar como trabajar con modelo de datos JSON document para la creación de documentos repositorios así como de procedimientos almacenados en JavaScript como plataforma de servicio en Azure para con ellos, aplicarlos en las empresas de hoy. Estan tod@s cordialmente invitados a la misma.
En esta presentación Guillermo Taylor, John Bulla y Julián Castiblanco, hablan sobre algunas de las mejores características de sQL Server 2016, como migrar a SQL Databas, características de sql database y en general varios tips para DBA's en arquitecturas híbridas
Taller: Limpieza y preparación de datos con Optimus y Apache SparkSoftware Guru
En este taller, impartido por uno de los desarrolladores de Optimus, aprenderás a realizar limpieza y preparación de datos utilizando Optimus en conjunto con Apache Spark y Python (PySpark).
Por Favio Vázquez
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Joseph Lopez
Muchas de las empresas y corporaciones en la actualidad, se encuentran moviendo sus plataformas de datos a la nube a velocidades sin precedentes nunca antes vista, haciendo de esto para todos los que conformamos el ecosistema de IT Pro, DBA's y desarrolladores de soluciones empresariales, una fuente de investigación y estudio para desarrollar destrezas en el conocimiento de todas estas nuevas tecnologías a implementar en estos escenarios. En la presente conferencia les estaré a todos impartiendo los conceptos apropiados de como utilizar la Plataforma de Datos de Microsoft en estos contextos empresariales de manera simple y sencilla sin tanto tecnicismos ni vocabularios avanzados.
Esta charla forma parte de la gira de speaker online y el video de la podras encontrar en canal ventana de tecnologia en youtube
https://ivanmartinezm.wordpress.com/2017/09/03/5ta-fecha-gira-online-speaker-latinoamerica/
Introducción a Microsoft Azure SQL Data WarehouseJoseph Lopez
El nuevo Microsoft Azure SQL Data Warehouse (SQL DW) es un versátil servicio de almacén de datos que provee una solución Massively Parallel Processing (MPP) para "Big data" con verdaderas características de alta infraestructura empresarial. El servicio SQL DW está construido para la carga de datos en ejecución de unos cien gigabytes hasta petabytes de datos con características únicas como cálculo desagregado, permitiendo así que los clientes sean capaces de utilizar el servicio para satisfacer sus necesidades de almacenamiento. En la presente exposición les mostrare una mirada en profundidad de este nuevo servicio de Azure como la implementación, el escalamiento elástico (Grow, Shrink, y Pause), y las nubes de datos híbrida con integración de Hadoop a través Polybase permitiendo una verdadera experiencia de SQL a través de datos estructurados y no estructurados.
Qué es Inteligencia de Negocios, Qué es Azure BI, Gestión de la Información, ETLs, Herramientas de Análisis, Visualización de la Información, BI Entrenamientos - iT Synergy
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...SpanishPASSVC
Esta es la charla que Eduardo Castro va a brindar el 4 de Diciembre en las 24 horas PASS en Español. Si no se ha registrado todavia esta a tiempo en el siguiente link: http://www.sqlpass.org/24hours/2014/spanish/Registro.aspx
Presentación donde se habla sobre una implementación de DW on premises y en la nube, y también como Azure Data Factory nos ayuda en la integración de los datos.
Presentación de Computación en la Nube en el Colegio Cedes Don Bosco, en Alajuelita. Los 5 Pilares de la Computación en la Nube de Oracle. 18 de setiembre del 2013. "La Internet ha madurado. Ya nos más se le llama así. El Internet ha evolucionado y ahora se le llama Computación en la Nube.
Machine Learning con Azure Managed InstanceEduardo Castro
En esta presentación mostramos las opciones para implementar Machine Learning dentro de Azure, así como las formas de configurar y utilizar Python dentro de Azure Managed Instance
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informáticavazquezgarciajesusma
En este proyecto de investigación nos adentraremos en el fascinante mundo de la intersección entre el arte y los medios de comunicación en el campo de la informática.
La rápida evolución de la tecnología ha llevado a una fusión cada vez más estrecha entre el arte y los medios digitales, generando nuevas formas de expresión y comunicación.
Continuando con el desarrollo de nuestro proyecto haremos uso del método inductivo porque organizamos nuestra investigación a la particular a lo general. El diseño metodológico del trabajo es no experimental y transversal ya que no existe manipulación deliberada de las variables ni de la situación, si no que se observa los fundamental y como se dan en su contestó natural para después analizarlos.
El diseño es transversal porque los datos se recolectan en un solo momento y su propósito es describir variables y analizar su interrelación, solo se desea saber la incidencia y el valor de uno o más variables, el diseño será descriptivo porque se requiere establecer relación entre dos o más de estás.
Mediante una encuesta recopilamos la información de este proyecto los alumnos tengan conocimiento de la evolución del arte y los medios de comunicación en la información y su importancia para la institución.
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...espinozaernesto427
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta intensidad son un tipo de lámpara eléctrica de descarga de gas que produce luz por medio de un arco eléctrico entre electrodos de tungsteno alojados dentro de un tubo de alúmina o cuarzo moldeado translúcido o transparente.
lámparas más eficientes del mercado, debido a su menor consumo y por la cantidad de luz que emiten. Adquieren una vida útil de hasta 50.000 horas y no generan calor alguna. Si quieres cambiar la iluminación de tu hogar para hacerla mucho más eficiente, ¡esta es tu mejor opción!
Las nuevas lámparas de descarga de alta intensidad producen más luz visible por unidad de energía eléctrica consumida que las lámparas fluorescentes e incandescentes, ya que una mayor proporción de su radiación es luz visible, en contraste con la infrarroja. Sin embargo, la salida de lúmenes de la iluminación HID puede deteriorarse hasta en un 70% durante 10,000 horas de funcionamiento.
Muchos vehículos modernos usan bombillas HID para los principales sistemas de iluminación, aunque algunas aplicaciones ahora están pasando de bombillas HID a tecnología LED y láser.1 Modelos de lámparas van desde las típicas lámparas de 35 a 100 W de los autos, a las de más de 15 kW que se utilizan en los proyectores de cines IMAX.
Esta tecnología HID no es nueva y fue demostrada por primera vez por Francis Hauksbee en 1705. Lámpara de Nernst.
Lámpara incandescente.
Lámpara de descarga. Lámpara fluorescente. Lámpara fluorescente compacta. Lámpara de haluro metálico. Lámpara de vapor de sodio. Lámpara de vapor de mercurio. Lámpara de neón. Lámpara de deuterio. Lámpara xenón.
Lámpara LED.
Lámpara de plasma.
Flash (fotografía) Las lámparas de descarga de alta intensidad (HID) son un tipo de lámparas de descarga de gas muy utilizadas en la industria de la iluminación. Estas lámparas producen luz creando un arco eléctrico entre dos electrodos a través de un gas ionizado. Las lámparas HID son conocidas por su gran eficacia a la hora de convertir la electricidad en luz y por su larga vida útil.
A diferencia de las luces fluorescentes, que necesitan un recubrimiento de fósforo para emitir luz visible, las lámparas HID no necesitan ningún recubrimiento en el interior de sus tubos. El propio arco eléctrico emite luz visible. Sin embargo, algunas lámparas de halogenuros metálicos y muchas lámparas de vapor de mercurio tienen un recubrimiento de fósforo en el interior de la bombilla para mejorar el espectro luminoso y reproducción cromática. Las lámparas HID están disponibles en varias potencias, que van desde los 25 vatios de las lámparas de halogenuros metálicos autobalastradas y los 35 vatios de las lámparas de vapor de sodio de alta intensidad hasta los 1.000 vatios de las lámparas de vapor de mercurio y vapor de sodio de alta intensidad, e incluso hasta los 1.500 vatios de las lámparas de halogenuros metálicos.
Las lámparas HID requieren un equipo de control especial llamado balasto para funcionar
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informáticavazquezgarciajesusma
En este proyecto de investigación nos adentraremos en el fascinante mundo de la intersección entre el arte y los medios de comunicación en el campo de la informática.
La rápida evolución de la tecnología ha llevado a una fusión cada vez más estrecha entre el arte y los medios digitales, generando nuevas formas de expresión y comunicación.
Continuando con el desarrollo de nuestro proyecto haremos uso del método inductivo porque organizamos nuestra investigación a la particular a lo general. El diseño metodológico del trabajo es no experimental y transversal ya que no existe manipulación deliberada de las variables ni de la situación, si no que se observa los fundamental y como se dan en su contestó natural para después analizarlos.
El diseño es transversal porque los datos se recolectan en un solo momento y su propósito es describir variables y analizar su interrelación, solo se desea saber la incidencia y el valor de uno o más variables, el diseño será descriptivo porque se requiere establecer relación entre dos o más de estás.
Mediante una encuesta recopilamos la información de este proyecto los alumnos tengan conocimiento de la evolución del arte y los medios de comunicación en la información y su importancia para la institución.
Actualmente, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos están en formato digital, siendo este un componente electrónico, por tanto se ha desarrollado y se ofrece un amplio rango de soluciones al problema del almacenamiento de datos.
3Redu: Responsabilidad, Resiliencia y Respetocdraco
¡Hola! Somos 3Redu, conformados por Juan Camilo y Cristian. Entendemos las dificultades que enfrentan muchos estudiantes al tratar de comprender conceptos matemáticos. Nuestro objetivo es brindar una solución inclusiva y accesible para todos.
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Telefónica
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0xWord escrito por Ibón Reinoso ( https://mypublicinbox.com/IBhone ) con Prólogo de Chema Alonso ( https://mypublicinbox.com/ChemaAlonso ). Puedes comprarlo aquí: https://0xword.com/es/libros/233-big-data-tecnologias-para-arquitecturas-data-centric.html
1. 1
21-Feb-19
Arquitectura y ejemplos
Eduardo Castro, Microsoft Regional Director
Azure SQL Data Warehouse
• Partes de esta presentación están basada en Contenido Público de Microsoft
Ignite
2. 2
21-Feb-19
Sistemas y procesos fragmentados
Múltiples herramientas y conjuntos de habilidades
Información detallada sobre datos desconectados
Alto costo de propiedad
Administre el
volumen y la
variedad de datos
en todos los
repositorios de
datos
Lógica
Mantener datos
históricos de
fuentes variadas
Tradicional
Obtenga
información en
tiempo real sin
afectar el
rendimiento
Operacional
El almacenamiento de datos moderno es desafiante
Arquitecturas de referencia de SQL Server 2016 +
Azure SQL Data Warehouse
Azure Data Lake
Productos de Microsoft Data Warehouse
Administre el
volumen y la
variedad de datos en
todos los repositorios
de datos
Mantener datos
históricos de
fuentes variadas
Obtenga
información en
tiempo real sin
afectar el
rendimiento
LógicaTradicional Operacional
3. 3
21-Feb-19
DW a tu manera
DW integral
Local
Nube
• Escalabilidad elástica para una demanda
impredecible
• Pague por lo que necesita
• Implementación más rápida
• Flexibilidad y elección de la última generación de hardware
• Ofertas fuera de la caja con riesgo reducido y mayor confianza
PRE-INGENIERÍA
+
• Cumple estrictas normas de cumplimiento normativo
• Habilite una gobernanza de datos sólida
CONSTRUYE TU PROPIO
• Almacenamiento de datos local (o IaaS)
• Cargas de trabajo de misión crítica
• Costes iniciales (CAPEX)
SQL Server 2016
• Almacenamiento de datos basado en la nube
• Pague a medida que avanza (OPEX)
• Cargas de trabajo ad hoc
Azure SQL Data Warehouse
Comparación de alto nivel
4. 4
21-Feb-19
Introducción a SQL Data Warehouse
Almacenamiento de datos relacionales completamente administrado como servicio
El primer almacén de datos de nube elástica con capacidades de nivel empresarial
Apoye los conjuntos de datos más pequeños a los más grandes
Introducción a Azure SQL Data Warehouse
DW relacional almacenamiento de datos como un servicio, completamente administrado por Microsoft
Almacenamiento de datos en la nube con de nivel empresarial
Integrado con activos locales y en la nube
Facturación de computación y
almacenamiento
Pague por lo que necesita
Alto rendimiento sin reescribir
aplicaciones
Bajo costo para datos latentes
Infraestructura, gestión y soporte
proporcionados
Escalabilidad a petabytes de datos con el
procesamiento MPP
Redimensionar nodos de computación < 1
minuto
Diseñado para cargas de trabajo "bajo
demanda"
Integrado con la plataforma de Azure y
otros servicios de Microsoft
Permite soluciones híbridas
Basado en la experiencia y la tecnología
de SQL Server
5. 5
21-Feb-19
Escalabilidad elástica
Spin up para cargas de trabajo pesadas, ciclo hacia abajo para la actividad diaria
Compre tiempo a la información basada en lo que necesita, cuando lo necesite
Elija el combo de computación y almacenamiento que satisfaga sus necesidades
Portal
7. 7
21-Feb-19
Pausa
Los datos permanecen en su lugar – sin recarga/restauración de datos
Cuando está en pausa, el almacenamiento a escalabilidad de nube es costo mínimo
Automatizar a través de PowerShell/REST API
$$$$
Vs
MPP frente a la arquitectura SMP
8. 8
21-Feb-19
SQL DW: creación de la base de DB de
SQL
Elastic, petabyte Scale
DW optimizado
99,99% de tiempo de actividad
SLA,
Restauración geográfica
Cumplimiento de Azure (ISO, HIPAA, UE, etc.)
Verdadera experiencia de SQL Server;
Las herramientas existentes solo funcionan
SQL DW
DB DE SQL
Niveles de servicio
Compatibilidad con SQL Server
SQL listo para la empresa para escenarios de DW sofisticados
Las herramientas y scripts de SQL serversql Server existentes solo funcionan
Mejoras continuas en la superficie del lenguaje
Programación modular
(escribir una vez, ejecutar
varias veces)
Ejecución de código más
rápida
Lógica de programación
encapsulada
Mantenimiento más
sencillo de tablas grandes
Mejora el rendimiento
Escalabilidad y
disponibilidad mejoradas
Permite un uso adecuado
y comparaciones de
caracteres en diferentes
idiomas
Tecnología de almacén
columnar para el mejor
rendimiento de consultas
de DW en su clase
9. 9
21-Feb-19
Consulta de datos no estructurados mediante
polybase/T-SQL
Consulta T-SQL
SQL Server Hadoop
Citar:
************************
**********************
*********************
**********************
***********************
$658,39
Jim Gray
Nombre
11/13/58
Dob
Wa
Estado
Ann Smith 04/29/76 ME
Ejemplo TSQL-Setup
-- This is only one time for a database
CREATE MASTER KEY;
CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'SecurePassword';
-- This is required once per a new credential.
CREATE CREDENTIAL ProdCreds ON DATABASE WITH IDENTITY =
‘StorageName', Secret = 'StorageKeyValueGoesHere';
10. 10
21-Feb-19
TSQL de ejemplo: origen de datos
-- Create a data source
CREATE EXTERNAL DATA SOURCE [WebLogSource]
WITH
(
TYPE = HADOOP,
LOCATION = 'wasbs://weblogs@sqldwdemo.blob.core.windows.net/',
CREDENTIAL = ProdCreds
);
TSQL de ejemplo: formato de archivo
-- Create the file format
CREATE EXTERNAL FILE FORMAT [WebLogFormat] WITH
(
FORMAT_TYPE = DELIMITEDTEXT,
FORMAT_OPTIONS
(
FIELD_TERMINATOR = ‘|',
DATE_FORMAT = 'yyyy-MM-dd HH:mm:ss'
)
);
11. 11
21-Feb-19
TSQL de ejemplo: tabla externa
CREATE EXTERNAL TABLE [WebLogs]
(
url VARCHAR(50),
event_date DATE,
user_IP VARCHAR(50)
)
WITH
( LOCATION='weblogs',
DATA_SOURCE = WebLogData,
FILE_FORMAT = WebLogFormat
);
TSQL de ejemplo-consultas
-- Join Local and External tables
SELECT
Day,
Products,
COUNT(*) AS [Visits]
FROM
WebLogs wl
INNER JOIN Products p ON p.Url = wl.url
WHERE
wl.event_date > DATEADD(DAY, -30, GETDATE());
12. 12
21-Feb-19
Simetría
Integrado con Power BI, Azure machine learning y Azure Data Factory
Servicio de aplicaciones Base de datos SQL de Azure
Aprendizaje automático de Azure
Aplicación inteligente
Hadoop
Datos de Azure SQL
Datawarehouse
Power BI
Unidad de almacenamiento de datos (DWU)
Simplemente compre el rendimiento de la consulta que necesita, no solo el
hardware
Cuantificados por objetivos de carga de trabajo: cómo se escanean, cargan y
copian las filas rápidas
Medida de
potencia
Transparencia
Primer servicio DW para ofrecer energía informática a petición, independiente
del almacenamiento
A petición
Analizar filas 1B
100 DWU = 297 seg.
400 DWU = 74 seg.
800 DWU = 37 seg.
1.600 DWU = 19 seg.
Velocidad de
escaneo
Xx Fila de M/sec
Carga Tasa XX K fila/seg.
Tasa de copia
de tabla
Xx Fila de
K/sec
100 DWU
13. 13
21-Feb-19
Presentamos DWU
DWU
Capacidad de la base de datos
CREATE DATABASE MyDB COLLATE
SQL_Latin1_General_CP1_CI_AS
(
EDITION = 'DataWarehouse'
, SERVICE_OBJECTIVE = 'DW400'
, MAXSIZE = 10240 GB
)
; 1TB/DWU100 es buen lugar para
comenzar
14. 14
21-Feb-19
Tempdb Tamaño
0
1000
2000
3000
4000
5000
6000
7000
Capacity (GB)
Gestión de carga
DWU Lectores Escritores
Guía de texto delimitado
• Divida los datos uniformemente en varios
archivos
• Un archivo por lector
• El texto delimitado es el más rápido
El texto comprimido limita el
acceso simultáneo a los
archivos de texto
Dividir datos entre archivos
O
Utilizar un formato de archivo
diferente
15. 15
21-Feb-19
Servicio de movimiento de datos (DMS)
Existe en los nodos de control y computación
Responsable de todo el movimiento de datos de
carga y consulta
Cómo se mueven los datos
Ejemplo simple
SELECT COUNT_BIG(*)
FROM dbo.[FactInternetSales];
SELECT SUM(*)
FROM dbo.[FactInternetSales];
SELECT COUNT_BIG(*)
FROM dbo.[FactInternetSales];
SELECT COUNT_BIG(*)
FROM dbo.[FactInternetSales];
SELECT COUNT_BIG(*)
FROM dbo.[FactInternetSales];
SELECT COUNT_BIG(*)
FROM dbo.[FactInternetSales];
Calcular
Control
16. 16
21-Feb-19
CREATE TABLE [build].[FactOnlineSales]
(
[OnlineSalesKey] int NOT NULL
, [DateKey] datetime NOT NULL
, [StoreKey] int NOT NULL
, [ProductKey] int NOT NULL
, [PromotionKey] int NOT NULL
, [CurrencyKey] int NOT NULL
, [CustomerKey] int NOT NULL
, [SalesOrderNumber] nvarchar(20) NOT NULL
, [SalesOrderLineNumber] int NULL
, [SalesQuantity] int NOT NULL
, [SalesAmount] money NOT NULL
)
WITH
( CLUSTERED COLUMNSTORE INDEX
, DISTRIBUTION = ROUND_ROBIN
)
;
Creación de tablas distribuidas
CREATE TABLE [build].[FactOnlineSales]
(
[OnlineSalesKey] int NOT NULL
, [DateKey] datetime NOT NULL
, [StoreKey] int NOT NULL
, [ProductKey] int NOT NULL
, [PromotionKey] int NOT NULL
, [CurrencyKey] int NOT NULL
, [CustomerKey] int NOT NULL
, [SalesOrderNumber] nvarchar(20) NOT NULL
, [SalesOrderLineNumber] int NULL
, [SalesQuantity] int NOT NULL
, [SalesAmount] money NOT NULL
)
WITH
( CLUSTERED COLUMNSTORE INDEX
, DISTRIBUTION = HASH([ProductKey])
)
;
DISTRIBUCIÓN ROUND ROBIN
1
3
1
4
1
6
1
5
1
7
1
8
2
0
1
9
2
1
2
2
2
4
2
3
2
5
2
6
2
8
2
7
2
9
3
0
3
2
3
1
3
3
3
4
3
6
3
5
3
7
3
8
4
0
3
9
4
1
4
2
4
4
4
3
4
5
4
6
4
8
4
7
4
9
5
0
5
2
5
1
5
3
5
4
5
6
5
5
5
7
5
8
6
0
5
9
0
1
0
2
0
4
0
3
0
5
0
6
0
8
0
7
0
9
1
0
1
2
1
1
19. 19
21-Feb-19
Información general sobre Azure SQL Data
Warehouse
Integración con los servicios
de Power BI, ADF y machine
learning
Almacenamiento y
computación separados
Escalabilidad elástica
Escalar-hacia fuera relacional
almacén de datos