Qué es Inteligencia de Negocios, Qué es Azure BI, Gestión de la Información, ETLs, Herramientas de Análisis, Visualización de la Información, BI Entrenamientos - iT Synergy
1. iTS - I + D + i
Capacitación BI Azure
09 – 03 - 2018
2. AGENDA
1. Que es Inteligencia de Negocios
2. Que es Azure BI
3. Gestión de la Información
4. ETLs
5. Herramientas de Análisis
6. Visualización de la Información
7. BI Entrenamientos – iT Synergy
3. Que es Inteligencia de Negocios
Conjunto de metodologías, aplicaciones y tecnologías que permiten
reunir, depurar y transformar datos de los sistemas transaccionales e
información desestructurada (interna y externa a la compañía) en
información estructurada, para su explotación directa (reporting,
análisis OLTP / OLAP, alertas...) o para su análisis y conversión en
conocimiento, dando así soporte a la toma de decisiones sobre el
negocio.
6. ¿Qué es Azure BI?
Inteligencia empresarial
Transformar los datos de su compañía para admitir toma de decisiones
informadas.
Obtener información más detallada de sus datos para estar al día y descubrir
tendencias a medida que se producen.
Con soluciones y herramientas de inteligencia empresarial (BI) moderna,
cualquier organización puede comprender sus datos y actuar rápidamente en
ellos.
8. Azure SQL Database
Azure SQL Database es una base de datos relacional como
servicio que usa el motor Microsoft SQL Server. SQL
Database es una base de datos de alto rendimiento,
confiable y segura que puede usar para compilar
aplicaciones y sitios web controlados por datos en el
lenguaje de programación que prefiera, sin necesidad de
administrar la infraestructura.
10. Azure SQL Database - Precios
Grupos elásticos
Los grupos elásticos le permiten administrar el rendimiento colectivo de un grupo de
bases de datos en lugar de bases de datos únicas. Las bases de datos del grupo se
escalan y reducen verticalmente para satisfacer la demanda. Puede agregar y quitar
bases de datos del grupo fácilmente y escalar la aplicación desde unas pocas bases de
datos a miles; todo ello dentro de un presupuesto que controla.
12. Azure SQL Database - Precios
Modelo de base de datos única
Las bases de datos únicas son bases de datos completamente aisladas optimizadas para cargas de
trabajo cuando las demandas de rendimiento son un tanto predecibles. Puede escalar o reducir
verticalmente una base de datos única entre los niveles de servicio Básico, Estándar y Premium
para obtener el rendimiento y las características que la aplicación necesita, precisamente cuando
los necesita.
14. SQL Data WareHouse
Almacenamiento de datos empresarial (EDW) en la nube que
aprovecha el procesamiento paralelo masivo (MPP) para ejecutar
rápidamente consultas complejas en petabytes de datos. SQL Data
Warehouse se usa como un componente clave de una solución de
macrodatos. Importe macrodatos en SQL Data Warehouse con
consultas T-SQL de PolyBase simples y, después, use la potencia de
MPP para realizar análisis de alto rendimiento.
SQL Data Warehouse almacena los datos en tablas relacionales
con almacenamiento en columnas. Este formato reduce
considerablemente los costos de almacenamiento de datos y
mejora el rendimiento de las consultas. Una vez que los datos
están almacenados en SQL Data Warehouse, se pueden realizar
análisis a gran escala. En comparación con los sistemas de
bases de datos tradicionales, las consultas de análisis
finalizan en segundos, en lugar de minutos, o en horas, en
lugar de días.
15. SQL Data WareHouse
Componentes de la arquitectura de MPP
SQL Data Warehouse aprovecha una arquitectura de escalado
horizontal para distribuir el procesamiento de cálculo de datos en
varios nodos. La unidad de escalado es una abstracción de la eficacia
del proceso que se conoce como una unidad de almacenamiento de
datos. SQL Data Warehouse separa los procesos del almacenamiento,
lo que permite escalar los procesos independientemente de los datos
en el sistema.
SQL Data Warehouse usa una arquitectura basada en nodos. Las
aplicaciones conectan y emiten comandos de T-SQL para un nodo de
control, que es el único punto de entrada para el almacenamiento de
datos. El nodo de control ejecuta el motor de MPP que optimiza las
consultas para el procesamiento en paralelo y, después, pasa las
operaciones a los nodos de ejecución para hacer su trabajo en
paralelo. Los nodos de ejecución almacenan todos los datos del
usuario en Azure Storage y ejecutan las consultas en paralelo. El
servicio de movimiento de datos (DMS) es un servicio interno de
nivel de sistema que mueve datos entre los nodos según sea
necesario para ejecutar consultas en paralelo y devolver resultados
precisos.
16. SQL Data WareHouse
Arquitectura en estrella tipo
hub-and-spoke para miles de
usuarios de BI
Use la arquitectura en estrella tipo
hub-and-spoke para conseguir el
escalado que quiere, al precio y
con el nivel de rendimiento que
decida. Esta arquitectura también
proporciona características de
aislamiento y seguridad avanzada.
17. SQL Data WareHouse - Precios
Optimizado para elasticidad
Separa el proceso y el almacenamiento para realizar un ajuste de tamaño independiente y
elástico de los recursos. Se ha diseñado para que las operaciones de escalado frecuentes
administren el gasto en procesos y escenarios de “ráfaga” de la nube. Ofrece el punto de
escalado inicial más bajo.
18. SQL Data WareHouse - Precios
Optimizado para proceso
Organiza automáticamente los niveles en niveles para proporcionar un rendimiento mejorado
a las cargas de trabajo con requisitos de proceso consistentes. Se ha diseñado para cargas de
trabajo intensas que tienen una mayor necesidad de rendimiento de las consultas y de
escalabilidad de procesos.
20. Table Storage
Azure Table Storage es un servicio que almacena datos
NoSQL estructurados en la nube y proporciona un
almacén de claves y atributos con un diseño sin esquema.
Como Almacenamiento de tablas carece de esquema, es
fácil adaptar los datos a medida que evolucionan las
necesidades de la aplicación. El acceso a los datos de Table
Storage es rápido y rentable para muchos tipos de
aplicaciones y, por lo general, el costo es normalmente
menor que con el SQL tradicional para volúmenes
parecidos de datos.
• Almacenar petabytes de datos estructurados
• Admite esquema de datos flexible
• Fabricado para empresas
22. Data Factory
Azure Data Factory es un servicio de integración de datos
híbridos que permite crear, programar y organizar flujos
de trabajo ETL/ELT a escala dondequiera que se
encuentren los datos, en la nube o en una red
autohospedada. Satisfaga sus necesidades de seguridad y
cumplimiento normativo con las enormes funcionalidades
de Data Factory.
27. Data Factory – Versiones 1 vs 2
Característica versión 1 versión 2
Conjuntos de datos Una vista de datos con nombre que hace
referencia a los datos que desea usar en
sus actividades como entrada y
salida. Los conjuntos de datos
identifican datos en distintos almacenes
de datos, como tablas, archivos, carpetas
y documentos. Por ejemplo, un conjunto
de datos de Blob de Azure especifica el
contenedor de blobs y la carpeta de
Azure Blob Storage de la que la actividad
debe leer los datos.
La disponibilidad define el modelo de
segmentación de la ventana de
procesamiento para el conjunto de datos
(por ejemplo, cada hora, cada día, etc.).
Los conjuntos de datos son los mismos
en la versión 2. Sin embargo, no es
preciso definir programaciones
de disponibilidad para los conjuntos de
datos. Se puede definir un recurso de
desencadenador que puede programar
las canalizaciones a partir de un
paradigma de programador de
reloj. Para más información,
consulte Desencadenadores y Conjuntos
de datos.
Servicios vinculados Los servicios vinculados son muy
similares a las cadenas de conexión, que
definen la información de conexión
necesaria para que Data Factory se
conecte a recursos externos.
Los servicios vinculados son los mismos
que en la versión 1 de Data Factory,
salvo en que tienen una nueva
propiedad connectVia para utilizar el
entorno de proceso Integration Runtime
de la versión 2 de Data Factory. Para más
información, consulte Integration
Runtime en Azure Data
Factory y Propiedades del servicio
vinculado.
28. Data Factory – Versiones 1 vs 2
Procesos Una factoría de datos puede tener una o más
canalizaciones.Una canalización es una
agrupación lógica de actividades que realizan
una tarea. Use startTime, endTime, isPaused
para programar y ejecutar canalizaciones.
Las canalizaciones son grupos de actividades
que se realizan en los datos. Sin embargo, la
programación de actividades en la canalización
se ha dividido en nuevos recursos de
desencadenador. En la versión 2 de Data
Factory, las canalizaciones se pueden considerar
más como "unidades de flujo de trabajo" que se
programan por separado a través de
desencadenadores.
Las canalizaciones no tienen "ventanas" de
ejecución temporal en la versión 2 de Data
Factory. Los conceptos de startTime, endTime e
isPaused, que están presentes en la versión 1 de
Data Factory dejan de estarlo en la versión 2.
Actividades Las actividades definen las acciones que se
realizan en los datos en una canalización. Se
admiten las actividades de movimiento de datos
(actividad de copia) y transformación de datos
(como, Hive, Pig y MapReduce).
En la versión 2 de Data Factory, las actividades
siguen siendo acciones definidas en una
canalización. La versión 2 incorpora
nuevas actividades de los flujos de
control. Dichas actividades se usan en un flujo
de control (bucle y bifurcación). Las actividades
de movimiento de datos y transformación de
datos que se admitían en la versión 1 se
admiten en la 2. En la versión 2, se pueden
definir actividades de transformación sin usar
conjuntos de datos.
29. Data Factory – Versiones 1 vs 2
Movimiento de
datos híbridos y
distribución de
actividades
Data Management Gateway,
que ahora se denomina
Integration Runtime, admitía el
movimiento de datos entre un
entorno local y la nube.
Data Management Gateway ahora se denomina Integration
Runtime autohospedado. Proporciona la misma funcionalidad que
en la versión 1.
En la versión 2, Azure-SSIS Integration Runtime también admite
la implementación y ejecución de paquetes de SQL Server
Integration Services (SSIS) en la nube.
Parámetros N/D Los parámetros son pares de clave-valor de valores de
configuración de solo lectura que se definen en las
canalizaciones. Al ejecutar manualmente la canalización se pueden
pasar argumentos para los parámetros. Si usa un desencadenador
de programador, el desencadenador también puede pasar valores
de los parámetros. Las actividades dentro de la canalización
consumen los valores de parámetro.
Expresiones La versión 1 de Data Factory
permite usar funciones y
variables del sistema en las
consultas de selección de
datos y en las propiedades de
actividad/conjunto de datos.
En la versión 2 se pueden usar expresiones en cualquier lugar en un
valor de cadena JSON.
30. Data Factory – Versiones 1 vs 2
ejecuciones de la canalización N/D Una instancia individual de una ejecución de una canalización. Por
ejemplo, supongamos que tiene una canalización que se ejecuta las 8
a. m., 9 a. m. y 10 a. m. En este caso, habrá tres ejecuciones
independientes de la canalización (ejecuciones de canalización). Cada
canalización ejecutar tiene un identificador de canalización único. El
identificador de ejecución de canalización es un GUID que define de
forma exclusiva una ejecución de canalización concreta. Normalmente
las instancias de ejecuciones de canalización se crean al pasar
argumentos a parámetros que se definen en las canalizaciones.
Ejecuciones de actividad N/D Una instancia de una ejecución de una actividad en una canalización.
Ejecuciones de desencadenador N/D Una instancia de una ejecución de un desencadenador. Para más
información, consulte Desencadenadores.
Scheduling La programación se basa en
las horas de inicio y
finalización de la
canalización y en la
disponibilidad del conjunto
de datos.
Desencadenador o ejecución del programador a través de un
programador externo. Para obtener más información,
consulte Desencadenadores y ejecución de la canalización.
31. Data Factory - Precios
Detalles de precios
El precio del uso de Data Factory se calcula teniendo en cuenta los siguientes factores:
• La frecuencia de las actividades (alta o baja). Una actividad de baja frecuencia no se
ejecuta más que una vez al día (por ejemplo, a diario, semanalmente, mensualmente);
una actividad de frecuencia alta se ejecuta más de una vez al día (por ejemplo, cada
hora, cada 15 minutos).
• Dónde se ejecutan las actividades (en la nube o local).
• Si una canalización está activa o no.
• Si está ejecutando de nuevo una actividad.
33. Data Factory - Precios
Movimiento de datos
Azure Data Factory puede copiar datos entre diferentes almacenes de datos de una forma
segura, confiable, eficaz y escalable. A medida que el volumen de datos o las necesidades
de rendimiento del movimiento de datos crecen, Azure Data Factory se puede escalar
horizontalmente para satisfacer esas necesidades.
34. Data Factory - Precios
Canalizaciones inactivas
Debe especificar un período de procesamiento de datos activo mediante un intervalo de fecha
y hora (hora de inicio y finalización) para cada canalización que implemente en Azure Data
Factory. La canalización se considera activa dentro del período especificado, incluso si sus
actividades no se están ejecutando realmente. Se considera inactiva durante las demás horas.
Una canalización inactiva se cobra $0,80 por mes.
36. Analysis Services
Azure Analysis Services proporciona modelado de datos de nivel
empresarial en la nube. Es una plataforma totalmente administrada como
servicio (PaaS), que se integra con los servicios de la plataforma de datos
de Azure.
Con Analysis Services, puede combinar datos
de diversos orígenes, definir métricas y
proteger los datos en un modelo de datos
semántico único y de confianza. El modelo de
datos proporciona a los usuarios una manera
más fácil y rápida de examinar grandes
cantidades de datos con aplicaciones cliente
como Power BI, Excel, Reporting Services y
aplicaciones de terceros o personalizadas.
40. Analysis Services - Precios
El costo total de Azure Analysis Services depende del nivel y de la instancia que elija. Azure
Analysis Services está disponible en los niveles Desarrollador, Básico y Estándar. En la tabla
siguiente, se exponen los diferenciadores de características clave entre los niveles:
Dentro de cada
nivel, el precio de
las instancias varía
en función de la
capacidad de
procesamiento, las
QPU y el tamaño
de la memoria.
41. Analysis Services - Precios
Nivel Desarrollador
El nivel Desarrollador se recomienda para fines de evaluación, desarrollo y pruebas. Incluye toda la
funcionalidad del nivel Estándar, pero con limitaciones en cuanto a la capacidad de proceso, las QPU y
el tamaño de la memoria. El nivel Desarrollador no ofrece ningún Acuerdo de Nivel de Servicio.
42. Analysis Services - Precios
Nivel Basic
El nivel Básico es un nivel para fines generales y está recomendado para soluciones de producción con
modelos tabulares reducidos, concurrencia de usuarios limitada y requisitos sencillos de actualización
de datos.
43. Analysis Services - Precios
Nivel Standard
El nivel Estándar está más indicado para
aplicaciones de producción críticas que
requieren concurrencia de usuarios elástica
y tienen modelos de datos que crecen con
rapidez. Cuenta con funcionalidad
avanzada de actualización de datos que
ayuda a los clientes a obtener
actualizaciones del modelo de datos casi
en tiempo real.
Escalado horizontal
Se pueden agregar instancias de escalado
a una instancia primaria para lograr un
procesamiento más rápido de los datos y
las consultas. El precio de las instancias de
escalado se calcula con la misma tarifa que
las instancias primarias.
44. Machine Learning
Machine Learning permite que los equipos aprendan a
partir de los datos y las experiencias y actúen sin haber
sido programados de forma específica. Los clientes
pueden crear aplicaciones de inteligencia artificial (IA) que
detecten, procesen y actúen de forma inteligente según la
información, lo que aumenta la capacidad humana, la
velocidad y la eficacia, y ayuda a las organizaciones a
llegar más lejos.
Un servicio en la nube totalmente administrado que le
permite crear, implementar y compartir fácilmente
soluciones de análisis predictivo.
45. Machine Learning
Puede trabajar desde una biblioteca de algoritmos lista para usar, utilizarlos para crear modelos en
un equipo conectado a Internet e implementar rápidamente la solución de predicción.
46. Machine Learning – Pasos a tener en cuenta
• Extraer la información: la capacidad de leer información
de múltiples orígenes de datos es enorme, incluso de
aquellos no estructurados.
• Procesarla y tratarla: aquí está el trabajo principal ya
que la cantidad que necesitemos hacer con la
información es infinita pero siempre debemos tener en
cuenta el paso a paso y una regla importante a tener en
cuenta en este paso es siempre: preparar la información
(quitar información que no queremos), normalizarla y
evaluarla según los algoritmos que consideremos y que
trataré más adelante.
• Salida: una vez que tenemos los resultados procesados
tendremos gran cantidad de posibilidades donde volcar
la información aunque si nuestro objetivo es explotarla
más adelante deberíamos almacenarla en un sitio igual
de accesible en el futuro (Azure Databases, Blobs, etc.)
49. Machine Learning – Precios
Precios de API web de producción
Azure Machine Learning permite implementar soluciones de análisis predictivo como servicios web.
51. Power BI
Power BI es un conjunto de herramientas de análisis empresarial que pone el
conocimiento al alcance de toda la organización. Conexión a cientos de orígenes de
datos, preparación de datos simplificada, generación de análisis ad hoc. Bellos
informes que luego se publican para provecho de la organización en la Web y en
dispositivos móviles.
52. BI Entrenamientos – iT Synergy
ART - ENO -
Consolidado de
Entrenamiento
AAAA.xlsx
Azure SQL database
Motivo Solicitud
IdMotivoPK
MotivoMotivo Solicitud
IdMotivoPK
Motivo
Motivo Solicitud
IdMotivoPK
Motivo
Azure SQL database
Motivo Solicitud
IdMotivoPK
Motivo
Data Factory
Azure
Analysis
Services
Data FactorySharePoint
Power BI
57. BI Enrenamientos – iT Synergy Azure - Analysis Services
1. Server name: Type a unique name used to
reference the server.
2. Subscription: Select the subscription this server
bills to.
3. Resource group: These containers are designed
to help you manage a collection of Azure
resources. To learn more, see resource groups.
4. Location: This Azure datacenter location hosts the
server. Choose a location nearest your largest user
base.
5. Pricing tier: Select a pricing tier. Tabular models
up to 400 GB are supported. To learn more,
see Azure Analysis Services pricing.
4, Click Create.
To create a server in Azure portal
1. Sign in to the Azure portal.
2. Click + New > Data + analytics > Analysis
Services.
3. In the Analysis Services blade, fill in the
required fields, and then press Create.
60. Referencias
• Metodología para el Diseño e Implantación de un Sistema de BI
https://decisionesytecnologia.wordpress.com/2013/02/07/metodologia-para-el-diseno-e-implantacion-de-
un-sistema-de-bi/
• Microsoft Azure – Productos y precios
https://azure.microsoft.com/es-es/
• Azure Inteligencia empresarial
https://azure.microsoft.com/es-es/solutions/business-intelligence/