2. Índice
Introducción
Componentes de BI
Fuentes de Información
Calidad de datos
ETL
DWH
Data Marts
Herramientas de BI
OLAP
Datamining
Visualización
Preguntas
Conclusión
Recomendación
Bibliografía
3. Introducción
Actualmente, gran número de compañías requieren
una adecuada toma de decisiones, por lo que la
información que se quiere investigar sobre los
diferentes elementos de la organización se
encuentran en bases de datos u otras fuentes que
posee la empresa. Es por ello que nace la necesidad
de un esquema de solución de BI.
¿Cuál es la información requerida para gestionar y
tomar decisiones?
¿Cuál debe ser el formato y composición de los
datos a utilizar?
¿De dónde proceden esos datos y cual es la
disponibilidad y periodicidad requerida?
5. Componentes de BI
• Alimentan de información el DWH Fuentes de
información
• Extracción, transformación y carga de los datos
en el DWH. Los datos se transforman, limpian,
filtran y redefinen
ETL
• Almacena los datos logrando su flexibilidad,
facilidad de acceso y administración
DWH
• Herramientas de visualización, análisis y
navegación
Herramientas
• Cálculos, consultas, planeamiento, pronostico y
análisis de escenarios en big data
OLAP
7. Fuentes de información
Sistemas
operacionales
Sistemas
departamentales
Fuentes externas
ERP
CRM
SCM
Legacy
Previsiones
Presupuestos
Hojas de
cálculo
Otros
Estudios de
mercado
Índices de la
industria
Estadísticas y
censos
WWW
8. Calidad de los datos
Integridad
Coherencia
Totalidad
Precisión Calidad
Validez
Disponibili-dad
Accesibili-dad
9. Extracción, transformación y
carga (ETL)
• Recuperar los datos físicamente de las
fuentes de información. Datos en bruto Extracción
• Corregir errores, eliminar duplicados,
completar vacíos. Limpieza
• Estructurar y sumariar los datos en
modelos de análisis de las áreas. Transformación
• Validar la consistencia e integrar en
distintos modelos de datos Integración
Actualización • Añadir nuevos datos al DWH
10. Proceso de limpieza de
datos
• Identifica y aísla elementos individuales:
• Separa nombre completo en nombre, primer
apellido, segundo apellido.
• Corrige valores individuales usando algoritmos
• Comprueba dirección y código postal
correspondiente
• Transforma valores en formatos definidos y
consistentes.
• Busca y relaciona los registros, corrigiéndolos y
estandarizándolos.
• Elimina duplicados.
Depurar
Corregir
Estandarizar
Relacionar
Consolidar • Analiza e identifica relaciones entre registros
relacionados y los consolida
11. Herramientas de ETL
Gestión de
Metadata
Extracción
Transforma
-ción
ETL Diseño
gráfico
Carga
Servicios
de
transporte
Administra-ción
y
operación
12. Datawarehouse (DWH)
Hugh J. Watson
• “Un Datawarehouse es una colección de información
creada para soportar las aplicaciones de toma de
decisiones”
Bill Inmon
• “Es un conjunto no volátil de información que soporta la
toma de decisiones, Orientado sobre un área, integrado
al tiempo.”
Ralph Kimbal
• “El Datawarehouse da acceso a la información de la
corporación o área funcional. El alcance del
Datawarehouse puede ser bien un departamento o bien
corporativo.”
13. Datawarehouse (DWH)
Hugh J. Watson
• “Datawarehousing es el proceso completo de extraer
información, transformarla y cargarla en un
Datawarehouse y el acceso a esta información por los
usuarios finales y las aplicaciones”
Sharon Sibigthroth
• “Descubres el valor real de un Datawarehouse cuando
alguien puede encontrar los detalles importantes en la
información, y te dice algo que puede generar la
diferencia”.
16. Estrategias de construcción de
un DWH
W.H Inmon
• Definir un DWH corporativo y a partir de él ir
construyendo los modelos de análisis para los
distintos niveles y departamentos de la
organización; es decir, una estrategia de arriba
abajo, desde la estrategia a lo más operativo.
R. Kimball
• Construir distintos Data Marts que cubran las
distintas necesidades de la organización, sin la
necesidad de construir un Datawarehouse.
17. Componentes y factores de
DWH
Metadata Información de la información. Contiene el significado de los
componentes que residen en el Datawarehouse (o Data Mart) y sus
atributos. Es útil para tecnología y los usuarios funcionales.
Operational
Data Store
(ODS)
Consolidan datos de distintas fuentes y sistemas no integrados y
facilitan un acceso online integrado sobre esa información. Proporciona
información integrada con el fin de facilitar la toma de decisiones en
entornos operacionales. Sus datos son volátiles (dos o tres meses) y se
actualizan en tiempo real. Es una fuente de datos para el DWS.
Factores para
implementar
DHW
1. Tamaño y volumen de datos del Datawarehouse 2. Complejidad de
los esquemas de datos. 3. Número de usuarios concurrente. 4.
Complejidad de las consultas
Gestión del
Datawarehouse
Los usuarios de negocio necesitan tomar decisiones por lo que debemos
asegurar: 1. Alta disponibilidad. 2. Rendimiento. 3. Copias de seguridad
y recuperación. 4. Recuperación física en caliente.
18. Herramientas de BI
Herramienta Descripción
Generadores de
informes
Utilizadas por desarrolladores profesionales
para crear informes estándar para grupos,
departamentos o la organización.
Herramientas de
usuario final de
consultas e informes
Empleadas por usuarios finales para crear
informes para ellos mismos o para otros; no
requieren programación.
Herramientas OLAP Permiten tratar la información de forma
multidimensional para explorarla desde
distintas perspectivas y periodos de tiempo.
Herramientas de
Dashboard y
Scorecard
Muestran información crítica de rendimiento
utilizando iconos gráficos pudiendo ver más
detalle e informes.
19. Herramientas de BI
Herramienta Descripción
Herramientas de
planificación,
modelización y
consolidación
Permiten crear planes de negocio,
simulaciones, planificación, presupuestos,
previsiones, etc. Proveen a los dashboards y
Scorecard de objetivos y umbrales de las
métricas
Herramientas
Datamining
Permiten crear modelos estadísticos de las
actividades de los negocios. Descubren e
interpretan patrones desconocidos en la
información para resolver problemas de
negocio.
21. Tipos de OLAP
Tipo Descripción
Relational
OLAP
(ROLAP)
Acceden directamente a la base de datos relacional. No
tiene limitaciones en cuanto al tamaño, pero es más lento
que MOLAP.
Multimensional
OLAP
(MOLAP)
Accede directamente a una base de datos
multidimensional. Es muy rápida en los tiempos de
respuesta, pero si queremos cambiar las dimensiones,
debemos cargar de nuevo el cubo
Hybrid OLAP
(HOLAP)
Accede a los datos de alto nivel en una base de datos
multidimensional y a los atómicos directamente sobre la
base de datos relacional. Utiliza las ventajas del ROLAP y
del MOLAP.
Desktop OLAP
(DOLAP)
Crea un cubo en la memoria del ordenador y cuando
finaliza lo elimina de memoria. El usuario sólo recibe y
analiza las dimensiones en los que está interesado y
en forma local.
25. Preguntas capítulo 04
¿Que entendemos por proceso ETL?
¿Cuál es la utilidad de los
Datawarehouse o almacenes de datos?
¿Qué son los Data Mart?
¿En que consisten los cubos OLAP?
26. Conclusiones
BI se compone de diversos elementos, como lo son:
• Fuentes de información
• Herramientas de ETL
• Data Warehouse y Data Mart
• Herramientas de BI
• Queries y reports
• OLAP
• Interfaz y visualización (Scorecards y Dashboards)
• Data Mining
Gracias a BI, podemos identificar lo que está pasando,
entender por qué pasa, ayudar a predecir que va a pasar y
tomar las medidas necesarias.
27. Recomendaciones
Adecuada planificación
Contemplar elementos como la información
que se necesita
Detallar el uso de la misma,
Determinar a quien va dirigido
Analizar minuciosamente los aspectos
técnicos como lo son
tiempo de respuesta,
integración,
seguridad,
navegación,
entorno gráfico.
28. Bibliografía
Cano, Josep. 2007. Business
Intelligence: Competir con Información.
España, Barcelona. Banesto, Fundación
Cultural.
Notas del editor
1. Precisión: ¿Representan los datos con precisión una realidad o una fuente de datos que se pueda verificar?
2. Integridad: ¿Se mantienen constantemente la estructura de los datos y las relaciones a través de las entidades y los atributos?
3. Coherencia: ¿Son los elementos de datos constantemente definidos y comprendidos?
4. Totalidad: ¿Están todos los datos necesarios?
5. Validez: ¿Son los valores aceptables en los rangos definidos por el negocio?
6. Disponibilidad: ¿Están los datos disponibles cuando se necesitan?
7. Accesibilidad: ¿Se puede acceder a los datos fácil y comprensiblemente?
1. Precisión: ¿Representan los datos con precisión una realidad o una fuente de datos que se pueda verificar?
2. Integridad: ¿Se mantienen constantemente la estructura de los datos y las relaciones a través de las entidades y los atributos?
3. Coherencia: ¿Son los elementos de datos constantemente definidos y comprendidos?
4. Totalidad: ¿Están todos los datos necesarios?
5. Validez: ¿Son los valores aceptables en los rangos definidos por el negocio?
6. Disponibilidad: ¿Están los datos disponibles cuando se necesitan?
7. Accesibilidad: ¿Se puede acceder a los datos fácil y comprensiblemente?
Los Data Mart están dirigidos a una comunidad de usuarios dentro de la organización, que puede estar formada por los miembros de un departamento, o por los usuarios de un determinado nivel organizativo, o por un grupo de trabajo multidisciplinar con objetivos comunes.
Los Data Mart están dirigidos a una comunidad de usuarios dentro de la organización, que puede estar formada por los miembros de un departamento, o por los usuarios de un determinado nivel organizativo, o por un grupo de trabajo multidisciplinar con objetivos comunes.
Los Data Mart están dirigidos a una comunidad de usuarios dentro de la organización, que puede estar formada por los miembros de un departamento, o por los usuarios de un determinado nivel organizativo, o por un grupo de trabajo multidisciplinar con objetivos comunes.