SlideShare una empresa de Scribd logo
1 de 29
Data Integration & Data QualityData Integration & Data Quality
Your open source based BI solution!!
by
Introducción a Data Quality
Qué es
Por qué
Conceptos
Beneficios de Data Quality
Data Quality & Business Intelligence
Pilares del BI
Integración de datos
Mejores prácticas
Opensource & Data Quality
Data Quality & Pentaho (PDI)
PDI / ETLs / Integridad / Validación
Data Cleaner
Integración Data Cleaner y PDI
Índice
Contacto Inicial
Confían en Business Intelligence Open Source
Sector Privado
Sector Público
Introducción a Data QualityIntroducción a Data Quality
http://optimizeyourdataquality.wordpress.com/
Introducción
¿Qué es Data Quality?¿Qué es Data Quality?
Definición no estándar
“Proceso constante de percepción o evaluación
del grado de conveniencia de los datos que
sirven para un propósito en un determinado
contexto”
Búsqueda de atributos en los datos:
Precisión
Fidelidad
Integridad
Relevancia
http://unitar.org
Introducción
¿Por qué Data Quality?¿Por qué Data Quality?
Introducción
ConceptosConceptos
Gobernanza de datos
Toma de decisiones
mejor y más rápida
Crítico disponer de
datos de calidad
Introducción
Fundamental realizar tareas de Data Quality en los
procesos de integración de datos
Beneficios de Data QualityBeneficios de Data Quality
Introducción
Segmentación de clientes adecuada  Satisfacción de clientes
Evita tratar información errónea  Reducción de costes
Mayor confianza y valor de la información
Mejor eficacia en los procesos de negocio Incremento en los
ingresos
& Business& Business
IntelligenceIntelligence
¿Qué es Business Intelligence?
(BI)
Habilidad para transformar
datos en información,
información en conocimiento y
optimizar el proceso de toma
de decisiones en los negocios
Data Quality & Business Intelligence
Herramientas Visuales para un
Análisis óptimo y sencillo
Datos robustos y confiables
Pilares del Business IntelligencePilares del Business Intelligence
Procesos involucrados:
•Integración de datos
•Explotación de información
Integración de datosIntegración de datos
Clave para cualquier proyecto BI
ETL = Extract, Transform and Load
Proceso para mover datos de diferentes fuentes, tratarlos y
cargarlos en bases de datos unificadas: data warehouse / data
marts.
Data Quality & Business Intelligence
Tareas principales:
Extraer datos de múltiples fuentes
Aplicar calidad y consistencia (limpiar) a los datos
Conformar (unificar) los datos
Cargar los datos en un DW
http://blog.bootstraptoday.com
CRM
ERP
BPM
CMS
Data Quality & Business Intelligence
DESAFÍOS:
Fuentes heterogéneas
Grandes volúmenes de datos
Mejorar eficiencia operativa
Sincronismo de las fuentes
Escalabilidad
Integración de datos y Data Quality muy relacionadosIntegración de datos y Data Quality muy relacionados
Integración de datosIntegración de datos
El Proceso de Data Quality puede realizarse de forma:
Manual  Consultas ad-hoc, búsqueda en ficheros, etc…
Automatizada  Incluido en el proceso de integración de datos
Son métodos complementarios, aunque:
Tareas de Data Quality como parte del proceso de Integración de Datos (ETL)Tareas de Data Quality como parte del proceso de Integración de Datos (ETL)
Data Quality & Business Intelligence
Integración de datosIntegración de datos
Mejores prácticas en ETLMejores prácticas en ETL
Centralizar procedimientos: asegura la homogeneidad y coherencia de
datos de diferentes fuentes.
Evitar redundancia de cálculos: si un dato está calculado en origen, no
volver a calcularlo. Mejora el rendimiento y evita posibles inconsistencias.
Establecer puntos de “control de calidad”: asegura la ejecución en puntos
clave del proceso y permite registrar información de seguimiento para
futuras auditorías.
Implementar procesos de recarga de la información: útiles ante posibles
errores de carga inicial.
Utilizar estructuras intermedias: facilita la monitorización y seguimiento del
proceso.
Data Quality & Business Intelligence
Mejores prácticas en ETLMejores prácticas en ETL
Data Quality & Business Intelligence
Procesos centralizados
y estandarizados
Puntos de control y registro
Estructuras intermedias
Aplicar filosofía BI al
proceso de calidad de
datos
Explotar y analizar
resultados de Data Quality
Permite
Opensource &Opensource &
Herramientas ETL y Data QualityHerramientas ETL y Data Quality
Pentaho Data Integration
Talend Open Studio
DataCleaner
Talend Data Quality
Google Refine
Opensource & Data Quality
Algunas Soluciones Data Quality Opensource:
Principales Soluciones ETL Opensource
Data Quality & Pentaho Data IntegrationData Quality & Pentaho Data Integration
Herramienta ETL intuitiva basada en trabajos y transformaciones
Libertad para decidir dónde y cómo realizar tareas de: profiling, cleansing,
integrity, validation; en base a metadatos.
Disponibilidad en transformaciones de componentes orientados a Data
Quality:
No es herramienta pura de profiling, pero se puede integrar DataCleaner
Arquitectura de Plug-in que permite expandir sus funcionalidades.
Opensource & Data Quality
Opensource & Data Quality
Variedad de componentes:
Limpieza
Scripting (sql, javascript)
Validación
Estadísticas
Etc…
Data Quality & Pentaho Data IntegrationData Quality & Pentaho Data Integration
Data Quality & Pentaho Data IntegrationData Quality & Pentaho Data Integration
Opensource & Data Quality
Importante buen diseño de ETL distribuido en fases:
1. Preparación del proceso
2. Recepción de datos
3. Procesamiento de datos
4. Carga final
5. Informes de resultados
6. Control de actividades transversal
Este planteamiento permite:
Estandarizar los procesos en una organización
Escalar mejor al incrementar el número de fuentes
Controlar de forma centralizada los resultados de los procesos
Data CleanerData Cleaner
Opensource & Data Quality
Herramienta de Profiling recomendada por Pentaho
Alternativas de uso:
Herramienta de escritorio
Herramienta web
Plugin para PDI
Data Cleaner DesktopData Cleaner Desktop
Opensource & Data Quality
Funcionalidades:
Limpieza de datos
Definición de
diccionarios de datos
Búsqueda de patrones,
duplicados, nulos, etc.
Monitorización
Estadísticas de
resultados completa
Etc.
Data Cleaner Monitor (web)Data Cleaner Monitor (web)
Opensource & Data Quality
Funcionalidades:
Monitorización
centralizada
Visualización elegante
Programación de
trabajos Data Cleaner y
PDI
Definición de métricas
propias
Etc.
Integración Data Cleaner / PDIIntegración Data Cleaner / PDI
Opensource & Data Quality
Al instalar el plugin de Data Cleaner para PDI, existen dos posibles uso:
Opción A Hacer profiling de los datos resultantes de un paso PDI
Integración Data Cleaner / PDIIntegración Data Cleaner / PDI
Opensource & Data Quality
Al instalar el plugin de Data Cleaner para PDI, existen dos posibles uso:
Opción B Ejecutar un trabajo de Data Cleaner
Referencias
International Association for Information and Data
Quality:
http://iaidq.org/
Pentaho Data Integration:
http://www.pentaho.com/explore/pentaho-data-integration/
Data Cleaner:
http://datacleaner.org/
Stratebi: Quiénes somos
www.TodoBI.com
info@stratebi.com
www.stratebi.com
Mas información
Tfno: 91.788.34.10
MadridMadrid: Pº de la Castellana, 164, 1º
BarcelonaBarcelona: C/ Valencia, 63
BrasilBrasil:: Av. Paulista, 37 4 andar

Más contenido relacionado

La actualidad más candente

Inteligancia de negocios
Inteligancia de negociosInteligancia de negocios
Inteligancia de negociosEdgar Barrios
 
Herramientas de business intelligence
Herramientas de business intelligenceHerramientas de business intelligence
Herramientas de business intelligencelears0
 
Business intelligence-solutions 2012
Business intelligence-solutions 2012Business intelligence-solutions 2012
Business intelligence-solutions 2012Stratebi
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata
 
¿Qué es Tableau Software?
¿Qué es Tableau Software?¿Qué es Tableau Software?
¿Qué es Tableau Software?Expandiabusiness
 
066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatina066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatinaGeneXus
 
Inteligencia De Negocios, en Software Libre
Inteligencia De Negocios, en Software LibreInteligencia De Negocios, en Software Libre
Inteligencia De Negocios, en Software LibreSantiago Zarate
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Pentaho
 
Migración de aplicaciones.... y mis datos.pptx
Migración de aplicaciones.... y mis datos.pptxMigración de aplicaciones.... y mis datos.pptx
Migración de aplicaciones.... y mis datos.pptxPowerData
 
Data integration
Data integrationData integration
Data integrationPowerData
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business IntelligenceCarlos Escobar
 
Aplicaciones de BI con Pentaho
Aplicaciones de BI con PentahoAplicaciones de BI con Pentaho
Aplicaciones de BI con PentahoDatalytics
 
Inteligencia de negocios 5
Inteligencia de negocios 5 Inteligencia de negocios 5
Inteligencia de negocios 5 thearcangelboss
 
Overview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaOverview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaEfimatica
 
Introducción al BI con pentaho
Introducción al BI con pentahoIntroducción al BI con pentaho
Introducción al BI con pentahoIván Ruiz-Rube
 
Una visión integrada para el estado de chile
Una visión integrada para el estado de chileUna visión integrada para el estado de chile
Una visión integrada para el estado de chilePowerData
 
Modelos de datos relacionales y no relacionales
Modelos de datos relacionales y no relacionalesModelos de datos relacionales y no relacionales
Modelos de datos relacionales y no relacionalesBEEVA_es
 
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningArquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningDenodo
 

La actualidad más candente (20)

Inteligancia de negocios
Inteligancia de negociosInteligancia de negocios
Inteligancia de negocios
 
Herramientas de business intelligence
Herramientas de business intelligenceHerramientas de business intelligence
Herramientas de business intelligence
 
Business intelligence-solutions 2012
Business intelligence-solutions 2012Business intelligence-solutions 2012
Business intelligence-solutions 2012
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData Company
 
¿Qué es Tableau Software?
¿Qué es Tableau Software?¿Qué es Tableau Software?
¿Qué es Tableau Software?
 
066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatina066 como implementar un data warehouse de manera paulatina
066 como implementar un data warehouse de manera paulatina
 
Inteligencia De Negocios, en Software Libre
Inteligencia De Negocios, en Software LibreInteligencia De Negocios, en Software Libre
Inteligencia De Negocios, en Software Libre
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
 
Ciclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negociosCiclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negocios
 
Migración de aplicaciones.... y mis datos.pptx
Migración de aplicaciones.... y mis datos.pptxMigración de aplicaciones.... y mis datos.pptx
Migración de aplicaciones.... y mis datos.pptx
 
Data integration
Data integrationData integration
Data integration
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Aplicaciones de BI con Pentaho
Aplicaciones de BI con PentahoAplicaciones de BI con Pentaho
Aplicaciones de BI con Pentaho
 
Inteligencia de negocios 5
Inteligencia de negocios 5 Inteligencia de negocios 5
Inteligencia de negocios 5
 
Overview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaOverview sap bo girona nib efimatica
Overview sap bo girona nib efimatica
 
Introducción al BI con pentaho
Introducción al BI con pentahoIntroducción al BI con pentaho
Introducción al BI con pentaho
 
Una visión integrada para el estado de chile
Una visión integrada para el estado de chileUna visión integrada para el estado de chile
Una visión integrada para el estado de chile
 
Modelos de datos relacionales y no relacionales
Modelos de datos relacionales y no relacionalesModelos de datos relacionales y no relacionales
Modelos de datos relacionales y no relacionales
 
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningArquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
 
Porque Pentaho ?
Porque Pentaho ?Porque Pentaho ?
Porque Pentaho ?
 

Destacado

Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETLJorge Bustillos
 
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y AnalíticaWebinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y AnalíticaIT-NOVA
 
Marketing CRM Intelligence Open Source
Marketing CRM Intelligence Open SourceMarketing CRM Intelligence Open Source
Marketing CRM Intelligence Open SourceStratebi
 
TALEND ETL Introducción
TALEND ETL IntroducciónTALEND ETL Introducción
TALEND ETL IntroducciónSoftware
 
OpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio AriasOpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio AriasOpenAnalytics Spain
 
Migración de datos con OpenERP-Kettle
Migración de datos con OpenERP-KettleMigración de datos con OpenERP-Kettle
Migración de datos con OpenERP-Kettleraimonesteve
 
Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...
Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...
Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...Gabriele Baldassarre
 
Intro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data IntegrationIntro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data IntegrationPhilip Yurchuk
 
Talend Big Data Capabilities Overview
Talend Big Data Capabilities OverviewTalend Big Data Capabilities Overview
Talend Big Data Capabilities OverviewRajan Kanitkar
 
Open Source ETL using Talend Open Studio
Open Source ETL using Talend Open StudioOpen Source ETL using Talend Open Studio
Open Source ETL using Talend Open Studiosantosluis87
 
Elementos ETL - Kettle Pentaho
Elementos ETL - Kettle Pentaho Elementos ETL - Kettle Pentaho
Elementos ETL - Kettle Pentaho valex_haro
 
14.03.23 livro sobre pentaho
14.03.23   livro sobre pentaho14.03.23   livro sobre pentaho
14.03.23 livro sobre pentahoTalita Lima
 
Exercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationExercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationJarley Nóbrega
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Stratebi
 
Informatica Pentaho Etl Tools Comparison
Informatica Pentaho Etl Tools ComparisonInformatica Pentaho Etl Tools Comparison
Informatica Pentaho Etl Tools ComparisonRoberto Espinosa
 
Manipulacion de datos con Kettle
Manipulacion de datos con KettleManipulacion de datos con Kettle
Manipulacion de datos con KettleMarcos Pierri
 
Data quality and data profiling
Data quality and data profilingData quality and data profiling
Data quality and data profilingShailja Khurana
 

Destacado (20)

Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETL
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y AnalíticaWebinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
 
Marketing CRM Intelligence Open Source
Marketing CRM Intelligence Open SourceMarketing CRM Intelligence Open Source
Marketing CRM Intelligence Open Source
 
TALEND ETL Introducción
TALEND ETL IntroducciónTALEND ETL Introducción
TALEND ETL Introducción
 
Talend
TalendTalend
Talend
 
OpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio AriasOpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio Arias
 
Migración de datos con OpenERP-Kettle
Migración de datos con OpenERP-KettleMigración de datos con OpenERP-Kettle
Migración de datos con OpenERP-Kettle
 
Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...
Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...
Talend Open Studio Fundamentals #1: Workspaces, Jobs, Metadata and Trips & Tr...
 
Intro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data IntegrationIntro to Talend Open Studio for Data Integration
Intro to Talend Open Studio for Data Integration
 
Talend Big Data Capabilities Overview
Talend Big Data Capabilities OverviewTalend Big Data Capabilities Overview
Talend Big Data Capabilities Overview
 
Open Source ETL using Talend Open Studio
Open Source ETL using Talend Open StudioOpen Source ETL using Talend Open Studio
Open Source ETL using Talend Open Studio
 
Elementos ETL - Kettle Pentaho
Elementos ETL - Kettle Pentaho Elementos ETL - Kettle Pentaho
Elementos ETL - Kettle Pentaho
 
14.03.23 livro sobre pentaho
14.03.23   livro sobre pentaho14.03.23   livro sobre pentaho
14.03.23 livro sobre pentaho
 
Exercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data IntegrationExercícios - Tutorial ETL com Pentaho Data Integration
Exercícios - Tutorial ETL com Pentaho Data Integration
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
 
Competidores y productos de mercado de ETL
Competidores y productos de mercado de ETLCompetidores y productos de mercado de ETL
Competidores y productos de mercado de ETL
 
Informatica Pentaho Etl Tools Comparison
Informatica Pentaho Etl Tools ComparisonInformatica Pentaho Etl Tools Comparison
Informatica Pentaho Etl Tools Comparison
 
Manipulacion de datos con Kettle
Manipulacion de datos con KettleManipulacion de datos con Kettle
Manipulacion de datos con Kettle
 
Data quality and data profiling
Data quality and data profilingData quality and data profiling
Data quality and data profiling
 

Similar a Data Integration & Data Quality Open Source (spanish)

24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...SpanishPASSVC
 
Asegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligenceAsegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligenceMary Arcia
 
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...FranciscoMorales392133
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8John Bulla
 
2021 09 22 Calidad Datos V1.1.pdf
2021 09 22 Calidad Datos V1.1.pdf2021 09 22 Calidad Datos V1.1.pdf
2021 09 22 Calidad Datos V1.1.pdfNathalLpez
 
3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datosIT-NOVA
 
Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)Alejandro Indarte
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data ManagementLuis Ortiz
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data ManagementLuis Ortiz
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzadaElena Lopez
 
PresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN EmpresarialPresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN Empresarialaho
 
PresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN EmpresarialPresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN Empresarialguest71dcfd
 
Lanzamiento De La Gtm De Bi
Lanzamiento De La Gtm De BiLanzamiento De La Gtm De Bi
Lanzamiento De La Gtm De Bisidasa
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligencegrupo nkjr
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 

Similar a Data Integration & Data Quality Open Source (spanish) (20)

24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
 
Asegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligenceAsegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligence
 
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
 
Fundamentos dw
Fundamentos dwFundamentos dw
Fundamentos dw
 
ACL
ACLACL
ACL
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
2021 09 22 Calidad Datos V1.1.pdf
2021 09 22 Calidad Datos V1.1.pdf2021 09 22 Calidad Datos V1.1.pdf
2021 09 22 Calidad Datos V1.1.pdf
 
Calidad de datos
Calidad de datos Calidad de datos
Calidad de datos
 
3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos
 
Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data Management
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data Management
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzada
 
Data pipeline
Data pipelineData pipeline
Data pipeline
 
PresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN EmpresarialPresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN Empresarial
 
PresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN EmpresarialPresentacióN Sistemas De InformacióN Empresarial
PresentacióN Sistemas De InformacióN Empresarial
 
Lanzamiento De La Gtm De Bi
Lanzamiento De La Gtm De BiLanzamiento De La Gtm De Bi
Lanzamiento De La Gtm De Bi
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 

Más de Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 
El Futuro del Business Intelligence
El Futuro del Business IntelligenceEl Futuro del Business Intelligence
El Futuro del Business IntelligenceStratebi
 

Más de Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 
El Futuro del Business Intelligence
El Futuro del Business IntelligenceEl Futuro del Business Intelligence
El Futuro del Business Intelligence
 

Último

Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedadesLas sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedadesPatrickSteve4
 
CONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdf
CONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdfCONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdf
CONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdfTeresa Rc
 
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptxi7ingenieria
 
Manual de Imagen Personal y uso de uniformes
Manual de Imagen Personal y uso de uniformesManual de Imagen Personal y uso de uniformes
Manual de Imagen Personal y uso de uniformesElizabeth152261
 
Sostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptxSostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptxmarlonrea6
 
Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...
Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...
Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...MIGUELANGELLEGUIAGUZ
 
DIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptx
DIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptxDIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptx
DIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptx7500222160
 
GUIA UNIDAD 3 costeo variable fce unc.docx
GUIA UNIDAD 3 costeo variable fce unc.docxGUIA UNIDAD 3 costeo variable fce unc.docx
GUIA UNIDAD 3 costeo variable fce unc.docxAmyKleisinger
 
Maria_diaz.pptx mapa conceptual gerencia industral
Maria_diaz.pptx mapa conceptual   gerencia industralMaria_diaz.pptx mapa conceptual   gerencia industral
Maria_diaz.pptx mapa conceptual gerencia industralmaria diaz
 
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADADECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADAgordonruizsteffy
 
EL REFERENDO para una exposición de sociales
EL REFERENDO para una exposición de socialesEL REFERENDO para una exposición de sociales
EL REFERENDO para una exposición de socialeszaidylisbethnarvaezm
 
Presentacion encuentra tu creatividad papel azul.pdf
Presentacion encuentra tu creatividad papel azul.pdfPresentacion encuentra tu creatividad papel azul.pdf
Presentacion encuentra tu creatividad papel azul.pdfaldonaim115
 
2 Tipo Sociedad comandita por acciones.pptx
2 Tipo Sociedad comandita por acciones.pptx2 Tipo Sociedad comandita por acciones.pptx
2 Tipo Sociedad comandita por acciones.pptxRicardo113759
 
CRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docx
CRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docxCRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docx
CRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docxgeuster2
 
Empresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercadoEmpresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercadoPsicoterapia Holística
 
CARPETA PEDAGOGICA 2024 ARITA.sadasdasddocx
CARPETA PEDAGOGICA 2024 ARITA.sadasdasddocxCARPETA PEDAGOGICA 2024 ARITA.sadasdasddocx
CARPETA PEDAGOGICA 2024 ARITA.sadasdasddocxWILIANREATEGUI
 
DISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBRE
DISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBREDISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBRE
DISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBREdianayarelii17
 
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdfSENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdfJaredQuezada3
 
Contabilidad Gubernamental guia contable
Contabilidad Gubernamental guia contableContabilidad Gubernamental guia contable
Contabilidad Gubernamental guia contableThairyAndreinaLira1
 
Correcion del libro al medio hay sitio.pptx
Correcion del libro al medio hay sitio.pptxCorrecion del libro al medio hay sitio.pptx
Correcion del libro al medio hay sitio.pptxHARLYJHANSELCHAVEZVE
 

Último (20)

Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedadesLas sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
 
CONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdf
CONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdfCONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdf
CONSTITUCIÓN POLÍTICA DEL PERÚ al 25082023.pdf
 
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
 
Manual de Imagen Personal y uso de uniformes
Manual de Imagen Personal y uso de uniformesManual de Imagen Personal y uso de uniformes
Manual de Imagen Personal y uso de uniformes
 
Sostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptxSostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptx
 
Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...
Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...
Tesis_liderazgo_desempeño_laboral_colaboradores_cooperativa_agraria_rutas_Inc...
 
DIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptx
DIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptxDIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptx
DIAPOSITIVAS LIDERAZGO Y GESTION INTERGENERACION (3).pptx
 
GUIA UNIDAD 3 costeo variable fce unc.docx
GUIA UNIDAD 3 costeo variable fce unc.docxGUIA UNIDAD 3 costeo variable fce unc.docx
GUIA UNIDAD 3 costeo variable fce unc.docx
 
Maria_diaz.pptx mapa conceptual gerencia industral
Maria_diaz.pptx mapa conceptual   gerencia industralMaria_diaz.pptx mapa conceptual   gerencia industral
Maria_diaz.pptx mapa conceptual gerencia industral
 
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADADECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
 
EL REFERENDO para una exposición de sociales
EL REFERENDO para una exposición de socialesEL REFERENDO para una exposición de sociales
EL REFERENDO para una exposición de sociales
 
Presentacion encuentra tu creatividad papel azul.pdf
Presentacion encuentra tu creatividad papel azul.pdfPresentacion encuentra tu creatividad papel azul.pdf
Presentacion encuentra tu creatividad papel azul.pdf
 
2 Tipo Sociedad comandita por acciones.pptx
2 Tipo Sociedad comandita por acciones.pptx2 Tipo Sociedad comandita por acciones.pptx
2 Tipo Sociedad comandita por acciones.pptx
 
CRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docx
CRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docxCRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docx
CRITERIOS DE EVALUACIÓN - NIVEL INICIAL.docx
 
Empresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercadoEmpresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercado
 
CARPETA PEDAGOGICA 2024 ARITA.sadasdasddocx
CARPETA PEDAGOGICA 2024 ARITA.sadasdasddocxCARPETA PEDAGOGICA 2024 ARITA.sadasdasddocx
CARPETA PEDAGOGICA 2024 ARITA.sadasdasddocx
 
DISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBRE
DISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBREDISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBRE
DISEÑO DE ESTRATEGIAS EN MOMENTOS DE INCERTIDUMBRE
 
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdfSENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
 
Contabilidad Gubernamental guia contable
Contabilidad Gubernamental guia contableContabilidad Gubernamental guia contable
Contabilidad Gubernamental guia contable
 
Correcion del libro al medio hay sitio.pptx
Correcion del libro al medio hay sitio.pptxCorrecion del libro al medio hay sitio.pptx
Correcion del libro al medio hay sitio.pptx
 

Data Integration & Data Quality Open Source (spanish)

  • 1. Data Integration & Data QualityData Integration & Data Quality Your open source based BI solution!! by
  • 2. Introducción a Data Quality Qué es Por qué Conceptos Beneficios de Data Quality Data Quality & Business Intelligence Pilares del BI Integración de datos Mejores prácticas Opensource & Data Quality Data Quality & Pentaho (PDI) PDI / ETLs / Integridad / Validación Data Cleaner Integración Data Cleaner y PDI Índice
  • 4. Confían en Business Intelligence Open Source Sector Privado Sector Público
  • 5. Introducción a Data QualityIntroducción a Data Quality http://optimizeyourdataquality.wordpress.com/
  • 6. Introducción ¿Qué es Data Quality?¿Qué es Data Quality? Definición no estándar “Proceso constante de percepción o evaluación del grado de conveniencia de los datos que sirven para un propósito en un determinado contexto” Búsqueda de atributos en los datos: Precisión Fidelidad Integridad Relevancia http://unitar.org
  • 7. Introducción ¿Por qué Data Quality?¿Por qué Data Quality?
  • 9. Gobernanza de datos Toma de decisiones mejor y más rápida Crítico disponer de datos de calidad Introducción Fundamental realizar tareas de Data Quality en los procesos de integración de datos
  • 10. Beneficios de Data QualityBeneficios de Data Quality Introducción Segmentación de clientes adecuada  Satisfacción de clientes Evita tratar información errónea  Reducción de costes Mayor confianza y valor de la información Mejor eficacia en los procesos de negocio Incremento en los ingresos
  • 12. ¿Qué es Business Intelligence? (BI) Habilidad para transformar datos en información, información en conocimiento y optimizar el proceso de toma de decisiones en los negocios Data Quality & Business Intelligence Herramientas Visuales para un Análisis óptimo y sencillo Datos robustos y confiables Pilares del Business IntelligencePilares del Business Intelligence Procesos involucrados: •Integración de datos •Explotación de información
  • 13. Integración de datosIntegración de datos Clave para cualquier proyecto BI ETL = Extract, Transform and Load Proceso para mover datos de diferentes fuentes, tratarlos y cargarlos en bases de datos unificadas: data warehouse / data marts. Data Quality & Business Intelligence Tareas principales: Extraer datos de múltiples fuentes Aplicar calidad y consistencia (limpiar) a los datos Conformar (unificar) los datos Cargar los datos en un DW http://blog.bootstraptoday.com CRM ERP BPM CMS
  • 14. Data Quality & Business Intelligence DESAFÍOS: Fuentes heterogéneas Grandes volúmenes de datos Mejorar eficiencia operativa Sincronismo de las fuentes Escalabilidad Integración de datos y Data Quality muy relacionadosIntegración de datos y Data Quality muy relacionados Integración de datosIntegración de datos
  • 15. El Proceso de Data Quality puede realizarse de forma: Manual  Consultas ad-hoc, búsqueda en ficheros, etc… Automatizada  Incluido en el proceso de integración de datos Son métodos complementarios, aunque: Tareas de Data Quality como parte del proceso de Integración de Datos (ETL)Tareas de Data Quality como parte del proceso de Integración de Datos (ETL) Data Quality & Business Intelligence Integración de datosIntegración de datos
  • 16. Mejores prácticas en ETLMejores prácticas en ETL Centralizar procedimientos: asegura la homogeneidad y coherencia de datos de diferentes fuentes. Evitar redundancia de cálculos: si un dato está calculado en origen, no volver a calcularlo. Mejora el rendimiento y evita posibles inconsistencias. Establecer puntos de “control de calidad”: asegura la ejecución en puntos clave del proceso y permite registrar información de seguimiento para futuras auditorías. Implementar procesos de recarga de la información: útiles ante posibles errores de carga inicial. Utilizar estructuras intermedias: facilita la monitorización y seguimiento del proceso. Data Quality & Business Intelligence
  • 17. Mejores prácticas en ETLMejores prácticas en ETL Data Quality & Business Intelligence Procesos centralizados y estandarizados Puntos de control y registro Estructuras intermedias Aplicar filosofía BI al proceso de calidad de datos Explotar y analizar resultados de Data Quality Permite
  • 19. Herramientas ETL y Data QualityHerramientas ETL y Data Quality Pentaho Data Integration Talend Open Studio DataCleaner Talend Data Quality Google Refine Opensource & Data Quality Algunas Soluciones Data Quality Opensource: Principales Soluciones ETL Opensource
  • 20. Data Quality & Pentaho Data IntegrationData Quality & Pentaho Data Integration Herramienta ETL intuitiva basada en trabajos y transformaciones Libertad para decidir dónde y cómo realizar tareas de: profiling, cleansing, integrity, validation; en base a metadatos. Disponibilidad en transformaciones de componentes orientados a Data Quality: No es herramienta pura de profiling, pero se puede integrar DataCleaner Arquitectura de Plug-in que permite expandir sus funcionalidades. Opensource & Data Quality
  • 21. Opensource & Data Quality Variedad de componentes: Limpieza Scripting (sql, javascript) Validación Estadísticas Etc… Data Quality & Pentaho Data IntegrationData Quality & Pentaho Data Integration
  • 22. Data Quality & Pentaho Data IntegrationData Quality & Pentaho Data Integration Opensource & Data Quality Importante buen diseño de ETL distribuido en fases: 1. Preparación del proceso 2. Recepción de datos 3. Procesamiento de datos 4. Carga final 5. Informes de resultados 6. Control de actividades transversal Este planteamiento permite: Estandarizar los procesos en una organización Escalar mejor al incrementar el número de fuentes Controlar de forma centralizada los resultados de los procesos
  • 23. Data CleanerData Cleaner Opensource & Data Quality Herramienta de Profiling recomendada por Pentaho Alternativas de uso: Herramienta de escritorio Herramienta web Plugin para PDI
  • 24. Data Cleaner DesktopData Cleaner Desktop Opensource & Data Quality Funcionalidades: Limpieza de datos Definición de diccionarios de datos Búsqueda de patrones, duplicados, nulos, etc. Monitorización Estadísticas de resultados completa Etc.
  • 25. Data Cleaner Monitor (web)Data Cleaner Monitor (web) Opensource & Data Quality Funcionalidades: Monitorización centralizada Visualización elegante Programación de trabajos Data Cleaner y PDI Definición de métricas propias Etc.
  • 26. Integración Data Cleaner / PDIIntegración Data Cleaner / PDI Opensource & Data Quality Al instalar el plugin de Data Cleaner para PDI, existen dos posibles uso: Opción A Hacer profiling de los datos resultantes de un paso PDI
  • 27. Integración Data Cleaner / PDIIntegración Data Cleaner / PDI Opensource & Data Quality Al instalar el plugin de Data Cleaner para PDI, existen dos posibles uso: Opción B Ejecutar un trabajo de Data Cleaner
  • 28. Referencias International Association for Information and Data Quality: http://iaidq.org/ Pentaho Data Integration: http://www.pentaho.com/explore/pentaho-data-integration/ Data Cleaner: http://datacleaner.org/
  • 29. Stratebi: Quiénes somos www.TodoBI.com info@stratebi.com www.stratebi.com Mas información Tfno: 91.788.34.10 MadridMadrid: Pº de la Castellana, 164, 1º BarcelonaBarcelona: C/ Valencia, 63 BrasilBrasil:: Av. Paulista, 37 4 andar

Notas del editor

  1. Data Profiling: proceso de examinar los datos que existen en las fuentes de origen y recopilar estadísticas e información sobre los mismos. Data Cleansing: proceso de detectar y corregir datos corruptos, incoherentes o erróneos. Data Integrity: proceso de analizar la consistencia de los datos y las relaciones entre los diferentes conjuntos de datos. Data Validation: proceso de aplicar reglas de validación a los datos basándose en diccionarios de datos y/o reglas de negocio. Master Data Management: conjunto de procesos, políticas, estándares y herramientas que sirven para gestionar Datos Maestros de una organización (normalmente información no transaccional). Data Auditing: proceso de gestionar cómo los datos se ajustan a los propósitos definidos por la organización. Es necesario establecer las políticas necesarias. Actuar + Vigilar. Data Governance: concepto que engloba a todos los procesos anteriores y que permite a una organización disponer de una información confiable.