SlideShare una empresa de Scribd logo
1 de 33
Descargar para leer sin conexión
Asegurando la Calidad del Dato en
nuestros entornos de BI
Mary Arcia
SQL PASS Venezuela
maryarcia@outlook.com
@maryarcia
https://ve.linkedin.com/pub/mary-arcia/
Blog: geeks.ms/blogs/marcia
MCTS SQL Server 2005/2008
Organiza
http://tinyurl.com/ComunidadWindows
Patrocinadores del SQL Saturday
Premier Sponsor
Gold Sponsor
Bronze Sponsor
AGENDA
 Introducción a la calidad de datos
 Calidad de datos en Poyectos de BI
 Metodología de Calidad de Datos en BI
 Capacidades de Data Quality Services
 Proyectos de Data Quality Services
 Preguntas
4 |
Qué es Calidad de Datos?
 Algunos problemas
5 |
Nuestros envíos postales
tienen un grado de
devolución muy alto.
Los datos de ventas
no me cuadran.
El sistema está
maloMuchas personas
Muchas verdades
Por qué necesito calidad de datos?
 Imprescindible para una toma de decisiones
correcta.
 Pieza básica en la gestión de información
corporativa.
 Impacto directo en el negocio.
 ROI inmediato.
6 |
“Si los datos son la materia prima con la cual creamos
la Información; entonces la confiabilidad de la
información depende directamente de la calidad de los
datos utilizados para producirla”
En qué afecta la falta de calidad de datos
7 |
A Quién afecta la falta de calidad de datos
Áreas Productivas del Negocio
8 |
 Ventas no dispone de información correcta.
 Marketing realiza segmentaciones erróneas,
campañas no eficientes.
 Dirección toma decisiones basándose en
información errónea.
 Atención al Cliente sufre y es causante a la vez de
la mala calidad de los datos.
 Tecnología toma tiempos muy largos para la
culminación de los proyectos (Time To Market).
A quién afecta la falta de calidad….
Todo es Dinero….
9 |as
 Baja la rentabilidad del negocio
 Pérdida de clientes. Segmentación
 Poco control sobre el gasto
 Análisis de fraude limitado
Qué nos resuelve calidad de datos
10 |
Ahorra dinero.
Aumenta Ventas
Aumenta
rentabilidad del
negocio
Impacto en Múltiples Proyectos
En BI buenos datos….buenas decisiones 
11 |
 Análisis predictivo
 MDM (visión única del cliente/proveedor/producto)
 Migraciones: Sistema nuevo con datos buenos
(Garbage In/Garbage Out)
 Cumplimiento de normativas y leyes
 Gestión del CRM, ERP , etc.
Ciclo de Vida en la Calidad de los datos
12 |
1.
Descubrir
2. Perfilar
3. Limpiar
4. Match
5.
Consolidar
6.
Monitorizar
Identificar y medir la calidad de los datos
Definir reglas y
objetivos
de la calidad
de los datos
Diseñar los procesos
de mejora de la
calidad de los datos
Matcheo de información y estadísticas
Implementar
los procesos
de mejora
de calidad
Monitorear
la calidad de
los datos
vs los objetivos
Dimensiones de la calidad de datos
Dimensión Qué mide?
Perfilado de
columna
Cuáles son las caracteríticas físicas de los datos?
Relación Qué relación existe entre grupos de datos?
Redundancia Es un dato redundante?
Existencia Qué dato falta o no nos es útil?
Conformidad Qué dato está almacenado en formato no estándar?
Consistencia Qué datos aportan información no conflictiva?
Precisión Qué datos son incorrectos o están caducados?
Duplicados Qué datos o atributos están repetidos?
Integridad Qué información no está referenciada?
Rango Qué resultados, cálculos, valores están fuera de
rango?
13 |
Dimensiones de calidad de datos
Ejemplo: Maestra de Clientes
Existencia
Existencia
Existencia
Existencia Tenemos todos los datos completos?
Dimensiones de calidad de datos
Ejemplo: Maestra de ClientesConformidad
Conformidad El dato tiene un formato correcto?
Conformidad
Conformidad
Conformidad
Conformidad
Dimensiones de calidad de datos
Ejemplo: Maestra de Clientes
Consistencia
Consistencia El dato tiene el formato correcto pero rompe las reglas de negocio
Consistencia
Consistencia
Dimensiones de calidad de datos
Ejemplo: Maestra de Clientes
Duplicidad Los datos aparecen varias veces? Coincidencia difusa
Duplicidad
Duplicidad
Dimensiones de calidad de datos
Ejemplo: Maestra de Clientes
Integridad Las relaciones del dato son consistentes?
Integridad
Dimensiones de calidad de datos
Ejemplo: Maestra de Clientes
Rango Se encuentran los valores entre rangos aceptables?
Rango
Rango
Dimensiones de calidad de datos
Ejemplo: Maestra de Clientes
Precisión El dato representa la realidad exacta? Son las fuentes verificables?
Precisión
Precisión
DEMO
Perfilado de Datos
21 |
Qué es Data Quality Services?
Data Quality Services (DQS) es una
solución basada en el conocimiento
de la calidad de datos que permite a
los administradores de datos y
profesionales de IT la mejora de la
calidad de sus datos fácilmente.
En qué nos apoya Data Quality Services?
Conocimiento
Limpieza
Consolidación
Aporte de Valor
Arquitectura de DQS
CLIENTE
Data Quality Services
Client
Componente Integration
Services
SERVIDOR
DQS_MAIN
DQS_PROJECT
DQS_STAGING
Arquitectura de DQS
Dominios
Reglas de
matching
Dominios
Compuestos
Bases de
Conocimiento
Dominio
Reglas y
Relacion
es
Valores
Referencias
Externas
Base de Conocimiento
ENTIDAD
Tarjetahabientes
 Apellidos y
Nombres
 Nacionalidad
 Nro. Tarjeta
 Tipo Producto
 Limite de Crédito
Atributos
DQKB_Tarjetahabiente
Dominios
Tipo de Producto
Límite de Crédito
Nacionalidad
6 dígitos dent
de un rango
Lista de
Valores y
correcciones
Lista de
Valores y
correcciones
DEMO
Construyendo una Base de Conocimiento
27 |
Proyectos DQS
Proyectos de Cleansing
Limpieza de
Datos
Partiendo de la
Base de Conocimiento
Información
Extra
Sobre las decisiones
que toma
Base de
Conocimiento
en la nube
Consumir datos
Proyectos DQS
Proyectos de Matching
Creación de
Reglas
Política de comportamiento
del motor DQS
Matching
Lógica Difusa
Agrega Metadatos
Exportación
Datos que quedan
en el modelo
SQL Server, Excel, DQS
Ciclo de Vida de Proyectos BI sin DQ
Detectar
Orígenes
Información
Extra
Pruebas
de Carga
de Datos
Desarrollo
de
Informes
Pruebas y
cuadresUATAceptación
Final
Ciclo de Vida de Proyectos BI con DQ
Detectar
Orígenes
Información
Extra
Análisis de
Perfilado
de Datos
Procesos
de Carga
Enriqueci
miento y
Matching
UAT
Aceptación
Final
Monitorear
DQ
Pruebas y
cuadres
Desarrollo
de
Informes
Impacto de DQ en Proyectos de BI
 Aumenta la rapidez de implementación
 Menor Time To Market del Proyecto
 Menor esfuerzo en la fase de pruebas y UAT
 Mejora la calidad de la información  decisiones
 Genera origenes de datos de calidad para
Campañas
 Mayor confianza y usabilidad de la aplicación
 Mayor cumplimiento de expectativas y
obtención de mayor satisfacción.
33 |
34 |
maryarcia@Outlook.com geeks.ms/blogs/marcia/
@maryarcia
PREGUNTAS Y RESPUESTAS
SQL PASS
Venezuela
Mary Arcia

Más contenido relacionado

La actualidad más candente

MDM Strategy & Roadmap
MDM Strategy & RoadmapMDM Strategy & Roadmap
MDM Strategy & Roadmap
victorlbrown
 

La actualidad más candente (20)

Data Governance
Data GovernanceData Governance
Data Governance
 
Mdm
MdmMdm
Mdm
 
Slides: Data Monetization — Demonstrating Quantifiable Financial Benefits fro...
Slides: Data Monetization — Demonstrating Quantifiable Financial Benefits fro...Slides: Data Monetization — Demonstrating Quantifiable Financial Benefits fro...
Slides: Data Monetization — Demonstrating Quantifiable Financial Benefits fro...
 
Data Quality Best Practices
Data Quality Best PracticesData Quality Best Practices
Data Quality Best Practices
 
Data Governance
Data GovernanceData Governance
Data Governance
 
Data Mesh at CMC Markets: Past, Present and Future
Data Mesh at CMC Markets: Past, Present and FutureData Mesh at CMC Markets: Past, Present and Future
Data Mesh at CMC Markets: Past, Present and Future
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data Management
 
Improving Data Literacy Around Data Architecture
Improving Data Literacy Around Data ArchitectureImproving Data Literacy Around Data Architecture
Improving Data Literacy Around Data Architecture
 
Lessons in Data Modeling: Data Modeling & MDM
Lessons in Data Modeling: Data Modeling & MDMLessons in Data Modeling: Data Modeling & MDM
Lessons in Data Modeling: Data Modeling & MDM
 
Data Quality Management - Data Issue Management & Resolutionn / Practical App...
Data Quality Management - Data Issue Management & Resolutionn / Practical App...Data Quality Management - Data Issue Management & Resolutionn / Practical App...
Data Quality Management - Data Issue Management & Resolutionn / Practical App...
 
Data Governance Best Practices
Data Governance Best PracticesData Governance Best Practices
Data Governance Best Practices
 
10 Worst Practices in Master Data Management
10 Worst Practices in Master Data Management10 Worst Practices in Master Data Management
10 Worst Practices in Master Data Management
 
Modern Metadata Strategies
Modern Metadata StrategiesModern Metadata Strategies
Modern Metadata Strategies
 
Emerging Trends in Data Architecture – What’s the Next Big Thing?
Emerging Trends in Data Architecture – What’s the Next Big Thing?Emerging Trends in Data Architecture – What’s the Next Big Thing?
Emerging Trends in Data Architecture – What’s the Next Big Thing?
 
MDM Strategy & Roadmap
MDM Strategy & RoadmapMDM Strategy & Roadmap
MDM Strategy & Roadmap
 
Real-World Data Governance: Data Governance Expectations
Real-World Data Governance: Data Governance ExpectationsReal-World Data Governance: Data Governance Expectations
Real-World Data Governance: Data Governance Expectations
 
Five Things to Consider About Data Mesh and Data Governance
Five Things to Consider About Data Mesh and Data GovernanceFive Things to Consider About Data Mesh and Data Governance
Five Things to Consider About Data Mesh and Data Governance
 
Activate Data Governance Using the Data Catalog
Activate Data Governance Using the Data CatalogActivate Data Governance Using the Data Catalog
Activate Data Governance Using the Data Catalog
 
Master Data Management methodology
Master Data Management methodologyMaster Data Management methodology
Master Data Management methodology
 
Data Catalog for Better Data Discovery and Governance
Data Catalog for Better Data Discovery and GovernanceData Catalog for Better Data Discovery and Governance
Data Catalog for Better Data Discovery and Governance
 

Similar a Asegurando la calidad del dato en mi entorno de business intelligence

24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
SpanishPASSVC
 
Data Quality
Data QualityData Quality
Data Quality
PowerData
 
Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)
PowerData
 
Power data mdm
Power data  mdmPower data  mdm
Power data mdm
PowerData
 
Introducción PowerData
Introducción PowerDataIntroducción PowerData
Introducción PowerData
PowerData
 
Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"
Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"
Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"
Joseph Lopez
 
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocioComo la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
PowerData
 
Data integration
Data integrationData integration
Data integration
PowerData
 
El valor de los datos correctos
El valor de los datos correctosEl valor de los datos correctos
El valor de los datos correctos
PowerData
 

Similar a Asegurando la calidad del dato en mi entorno de business intelligence (20)

24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
Data Quality
Data QualityData Quality
Data Quality
 
Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)
 
Organizaciones exitosas gobernando sobre los datos
Organizaciones exitosas gobernando sobre los datosOrganizaciones exitosas gobernando sobre los datos
Organizaciones exitosas gobernando sobre los datos
 
10 beneficios de la analítica para la salud
10 beneficios de la analítica para la salud10 beneficios de la analítica para la salud
10 beneficios de la analítica para la salud
 
Data Integration & Data Quality Open Source (spanish)
Data Integration & Data Quality Open Source (spanish)Data Integration & Data Quality Open Source (spanish)
Data Integration & Data Quality Open Source (spanish)
 
Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)
 
Power data mdm
Power data  mdmPower data  mdm
Power data mdm
 
Introducción PowerData
Introducción PowerDataIntroducción PowerData
Introducción PowerData
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzada
 
Como Big Data puede Ayudar en análisis de ventas cruzadas detección abandono ...
Como Big Data puede Ayudar en análisis de ventas cruzadas detección abandono ...Como Big Data puede Ayudar en análisis de ventas cruzadas detección abandono ...
Como Big Data puede Ayudar en análisis de ventas cruzadas detección abandono ...
 
2021 09 22 Calidad Datos V1.1.pdf
2021 09 22 Calidad Datos V1.1.pdf2021 09 22 Calidad Datos V1.1.pdf
2021 09 22 Calidad Datos V1.1.pdf
 
Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"
Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"
Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"
 
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
Powerdata   “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"Powerdata   “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
 
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocioComo la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
 
Data pipeline
Data pipelineData pipeline
Data pipeline
 
Presentación corporativa DQTeam
Presentación corporativa DQTeamPresentación corporativa DQTeam
Presentación corporativa DQTeam
 
Data integration
Data integrationData integration
Data integration
 
El valor de los datos correctos
El valor de los datos correctosEl valor de los datos correctos
El valor de los datos correctos
 

Último

PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
CelesteRolon2
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
JC Díaz Herrera
 

Último (20)

EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
Los países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdfLos países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdf
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdf
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 

Asegurando la calidad del dato en mi entorno de business intelligence

  • 1. Asegurando la Calidad del Dato en nuestros entornos de BI Mary Arcia SQL PASS Venezuela maryarcia@outlook.com @maryarcia https://ve.linkedin.com/pub/mary-arcia/ Blog: geeks.ms/blogs/marcia MCTS SQL Server 2005/2008
  • 3. Patrocinadores del SQL Saturday Premier Sponsor Gold Sponsor Bronze Sponsor
  • 4. AGENDA  Introducción a la calidad de datos  Calidad de datos en Poyectos de BI  Metodología de Calidad de Datos en BI  Capacidades de Data Quality Services  Proyectos de Data Quality Services  Preguntas 4 |
  • 5. Qué es Calidad de Datos?  Algunos problemas 5 | Nuestros envíos postales tienen un grado de devolución muy alto. Los datos de ventas no me cuadran. El sistema está maloMuchas personas Muchas verdades
  • 6. Por qué necesito calidad de datos?  Imprescindible para una toma de decisiones correcta.  Pieza básica en la gestión de información corporativa.  Impacto directo en el negocio.  ROI inmediato. 6 | “Si los datos son la materia prima con la cual creamos la Información; entonces la confiabilidad de la información depende directamente de la calidad de los datos utilizados para producirla”
  • 7. En qué afecta la falta de calidad de datos 7 |
  • 8. A Quién afecta la falta de calidad de datos Áreas Productivas del Negocio 8 |  Ventas no dispone de información correcta.  Marketing realiza segmentaciones erróneas, campañas no eficientes.  Dirección toma decisiones basándose en información errónea.  Atención al Cliente sufre y es causante a la vez de la mala calidad de los datos.  Tecnología toma tiempos muy largos para la culminación de los proyectos (Time To Market).
  • 9. A quién afecta la falta de calidad…. Todo es Dinero…. 9 |as  Baja la rentabilidad del negocio  Pérdida de clientes. Segmentación  Poco control sobre el gasto  Análisis de fraude limitado
  • 10. Qué nos resuelve calidad de datos 10 | Ahorra dinero. Aumenta Ventas Aumenta rentabilidad del negocio
  • 11. Impacto en Múltiples Proyectos En BI buenos datos….buenas decisiones  11 |  Análisis predictivo  MDM (visión única del cliente/proveedor/producto)  Migraciones: Sistema nuevo con datos buenos (Garbage In/Garbage Out)  Cumplimiento de normativas y leyes  Gestión del CRM, ERP , etc.
  • 12. Ciclo de Vida en la Calidad de los datos 12 | 1. Descubrir 2. Perfilar 3. Limpiar 4. Match 5. Consolidar 6. Monitorizar Identificar y medir la calidad de los datos Definir reglas y objetivos de la calidad de los datos Diseñar los procesos de mejora de la calidad de los datos Matcheo de información y estadísticas Implementar los procesos de mejora de calidad Monitorear la calidad de los datos vs los objetivos
  • 13. Dimensiones de la calidad de datos Dimensión Qué mide? Perfilado de columna Cuáles son las caracteríticas físicas de los datos? Relación Qué relación existe entre grupos de datos? Redundancia Es un dato redundante? Existencia Qué dato falta o no nos es útil? Conformidad Qué dato está almacenado en formato no estándar? Consistencia Qué datos aportan información no conflictiva? Precisión Qué datos son incorrectos o están caducados? Duplicados Qué datos o atributos están repetidos? Integridad Qué información no está referenciada? Rango Qué resultados, cálculos, valores están fuera de rango? 13 |
  • 14. Dimensiones de calidad de datos Ejemplo: Maestra de Clientes Existencia Existencia Existencia Existencia Tenemos todos los datos completos?
  • 15. Dimensiones de calidad de datos Ejemplo: Maestra de ClientesConformidad Conformidad El dato tiene un formato correcto? Conformidad Conformidad Conformidad Conformidad
  • 16. Dimensiones de calidad de datos Ejemplo: Maestra de Clientes Consistencia Consistencia El dato tiene el formato correcto pero rompe las reglas de negocio Consistencia Consistencia
  • 17. Dimensiones de calidad de datos Ejemplo: Maestra de Clientes Duplicidad Los datos aparecen varias veces? Coincidencia difusa Duplicidad Duplicidad
  • 18. Dimensiones de calidad de datos Ejemplo: Maestra de Clientes Integridad Las relaciones del dato son consistentes? Integridad
  • 19. Dimensiones de calidad de datos Ejemplo: Maestra de Clientes Rango Se encuentran los valores entre rangos aceptables? Rango Rango
  • 20. Dimensiones de calidad de datos Ejemplo: Maestra de Clientes Precisión El dato representa la realidad exacta? Son las fuentes verificables? Precisión Precisión
  • 22. Qué es Data Quality Services? Data Quality Services (DQS) es una solución basada en el conocimiento de la calidad de datos que permite a los administradores de datos y profesionales de IT la mejora de la calidad de sus datos fácilmente.
  • 23. En qué nos apoya Data Quality Services? Conocimiento Limpieza Consolidación Aporte de Valor
  • 24. Arquitectura de DQS CLIENTE Data Quality Services Client Componente Integration Services SERVIDOR DQS_MAIN DQS_PROJECT DQS_STAGING
  • 25. Arquitectura de DQS Dominios Reglas de matching Dominios Compuestos Bases de Conocimiento Dominio Reglas y Relacion es Valores Referencias Externas
  • 26. Base de Conocimiento ENTIDAD Tarjetahabientes  Apellidos y Nombres  Nacionalidad  Nro. Tarjeta  Tipo Producto  Limite de Crédito Atributos DQKB_Tarjetahabiente Dominios Tipo de Producto Límite de Crédito Nacionalidad 6 dígitos dent de un rango Lista de Valores y correcciones Lista de Valores y correcciones
  • 27. DEMO Construyendo una Base de Conocimiento 27 |
  • 28. Proyectos DQS Proyectos de Cleansing Limpieza de Datos Partiendo de la Base de Conocimiento Información Extra Sobre las decisiones que toma Base de Conocimiento en la nube Consumir datos
  • 29. Proyectos DQS Proyectos de Matching Creación de Reglas Política de comportamiento del motor DQS Matching Lógica Difusa Agrega Metadatos Exportación Datos que quedan en el modelo SQL Server, Excel, DQS
  • 30. Ciclo de Vida de Proyectos BI sin DQ Detectar Orígenes Información Extra Pruebas de Carga de Datos Desarrollo de Informes Pruebas y cuadresUATAceptación Final
  • 31. Ciclo de Vida de Proyectos BI con DQ Detectar Orígenes Información Extra Análisis de Perfilado de Datos Procesos de Carga Enriqueci miento y Matching UAT Aceptación Final Monitorear DQ Pruebas y cuadres Desarrollo de Informes
  • 32. Impacto de DQ en Proyectos de BI  Aumenta la rapidez de implementación  Menor Time To Market del Proyecto  Menor esfuerzo en la fase de pruebas y UAT  Mejora la calidad de la información  decisiones  Genera origenes de datos de calidad para Campañas  Mayor confianza y usabilidad de la aplicación  Mayor cumplimiento de expectativas y obtención de mayor satisfacción. 33 |