SlideShare una empresa de Scribd logo
1 de 34
Asegurando la Calidad del 
Dato en mi Proyecto de BI 
Mary Arcia 
MCTS SQL Server 
SQL PASS Venezuela 
maryarcia@hotmail.com 
Moderador: David Sanchez
Gracias a nuestros auspiciadores 
Database Security as Easy as A-B-C 
http://www.greensql.com 
Hardcore Developer and IT 
Training 
http://www.pluralsight.com 
SQL Server Performance 
Try PlanExplorer today! 
http://www.sqlsentry.com
Próximos SQL Saturday 
6 de Diciembre de 2014 
https://www.sqlsaturday.com/351/register.aspx 
24 de Enero de 2015 
https://www.sqlsaturday.com/346/register.aspx 
18 de Abril de 2015 
https://www.sqlsaturday.com/368/register.aspx 
9 de Mayo de 2015 
https://www.sqlsaturday.com/373/register.aspx
Capítulo Global PASS en Español 
4 
4 
Reuniones semanales todos los miércoles a 
las 12PM UTC-5 (Hora de Colombia) 
https://www.facebook.com/SpanishPASSVC
5 
Asistencia Técnica 
Si requiere asistencia 
durante la sesión debe 
usar la sección de 
preguntas que esta en el 
menú de la derecha. 
Use el botón de Zoom 
para ajustar su pantalla 
al tamaño deseado 
Escriba sus preguntas 
en la sección de 
preguntas que esta en el 
menú de la derecha
Mary es Especialista de Business Intelligence en Grupo de Desarrollo GD, 
Caracas, Venezuela 
Lleva +12 años trabajando en proyectos de Business Intelligence y 
Administracion de Bases de Datos. 
Colaborador activo de eventos SQL Server para LATAM (IT Woman PASS 
LATAM, 24 Horas de PASS en español) 
Coordinador del Cápítulo de PASS en Venezuela.
7 
Agenda 
o Qué es la Calidad del Dato 
o Cinco estilos de BI que impactan la calidad del dato 
o Procesos para asegurar la Calidad del Dato 
o Qué es Data Quality Services 
o Proyectos de Data Quality Services 
7
CALIDAD DE DATOS EN 
BUSINESS INTELLIGENCE
Qué es calidad de datos 
Se refiere a los procesos, técnicas, algoritmos y operaciones 
encaminados a mejorar la calidad de los datos existentes en las 
empresas y organizaciones. 
9 
Según el TDWI 
Se define como la medida de correspondencia y exactitud 
entre los datos de un sistema de información y su valor y 
significado en el mundo real. 
9
Etapas de Madurez de los datos 
10 
10 
Conocimiento 
Información 
Datos 
• Información 
Consolidada para la 
toma de decisiones 
• Datos combinados y 
agregados para 
responder preguntas 
sencillas del negocio 
• Aplicaciones ERP, CRM 
y otros sistemas que 
guardan la 
transaccionabilidad 
Soporte a 
Decisiones 
estratégicas 
Soporte a 
Operativa 
Del negocio
Problemas de la mala calidad de los datos 
Calidad de Dato Problema Ejemplo 
Formato Tenemos un formateo consistente 
en los estándares? 
11 11 
Nro de teléfono: 
(xxx)-xxx-xxxx, 
58+ xxx.xxx.xx.xx, xxx-xxxx 
Estandarización Son los elementos de dato 
definidos y se comprenden sus 
valores? 
Código de Género: 
M, F, U, 
0, 1, 2 
Consistencia Representan los valores lo mismo? 
Tienen el mismo significado? 
Consumos representados en 
Bs, $, reales o pesos 
Completitud Se encuentra completa toda la data 
que necesitamos? 
20% de los apellidos de los 
clientes están en blanco, 50% 
de las direcciones no tienen 
código postal
Problemas de la mala calidad de los datos (cont) 
Calidad de Dato Problema Ejemplo 
Exactitud Representa la data la realidad 
exacta? Son las fuentes 
verificables? 
12 12 
Los clientes no se encuentran 
en las direcciones registradas. 
Los proveedores listados como 
activos no lo están desde hace 
6 años 
Validez Se encuentran los valores entre los 
rangos aceptables? 
Los límites de crédito de los 
clientes no corresponden a su 
perfil 
Duplicidad Los datos aparecen varias veces? Los clientes Maria Alejandra 
Pérez y Marialejandra Pérez 
son lo mismo
Características de nuestros sistemas de BI … 
o Datos extraídos de sistemas y aplicaciones dispares. 
o Único punto de consulta o reporting en la organización. 
o Información correcta expresada de otra forma. 
o Reflejo de la realidad de lo que está pasando en la empresa. 
13 
13
Implementaciones comunes en BI y sus requisitos de 
calidad de datos 
o Cuadros de Mando y Tablas de Resultados 
14 
o Reporting Empresarial 
o Análisis de Cubos OLAP 
o Análisis Avanzado-Predictivo 
o Notificaciones y Alertas 
14
Por qué prestar atención a la calidad de los datos? 
o Los datos necesitan estar accesibles y ser agregados para poder 
consumirse por el BI. 
Independientemente del formato donde sea que el usuario los necesite 
o Las acciones que los usuarios emprenden están influenciadas por la 
precisión de los datos en los informes. 
o La confianza en los datos es un aspecto crítico entre los equipos de IT y los 
usuarios de BI 
La confianza debe ganarse y los datos no son la excepción 
15 
15
Por qué prestar atención a la calidad de los datos? (Cont) 
o Los conocimientos empresariales obtenidos a través del BI se convierten en 
16 
útiles con mayor rapidez. 
o Los directivos, responsables y usuarios de negocio pueden actuar 
inmediatamente ante nuevos patrones y tendencias con una granularidad y 
precisión mas elevada. 
o Identificar sobrecostes y oportunidades para ahorrar y reducir gastos. 
o Se incrementa la auditabilidad y visibilidad del dato para futuras revisiones y 
monitoreo. 
o El ROI sobre el BI es directo e inmediato. 
16
Qué podemos hacer para asegurar la calidad de los datos 
17 
Monitorear la calidad 
de los datos vs los 
objetivos 
17 
1. Descubrir 
2. Perfilar 
3. Limpiar 
4. Match 
6. 
Monitorizar 
5. Consolidar 
Identificar y medir la calidad de los datos 
Definir reglas y objetivos 
de la calidad de los datos 
Diseñar los procesos de 
mejora de la calidad de los 
datos 
Matcheo de información y 
estadísticas 
Implementar los 
procesos de mejora 
de calidad
DEMO 
Visualizando Datos de mala calidad
DATA QUALITY SERVICES
Qué es Data Quality Services 
Data Quality Services (DQS) es una solución 
basada en el conocimiento de la calidad de datos 
que permite a los administradores de datos y 
profesionales de IT la mejora de la calidad de sus 
datos fácilmente. 
20 
20
En qué nos apoya Data Quality Services? 
Conocimiento 
Limpieza 
Consolidación 
Aporte de Valor 
21 21
Arquitectura Básica de DQS 
CLIENTE SERVIDOR 
Data Quality Services Client 
Componente Integration 
Services 
22 22 
DQS_MAIN 
DQS_PROJECT 
DQS_STAGING
BASES DE CONOCIMIENTO
Bases de Conocimiento 
24 24 
Reglas de 
matching 
Dominios 
Compuestos 
Dominios 
Bases de Conocimiento 
Valores 
Reglas y 
Relaciones 
Dominio 
Referencias 
Externas
DEMO 
Construyendo una base de conocimiento
PROYECTOS DE DQS
Proyectos de Matching 
Creación de 
Reglas 
Matching Exportación 
Política de 
comportamiento del 
motor DQS 
Lógica Difusa 
Agrega Metadatos 
27 27 
Datos que quedan en el 
modelo 
SQL Server, Excel, DQS
Proyectos de Cleansing 
Limpieza de 
datos 
Información 
Extra 
28 28 
Base de 
Conocimiento 
en la Nube 
Partiendo de la Base 
de Conocimiento 
Sobre las decisiones 
que toma Consumir datos
DEMO 
Reglas y proyectos de matching
Resumen 
o Qué es la calidad de los datos 
o Implementaciones de BI y sus requisitos de calidad de datos 
o Qué es Data Quality Services 
o Desarrollo de Bases de Conocmiento 
o Proyectos de Data Quality Services 
30 
30
Conclusiones 
o Al adoptar un enfoque de calidad de datos en toda la empresa, los estrategas y arquitectos 
de la solución de BI pueden diseñar e implementar estilos de BI con mucha mayor 
confianza. 
o Data Quality Services es una herramienta que permite velar por la integridad de los datos 
basada en una base de conocimiento diseñada a partir de valores y reglas de negocio y con 
el propósito de conseguir datos de mayor calidad de una manera fácil e intuitiva para el 
trabajo en conjunto entre equipo de IT y usuarios de negocio. 
o El despliegue exitoso de la calidad de datos ayuda a una organización a maximizar los 
retornos sobre sus inversiones de BI, mediante la mejora de su capacidad para aprovechar 
el BI impulsando la ventaja competitiva y el liderazgo de mercado. 
31 
31
Preguntas?
A continuación … 
Patrones de busquedas aceleradas con 
Lookup entre periodos con Integration 
Services 
Expositor: Ricardo Estrada
Gracias por participar

Más contenido relacionado

La actualidad más candente

Introducción PowerData
Introducción PowerDataIntroducción PowerData
Introducción PowerDataPowerData
 
10 claves roi
10 claves roi10 claves roi
10 claves roiPowerData
 
Asegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligenceAsegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligenceMary Arcia
 
Una visión integrada para el estado de chile
Una visión integrada para el estado de chileUna visión integrada para el estado de chile
Una visión integrada para el estado de chilePowerData
 
AR-Proyecto enmascaramiento de Datos.
AR-Proyecto enmascaramiento de Datos.AR-Proyecto enmascaramiento de Datos.
AR-Proyecto enmascaramiento de Datos.PowerData
 
Data integration
Data integrationData integration
Data integrationPowerData
 
Power data mdm
Power data  mdmPower data  mdm
Power data mdmPowerData
 
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes""Protege los datos sensibles de tu compañía y cumple las normativas vigentes"
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"PowerData
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data ManagementQuanam
 
Powerdata: "la calidad de datos como motor de negocio"
Powerdata: "la calidad de datos como motor de negocio"Powerdata: "la calidad de datos como motor de negocio"
Powerdata: "la calidad de datos como motor de negocio"PowerData
 
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
Powerdata   “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"Powerdata   “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"Javier Abaurre
 
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativos
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativosMejorando la calidad y el ciclo de vida de los datos en proyectos educativos
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativosAlex Rayón Jerez
 
Gobierno de Datos (Data Governance) Lighting Talks
Gobierno de Datos (Data Governance)  Lighting TalksGobierno de Datos (Data Governance)  Lighting Talks
Gobierno de Datos (Data Governance) Lighting Talksproteo5
 
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...Software Guru
 
Organizaciones exitosas gobernando sobre los datos
Organizaciones exitosas gobernando sobre los datosOrganizaciones exitosas gobernando sobre los datos
Organizaciones exitosas gobernando sobre los datosIT-NOVA
 
Diez claves Proyecto MDM
Diez claves Proyecto MDMDiez claves Proyecto MDM
Diez claves Proyecto MDMPowerData
 
Power data introduccion
Power data introduccionPower data introduccion
Power data introduccionPowerData
 
Calidad de datos (data quality)
Calidad de datos (data quality)Calidad de datos (data quality)
Calidad de datos (data quality)Sergio Sanchez
 

La actualidad más candente (20)

Introducción PowerData
Introducción PowerDataIntroducción PowerData
Introducción PowerData
 
10 claves roi
10 claves roi10 claves roi
10 claves roi
 
Asegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligenceAsegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligence
 
Qué es la calidad de datos
Qué es la calidad de datosQué es la calidad de datos
Qué es la calidad de datos
 
Una visión integrada para el estado de chile
Una visión integrada para el estado de chileUna visión integrada para el estado de chile
Una visión integrada para el estado de chile
 
AR-Proyecto enmascaramiento de Datos.
AR-Proyecto enmascaramiento de Datos.AR-Proyecto enmascaramiento de Datos.
AR-Proyecto enmascaramiento de Datos.
 
Data integration
Data integrationData integration
Data integration
 
Power data mdm
Power data  mdmPower data  mdm
Power data mdm
 
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes""Protege los datos sensibles de tu compañía y cumple las normativas vigentes"
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data Management
 
Powerdata: "la calidad de datos como motor de negocio"
Powerdata: "la calidad de datos como motor de negocio"Powerdata: "la calidad de datos como motor de negocio"
Powerdata: "la calidad de datos como motor de negocio"
 
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
Powerdata   “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"Powerdata   “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
 
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativos
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativosMejorando la calidad y el ciclo de vida de los datos en proyectos educativos
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativos
 
Gobierno de Datos (Data Governance) Lighting Talks
Gobierno de Datos (Data Governance)  Lighting TalksGobierno de Datos (Data Governance)  Lighting Talks
Gobierno de Datos (Data Governance) Lighting Talks
 
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...
 
Data quality
Data qualityData quality
Data quality
 
Organizaciones exitosas gobernando sobre los datos
Organizaciones exitosas gobernando sobre los datosOrganizaciones exitosas gobernando sobre los datos
Organizaciones exitosas gobernando sobre los datos
 
Diez claves Proyecto MDM
Diez claves Proyecto MDMDiez claves Proyecto MDM
Diez claves Proyecto MDM
 
Power data introduccion
Power data introduccionPower data introduccion
Power data introduccion
 
Calidad de datos (data quality)
Calidad de datos (data quality)Calidad de datos (data quality)
Calidad de datos (data quality)
 

Similar a 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

10 beneficios de la analítica para la salud
10 beneficios de la analítica para la salud10 beneficios de la analítica para la salud
10 beneficios de la analítica para la saludIT-NOVA
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8John Bulla
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzadaElena Lopez
 
Estrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analíticaEstrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analíticaSolidQ
 
Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)Alejandro Indarte
 
Asignación 2 Outsoursing
Asignación 2 OutsoursingAsignación 2 Outsoursing
Asignación 2 Outsoursingsiusma
 
Infraestructuras de la tecnología de información
Infraestructuras de la tecnología de informaciónInfraestructuras de la tecnología de información
Infraestructuras de la tecnología de informaciónRodrigo Dionicio Felipe
 
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...FranciscoMorales392133
 
Memorias webinario BI de Autoservicio 2017
Memorias webinario BI de Autoservicio 2017Memorias webinario BI de Autoservicio 2017
Memorias webinario BI de Autoservicio 2017IT-NOVA
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Analytics10
 
Entregable final. Analítica de Datos
Entregable final. Analítica de DatosEntregable final. Analítica de Datos
Entregable final. Analítica de DatosBrendaBanos
 
Entregable 6 auditoria de bases de datos - rendimiento
Entregable 6   auditoria de bases de datos - rendimientoEntregable 6   auditoria de bases de datos - rendimiento
Entregable 6 auditoria de bases de datos - rendimientonoriarman
 
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocioComo la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocioPowerData
 

Similar a 24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia (20)

10 beneficios de la analítica para la salud
10 beneficios de la analítica para la salud10 beneficios de la analítica para la salud
10 beneficios de la analítica para la salud
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzada
 
Estrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analíticaEstrategias para la creación de una plataforma analítica
Estrategias para la creación de una plataforma analítica
 
Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)Gestión de la Calidad de Datos V1.0 (Ago 10)
Gestión de la Calidad de Datos V1.0 (Ago 10)
 
Asignación 2 Outsoursing
Asignación 2 OutsoursingAsignación 2 Outsoursing
Asignación 2 Outsoursing
 
Calidad de datos
Calidad de datos Calidad de datos
Calidad de datos
 
Infraestructuras de la tecnología de información
Infraestructuras de la tecnología de informaciónInfraestructuras de la tecnología de información
Infraestructuras de la tecnología de información
 
Presentación corporativa DQTeam
Presentación corporativa DQTeamPresentación corporativa DQTeam
Presentación corporativa DQTeam
 
CsOBIT.ppt
CsOBIT.pptCsOBIT.ppt
CsOBIT.ppt
 
Cobit
CobitCobit
Cobit
 
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
documents.mx_1-22-creando-el-proximo-data-warehouse-integracion-y-calidad-de-...
 
Memorias webinario BI de Autoservicio 2017
Memorias webinario BI de Autoservicio 2017Memorias webinario BI de Autoservicio 2017
Memorias webinario BI de Autoservicio 2017
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera
 
Entregable final. Analítica de Datos
Entregable final. Analítica de DatosEntregable final. Analítica de Datos
Entregable final. Analítica de Datos
 
NetRed y su nuevo producto NetFlow
NetRed y su nuevo producto NetFlowNetRed y su nuevo producto NetFlow
NetRed y su nuevo producto NetFlow
 
NetRed, un socio tecnológico de confianza
NetRed, un socio tecnológico de confianzaNetRed, un socio tecnológico de confianza
NetRed, un socio tecnológico de confianza
 
Entregable 6 auditoria de bases de datos - rendimiento
Entregable 6   auditoria de bases de datos - rendimientoEntregable 6   auditoria de bases de datos - rendimiento
Entregable 6 auditoria de bases de datos - rendimiento
 
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocioComo la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
 
BI COFARMEN
BI COFARMENBI COFARMEN
BI COFARMEN
 

Más de SpanishPASSVC

Creación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeCreación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeSpanishPASSVC
 
Analizando la performance del subsistema de IO
Analizando la performance del subsistema de IOAnalizando la performance del subsistema de IO
Analizando la performance del subsistema de IOSpanishPASSVC
 
AlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasAlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasSpanishPASSVC
 
Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016SpanishPASSVC
 
Mejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalMejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalSpanishPASSVC
 
Como leer planes de ejecución
Como leer planes de ejecuciónComo leer planes de ejecución
Como leer planes de ejecuciónSpanishPASSVC
 
AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016SpanishPASSVC
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureSpanishPASSVC
 
Tecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoTecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoSpanishPASSVC
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETLSpanishPASSVC
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzureSpanishPASSVC
 
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosMejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosSpanishPASSVC
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC
 
La receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosLa receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosSpanishPASSVC
 
Introducción a Azure Machine Learning
Introducción a Azure Machine LearningIntroducción a Azure Machine Learning
Introducción a Azure Machine LearningSpanishPASSVC
 
Cuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesCuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesSpanishPASSVC
 
Automatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosAutomatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosSpanishPASSVC
 
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”SpanishPASSVC
 
Administrando soluciones de Power BI
Administrando soluciones de Power BIAdministrando soluciones de Power BI
Administrando soluciones de Power BISpanishPASSVC
 
Vista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoVista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoSpanishPASSVC
 

Más de SpanishPASSVC (20)

Creación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeCreación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nube
 
Analizando la performance del subsistema de IO
Analizando la performance del subsistema de IOAnalizando la performance del subsistema de IO
Analizando la performance del subsistema de IO
 
AlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasAlwaysON Lecciones Aprendidas
AlwaysON Lecciones Aprendidas
 
Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016
 
Mejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalMejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación Transaccional
 
Como leer planes de ejecución
Como leer planes de ejecuciónComo leer planes de ejecución
Como leer planes de ejecución
 
AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y Azure
 
Tecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoTecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreo
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft Azure
 
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosMejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizados
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
La receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosLa receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datos
 
Introducción a Azure Machine Learning
Introducción a Azure Machine LearningIntroducción a Azure Machine Learning
Introducción a Azure Machine Learning
 
Cuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesCuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partes
 
Automatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosAutomatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatos
 
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
 
Administrando soluciones de Power BI
Administrando soluciones de Power BIAdministrando soluciones de Power BI
Administrando soluciones de Power BI
 
Vista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoVista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan Alvarado
 

Último

Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfJC Díaz Herrera
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoRaúl Figueroa
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxlm8322074
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxmariabeatrizbermudez
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfLizRamirez182254
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónJhon Jimenez
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILAsofiagomez288291
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024analiticaydatos
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxMarioKing10
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...JC Díaz Herrera
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfJC Díaz Herrera
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxfatimacamilainjantem
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...claudioluna1121
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024IrapuatoCmovamos
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptxBrallanDanielRamrezS
 

Último (20)

Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 

24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia

  • 1. Asegurando la Calidad del Dato en mi Proyecto de BI Mary Arcia MCTS SQL Server SQL PASS Venezuela maryarcia@hotmail.com Moderador: David Sanchez
  • 2. Gracias a nuestros auspiciadores Database Security as Easy as A-B-C http://www.greensql.com Hardcore Developer and IT Training http://www.pluralsight.com SQL Server Performance Try PlanExplorer today! http://www.sqlsentry.com
  • 3. Próximos SQL Saturday 6 de Diciembre de 2014 https://www.sqlsaturday.com/351/register.aspx 24 de Enero de 2015 https://www.sqlsaturday.com/346/register.aspx 18 de Abril de 2015 https://www.sqlsaturday.com/368/register.aspx 9 de Mayo de 2015 https://www.sqlsaturday.com/373/register.aspx
  • 4. Capítulo Global PASS en Español 4 4 Reuniones semanales todos los miércoles a las 12PM UTC-5 (Hora de Colombia) https://www.facebook.com/SpanishPASSVC
  • 5. 5 Asistencia Técnica Si requiere asistencia durante la sesión debe usar la sección de preguntas que esta en el menú de la derecha. Use el botón de Zoom para ajustar su pantalla al tamaño deseado Escriba sus preguntas en la sección de preguntas que esta en el menú de la derecha
  • 6. Mary es Especialista de Business Intelligence en Grupo de Desarrollo GD, Caracas, Venezuela Lleva +12 años trabajando en proyectos de Business Intelligence y Administracion de Bases de Datos. Colaborador activo de eventos SQL Server para LATAM (IT Woman PASS LATAM, 24 Horas de PASS en español) Coordinador del Cápítulo de PASS en Venezuela.
  • 7. 7 Agenda o Qué es la Calidad del Dato o Cinco estilos de BI que impactan la calidad del dato o Procesos para asegurar la Calidad del Dato o Qué es Data Quality Services o Proyectos de Data Quality Services 7
  • 8. CALIDAD DE DATOS EN BUSINESS INTELLIGENCE
  • 9. Qué es calidad de datos Se refiere a los procesos, técnicas, algoritmos y operaciones encaminados a mejorar la calidad de los datos existentes en las empresas y organizaciones. 9 Según el TDWI Se define como la medida de correspondencia y exactitud entre los datos de un sistema de información y su valor y significado en el mundo real. 9
  • 10. Etapas de Madurez de los datos 10 10 Conocimiento Información Datos • Información Consolidada para la toma de decisiones • Datos combinados y agregados para responder preguntas sencillas del negocio • Aplicaciones ERP, CRM y otros sistemas que guardan la transaccionabilidad Soporte a Decisiones estratégicas Soporte a Operativa Del negocio
  • 11. Problemas de la mala calidad de los datos Calidad de Dato Problema Ejemplo Formato Tenemos un formateo consistente en los estándares? 11 11 Nro de teléfono: (xxx)-xxx-xxxx, 58+ xxx.xxx.xx.xx, xxx-xxxx Estandarización Son los elementos de dato definidos y se comprenden sus valores? Código de Género: M, F, U, 0, 1, 2 Consistencia Representan los valores lo mismo? Tienen el mismo significado? Consumos representados en Bs, $, reales o pesos Completitud Se encuentra completa toda la data que necesitamos? 20% de los apellidos de los clientes están en blanco, 50% de las direcciones no tienen código postal
  • 12. Problemas de la mala calidad de los datos (cont) Calidad de Dato Problema Ejemplo Exactitud Representa la data la realidad exacta? Son las fuentes verificables? 12 12 Los clientes no se encuentran en las direcciones registradas. Los proveedores listados como activos no lo están desde hace 6 años Validez Se encuentran los valores entre los rangos aceptables? Los límites de crédito de los clientes no corresponden a su perfil Duplicidad Los datos aparecen varias veces? Los clientes Maria Alejandra Pérez y Marialejandra Pérez son lo mismo
  • 13. Características de nuestros sistemas de BI … o Datos extraídos de sistemas y aplicaciones dispares. o Único punto de consulta o reporting en la organización. o Información correcta expresada de otra forma. o Reflejo de la realidad de lo que está pasando en la empresa. 13 13
  • 14. Implementaciones comunes en BI y sus requisitos de calidad de datos o Cuadros de Mando y Tablas de Resultados 14 o Reporting Empresarial o Análisis de Cubos OLAP o Análisis Avanzado-Predictivo o Notificaciones y Alertas 14
  • 15. Por qué prestar atención a la calidad de los datos? o Los datos necesitan estar accesibles y ser agregados para poder consumirse por el BI. Independientemente del formato donde sea que el usuario los necesite o Las acciones que los usuarios emprenden están influenciadas por la precisión de los datos en los informes. o La confianza en los datos es un aspecto crítico entre los equipos de IT y los usuarios de BI La confianza debe ganarse y los datos no son la excepción 15 15
  • 16. Por qué prestar atención a la calidad de los datos? (Cont) o Los conocimientos empresariales obtenidos a través del BI se convierten en 16 útiles con mayor rapidez. o Los directivos, responsables y usuarios de negocio pueden actuar inmediatamente ante nuevos patrones y tendencias con una granularidad y precisión mas elevada. o Identificar sobrecostes y oportunidades para ahorrar y reducir gastos. o Se incrementa la auditabilidad y visibilidad del dato para futuras revisiones y monitoreo. o El ROI sobre el BI es directo e inmediato. 16
  • 17. Qué podemos hacer para asegurar la calidad de los datos 17 Monitorear la calidad de los datos vs los objetivos 17 1. Descubrir 2. Perfilar 3. Limpiar 4. Match 6. Monitorizar 5. Consolidar Identificar y medir la calidad de los datos Definir reglas y objetivos de la calidad de los datos Diseñar los procesos de mejora de la calidad de los datos Matcheo de información y estadísticas Implementar los procesos de mejora de calidad
  • 18. DEMO Visualizando Datos de mala calidad
  • 20. Qué es Data Quality Services Data Quality Services (DQS) es una solución basada en el conocimiento de la calidad de datos que permite a los administradores de datos y profesionales de IT la mejora de la calidad de sus datos fácilmente. 20 20
  • 21. En qué nos apoya Data Quality Services? Conocimiento Limpieza Consolidación Aporte de Valor 21 21
  • 22. Arquitectura Básica de DQS CLIENTE SERVIDOR Data Quality Services Client Componente Integration Services 22 22 DQS_MAIN DQS_PROJECT DQS_STAGING
  • 24. Bases de Conocimiento 24 24 Reglas de matching Dominios Compuestos Dominios Bases de Conocimiento Valores Reglas y Relaciones Dominio Referencias Externas
  • 25. DEMO Construyendo una base de conocimiento
  • 27. Proyectos de Matching Creación de Reglas Matching Exportación Política de comportamiento del motor DQS Lógica Difusa Agrega Metadatos 27 27 Datos que quedan en el modelo SQL Server, Excel, DQS
  • 28. Proyectos de Cleansing Limpieza de datos Información Extra 28 28 Base de Conocimiento en la Nube Partiendo de la Base de Conocimiento Sobre las decisiones que toma Consumir datos
  • 29. DEMO Reglas y proyectos de matching
  • 30. Resumen o Qué es la calidad de los datos o Implementaciones de BI y sus requisitos de calidad de datos o Qué es Data Quality Services o Desarrollo de Bases de Conocmiento o Proyectos de Data Quality Services 30 30
  • 31. Conclusiones o Al adoptar un enfoque de calidad de datos en toda la empresa, los estrategas y arquitectos de la solución de BI pueden diseñar e implementar estilos de BI con mucha mayor confianza. o Data Quality Services es una herramienta que permite velar por la integridad de los datos basada en una base de conocimiento diseñada a partir de valores y reglas de negocio y con el propósito de conseguir datos de mayor calidad de una manera fácil e intuitiva para el trabajo en conjunto entre equipo de IT y usuarios de negocio. o El despliegue exitoso de la calidad de datos ayuda a una organización a maximizar los retornos sobre sus inversiones de BI, mediante la mejora de su capacidad para aprovechar el BI impulsando la ventaja competitiva y el liderazgo de mercado. 31 31
  • 33. A continuación … Patrones de busquedas aceleradas con Lookup entre periodos con Integration Services Expositor: Ricardo Estrada

Notas del editor

  1. La falta de calidad de los datos es uno de los principales problemas a los que se enfrentan los responsables de sistemas de información y las empresas en general, pues representa claramente uno de los problemas "ocultos" más graves y persistentes en cualquier organización. En efecto, una buena calidad de datos es el activo corporativo más potente, ya que permite acelerar el crecimiento y administrar de mejor manera los costos y las iniciativas para obtener mejores rentabilidades. Calidad de datos se refiere a los procesos, técnicas, algoritmos y operaciones encaminados a mejorar la calidad de los datos existentes en empresas y organismos. Cuando decimos si un dato tiene calidad o no, nos referimos a lo útil que es ese dato para una aplicación en concreto o para un usuario. Si el dato responde a nuestras preguntas podemos decir que el dato es adecuado o de calidad para nosotros Generalmente cuando hablamos de calidad de los datos, nos referimos al mejoramiento de la calidad de los datos de personas, ya que éstos probablemente son los datos que más tienden a degradarse y cuya falta de calidad más impacta en la productividad de las organizaciones. Un dato puede ser muy válido para un uso pero puede no servir de nada para otro. Según el TDWI., la calidad de los datos se define como  la medida de correspondencia y exactitud entre los datos de un sistema de información y su valor y significado en el mundo real. La premisa fundamental es: “Si los datos son la materia prima con la cual creamos la Información; entonces la confiabilidad de la información depende directamente de la calidad de los datos utilizados para producirla” --------------------- Según lo que plantea la norma ISO 9000: 2000, la calidad se podría definir como “el grado en el que un conjunto de características inherentes cumple con los requisitos, esto es, con la necesidad o expectativa establecida, generalmente implícita u obligatoria". Los problemas de calidad de datos existen, en diferentes medidas, en todas las organizaciones. Por lo general la baja calidad de datos obedece, no a una mala gestión, sino a la ejecución normal de los procesos asociados con el manejo de información en la organización.
  2. Los datos ingresan a nuestras organizaciones a través de las aplicaciones, los cuales guardan la transaccionalidad de la empresa y por sí solos arrojan luces de lo que ocurre en la realidad del negocio. Estos datos combinados y agregados proporcionan información que puede responder a preguntas sencillas del negocio. Ejemplos () Cuando esta información es consolidada es utilizada para el apoyo en la toma de decisiones estratégicas y se usa para revelar tendencias, concer patrones de comportamiento en ventas, etc. Es el momento clave para la organización en las decisiones estratégicas que tomen Datos e Información dan soporte a la operativa de negocio Información y Conocimiento dan soporte a las decisiones del negocio.
  3. .xx
  4. En la operación diaria de cada negocio, a cada minuto se toman decisiones, la mayoría de éstas en base a información del negocio, mientras más utilizamos esta información disponible y menos la intuición, más seguros podemos estar de tomar la decisión acertada. Es aquí donde surgen las dudas ¿Es una fuente única con la que todos en la compañía tomamos una decisión? , ¿Existe un sistema formal que apoye el proceso de toma de decisiones en la empresa? ¿Existen otras fuentes de información disponibles para validar las existencias de inventarios, los precios de los productos, los pedidos de los clientes, los gastos de un centro de costos, las ventas netas de la compañía?   El primer paso para tener una administración basada en información es tener una sola fuente o un único punto de consulta o reporting. Una vez logrado esto, debemos asegurarnos que esta fuente única de información tenga la información correcta, expresado de otra forma, que la información de nuestro sistema refleje la realidad de lo que está pasando en la empresa. Es aquí donde toman parte los procesos de calidad de datos. Muchas organizaciones consideran que la calidad de datos es una de las principales cuestiones que afectan al análisis y soporte para la toma de decisiones. Por un lado, la proliferación del BI, con datos extraídos de sistemas y aplicaciones dispares, puede empeorar la calidad de los datos y provocar una pérdida de confianza en el reporting BI.
  5. A continuación se exponen los cinco estilos de BI que intentan dar respuesta a los crecientes requisitos que debe cumplir una organización y al creciente nivel de actividades de misión crítica. Cada uno de estos estilos tiene su propio conjunto de requisitos de calidad de datos. Cuadros de Mando y Tablas de Resultados Consumir y actuar rápidamente sobre datos completos en los indicadores de cuadros de mando. Lograr una visión integrada utilizando datos estandarizados. Profundizar para ver datos precisos sobre el rendimiento a nivel grupal e individual. Reporting Empresarial Navegar en múltiples informes e imprimirlos en múltiples formularios que agreguen datos de fuentes dispares. Seleccionar una variedad de parámetros y personalizar informes con datos normalizados. Permitir que los usuarios de negocio creen sus propios informes con datos de alta fidelidad. Reducir comprobaciones y auditorias manuales con datos limpios y comparados para la gestión de la copnformidad. Análisis de cubos OLAP Recortar conjuntos interrelacionados de datos o “cubos” interactivamente y “al vuelo” con datos bien formateados y conformes  . Navegar por cualquier dimensión para una investigación profunda con completo acceso a los datos “target”. Realizar análisis oportunos dirigidos por el usuario con datos correctos en múltiples dimensiones.. Análisis avanzado-predictivo Buscar patrones y formatos de datos predictivos por formatos de datos estandarizados. Lograr confianza en el hallazgo de tendencias interdependientes y resultados esperados. Emplear regresión de múltiples variantes y otras técnicas sobre datos precisos. Probar hipótesis con datos certificados. Notificaciones y Alertas Distribuir alertas a un amplio rango de puntos de usuario desde cualquier fuente de datos. Mitigar el riesgo de distribuir alertas y notificaciones incorrectas con una calidad de datos predefinida y aprobada. Aprovechar los datos autentificados para la personalización del contenido y la filiación de grupos. Permitir dedencadenar alertas en tiempo real cuando múltiples datos de eventos cumplen umbrales específicos.
  6. La amplia adopción del BI en todos los niveles de la organización ha propiciado que el BI avanzase más allá de las tradicionales funciones de query, reporting analítico y procesamiento analítico online (OLAP), para incluir ahora cuadros de mando operacionales, tablas de resultados personalizables y avanzadas técnicas de visualización. Desde la perspectiva de la cadena de suministro de la información, esto implica que los datos necesitan estar accesibles y ser agregados y racionalizados para poder consumirse por el BI, independientemente del formato, donde sea que el usuario lo necesite. Y, cada día, la apuesta es más alta. Frente a las tradicionales aplicaciones de BI centradas en las queries y las analíticas, muchos nuevos usuarios de BI se centran en las decisiones operacionales y las consiguientes acciones. Esto significa que toda acción que los usuarios emprenden basándose en la fortaleza de los informes y las alertas está influida por la precisión de los datos utilizados para los informes, así como por la capacidad que los usuarios tengan para confiar en estos datos. ¿Con qué frecuencia nos parecen los datos raros o poco fiables cuando vemos los informes BI? Esta inquietante sensación, esté o no justificada, provoca retrasos e incluso paraliza las acciones necesarias que resultan críticas para el negocionales, tablas de resultados personalizables y avanzadas técnicas de visualización. Si los datos están incompletos, son imprecisos o están llenos de duplicidades, todo el sistema de confianza estará debilitado y la gente será reacia a utilizar sus herramientas de BI. Pero más allá de la obvia limpieza y comparación de los datos está la red de confianza que debe construirse alrededor del data warehouse, los almacenes operacionales y otros sistemas y aplicaciones que generan una corriente continua de datos por toda la empresa. Por esta razón, un creciente número de organizaciones están emprendiendo iniciativas de calidad de datos como principio central de sus iniciativas de BI en la empresa. La capacidad para perfilar, limpiar y suministrar todo tipo de datos con altos niveles de calidad en todo momento, independientemente de los volúmenes y complejidad de los datos, está en la base del éxito de BI. Y la recompensa es directa y muy alta.
  7. Con una buena calidad de datos, los conocimientos empresariales obtenidos a través del BI se convierten en útiles con mayor rapidez (con frecuencia, con mucha mayor rapidez). Al incrementar la confianza en los datos, los directivos, responsables y usuarios de negocio pueden reconocer y actuar inmediatamente ante nuevos patrones y tendencias, así como ante los signos de peligro para el negocio, con una granularidad y precisión más elevadas. Identificar los sobrecostes y otras oportunidades para reducir gastos y ahorrar pueden ser resultados directos de la capacidad de los usuarios de negocio al utilizar datos precisos y verificables procedentes del reporting y las alertas. Y la gestión de la calidad de datos de punto a punto incrementa también la auditabilidad y la visibilidad del reporting de BI, un aspecto especialmente valioso para los propósitos de conformidad y gestión de riesgos. Un despliegue exitoso de Business Intelligence (BI) puede ayudar a valorar la salud de una organización, establecer los indicadores de rendimiento oportunos y monitorizar las operaciones del día a día con un ojo puesto en el crecimiento global. Por consiguiente, la demanda de datos precisos para realizar las tareas de BI continúa creciendo tanto en el lado de la demanda como en el del suministro de información.