El documento presenta una introducción a la importancia de asegurar la calidad de los datos en proyectos de Business Intelligence (BI). Explica que la calidad de los datos es fundamental para que la información en los informes de BI sea confiable y permita la toma de buenas decisiones. Además, introduce la herramienta Data Quality Services de SQL Server como una solución para mejorar la calidad de los datos mediante la construcción de bases de conocimiento y el desarrollo de proyectos de emparejamiento y limpieza de datos.
"MDM: Cómo adquirir y retener más clientes" Master Data ManagementPowerData
WEBINAR: http://landings.powerdata.es/master-data-management-como-adquirir-retener-mas-clientes
Verás por qué es fundamental contar con una visión centrada en el cliente de su negocio para atraer, retener y desarrollar relaciones rentables y sostenibles con clientes, agentes y socios.
MDM: Atraer y retener cliente
Clientes: ¿Los conocemos?
Una estrategia MDM
Visión 360º de una estrategia MDM
MDM y Data Governance. ¿Qué es el customer golden record?
Ejemplo del sector seguro
Iniciativa de MDM alto nivel
Informatica
Contenido descargable gratuito
governance-1
El Data Governance supone un activo estratégico para su organización, así como una ventaja competitiva para obtener un valor económico real. Como ocurre con muchos otros conceptos, son necesidades que han existido siempre en las organizaciones y que se presentan en la actualidad con más fuerza, por la madurez tecnológica y el creciente impacto que la tecnología tiene en los sistemas de gestión.
“Hacia un correcto gobierno de datos: cómo realizar un assessment de Data Gov...PowerData
WEBINAR: http://landings.powerdata.es/webinar-data-governance-assessment
Es la gestión integral de los datos de una organización para asegurar la disponibilidad, usabilidad, integridad y seguridad en su totalidad.
En su compañía, ¿sabe quién es el responsable de los datos?, ¿existen políticas actualizadas para el gobierno de sus datos?, ¿sabe dónde está y hacia dónde ir?...
Un gran problema oculto en las compañías es un incorrecto o insuficiente gobierno de datos. Una falta de control y gobierno de los datos generará inconsistencia en los mismos que impactará de forma directa y negativa en el negocio y rumbo de la compañía. Data_governance_and_Compliance_for_Enterprise_File_Sharing.jpg
Una de los principales objetivos del Data Governance es asegurar que los datos sean siempre válidos y fiables en cada contexto empresarial, que la calidad no se pierda a lo largo del tiempo y que se creen mecanismos de control sobre los datos y responsables de los mismos. El objetivo empresarial de un correcto gobierno no es otro que los datos sean un activo importante en la compañía.
Para cumplir con dicho objetivo necesitaremos establecer un conjunto de estándares, procesos y políticas para que rijan los datos a nivel corporativo.
Un programa de Gobierno de Datos debe incluir la responsabilidad en el gobierno de los datos, procedimientos que apliquen el programa y un plan detallado para su puesta en marcha
"MDM: Cómo adquirir y retener más clientes" Master Data ManagementPowerData
WEBINAR: http://landings.powerdata.es/master-data-management-como-adquirir-retener-mas-clientes
Verás por qué es fundamental contar con una visión centrada en el cliente de su negocio para atraer, retener y desarrollar relaciones rentables y sostenibles con clientes, agentes y socios.
MDM: Atraer y retener cliente
Clientes: ¿Los conocemos?
Una estrategia MDM
Visión 360º de una estrategia MDM
MDM y Data Governance. ¿Qué es el customer golden record?
Ejemplo del sector seguro
Iniciativa de MDM alto nivel
Informatica
Contenido descargable gratuito
governance-1
El Data Governance supone un activo estratégico para su organización, así como una ventaja competitiva para obtener un valor económico real. Como ocurre con muchos otros conceptos, son necesidades que han existido siempre en las organizaciones y que se presentan en la actualidad con más fuerza, por la madurez tecnológica y el creciente impacto que la tecnología tiene en los sistemas de gestión.
“Hacia un correcto gobierno de datos: cómo realizar un assessment de Data Gov...PowerData
WEBINAR: http://landings.powerdata.es/webinar-data-governance-assessment
Es la gestión integral de los datos de una organización para asegurar la disponibilidad, usabilidad, integridad y seguridad en su totalidad.
En su compañía, ¿sabe quién es el responsable de los datos?, ¿existen políticas actualizadas para el gobierno de sus datos?, ¿sabe dónde está y hacia dónde ir?...
Un gran problema oculto en las compañías es un incorrecto o insuficiente gobierno de datos. Una falta de control y gobierno de los datos generará inconsistencia en los mismos que impactará de forma directa y negativa en el negocio y rumbo de la compañía. Data_governance_and_Compliance_for_Enterprise_File_Sharing.jpg
Una de los principales objetivos del Data Governance es asegurar que los datos sean siempre válidos y fiables en cada contexto empresarial, que la calidad no se pierda a lo largo del tiempo y que se creen mecanismos de control sobre los datos y responsables de los mismos. El objetivo empresarial de un correcto gobierno no es otro que los datos sean un activo importante en la compañía.
Para cumplir con dicho objetivo necesitaremos establecer un conjunto de estándares, procesos y políticas para que rijan los datos a nivel corporativo.
Un programa de Gobierno de Datos debe incluir la responsabilidad en el gobierno de los datos, procedimientos que apliquen el programa y un plan detallado para su puesta en marcha
Asegurando la calidad del dato en mi entorno de business intelligenceMary Arcia
El aseguramiento de la calidad de datos es el proceso que más demanda tiempo, gente y dinero dentro de nuestros proyectos de BI. Entendiendo el efecto clave en el proceso de la toma de decisiones que genera el” business intelligence”, no puede tratarse la calidad de los datos como un proceso tardío. En esta sesión vamos a conocer cómo tras una metodología de calidad de datos, los servicios de Data Quality Services de Microsoft SQL Server nos ayuda en este proceso de ahorrar tiempo y garantizar datos sanos y correctos para nuestros sistemas de BI.
Sigma Data Services explica qué es la calidad de datos, cómo afecta a los resultados de la empresa y cómo implantar un sistema de calidad de datos que permita el control continuado de la calidad.
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"PowerData
WEBINAR: http://landings.powerdata.es/webinar-enmascaramiento-datos-16-12-15
Los datos son uno de los activos más importantes de la empresas y poder mantenerlos seguros es uno de los principales retos que tienen la compañías de hoy día.
Conocer los tipos de enmascarmientos y entender su funcionalidad y beneficios es básico para los responsables de la seguridad de los datos.
Durante el Seminario Online veremos los diferencias entre enmascaramiento dinámico y persistente y un especialista de PowerData nos mostrará una DEMO de cómo se realiza un enmascaramiento persistente con PowerCenter de Informatica
¿Qué veremos durante el Seminario?
Cómo proteger tus datos
Diferencias entre enmascaramiento persistente y dinámico
DEMO de enmascaramiento persistente
Cómo afrontar un proyecto para asegurar tus datos
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativosAlex Rayón Jerez
Primer Webinar de SNOLA (Spanish Network Of Learning Analytics,http://snola.deusto.es/), titulado "Mejorando la calidad y el ciclo de vida de los datos en proyectos educativos"
Disponible también en vídeo aquí: https://plus.google.com/u/0/events/c5keobqquhp1k1h3o7dekd561bo?cfem=1
Organizaciones exitosas gobernando sobre los datosIT-NOVA
Un estudio de Beg y Mussain en 2008 asegura que “Los problemas con la mala calidad de los datos pueden costar alrededor del 10% de los beneficios de una compañía”.
En este webinario conocerá la importancia del análisis de los datos traducidos en el aprovechamiento de estos como un activo empresarial, y la seguridad que sus decisiones estén basadas en fuentes confiables y reales. Aprenderá cómo podrá ayudar a su empresa a reducir costos, incrementar utilidades y minimizar riesgos.
10 beneficios de la analítica para la saludIT-NOVA
Le presentamos 10 beneficios de la analítica para el sector de la salud, cómo puede aportarle y qué significa para los pacientes y la mejora del sistema.
Asegurando la calidad del dato en mi entorno de business intelligenceMary Arcia
El aseguramiento de la calidad de datos es el proceso que más demanda tiempo, gente y dinero dentro de nuestros proyectos de BI. Entendiendo el efecto clave en el proceso de la toma de decisiones que genera el” business intelligence”, no puede tratarse la calidad de los datos como un proceso tardío. En esta sesión vamos a conocer cómo tras una metodología de calidad de datos, los servicios de Data Quality Services de Microsoft SQL Server nos ayuda en este proceso de ahorrar tiempo y garantizar datos sanos y correctos para nuestros sistemas de BI.
Sigma Data Services explica qué es la calidad de datos, cómo afecta a los resultados de la empresa y cómo implantar un sistema de calidad de datos que permita el control continuado de la calidad.
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"PowerData
WEBINAR: http://landings.powerdata.es/webinar-enmascaramiento-datos-16-12-15
Los datos son uno de los activos más importantes de la empresas y poder mantenerlos seguros es uno de los principales retos que tienen la compañías de hoy día.
Conocer los tipos de enmascarmientos y entender su funcionalidad y beneficios es básico para los responsables de la seguridad de los datos.
Durante el Seminario Online veremos los diferencias entre enmascaramiento dinámico y persistente y un especialista de PowerData nos mostrará una DEMO de cómo se realiza un enmascaramiento persistente con PowerCenter de Informatica
¿Qué veremos durante el Seminario?
Cómo proteger tus datos
Diferencias entre enmascaramiento persistente y dinámico
DEMO de enmascaramiento persistente
Cómo afrontar un proyecto para asegurar tus datos
Mejorando la calidad y el ciclo de vida de los datos en proyectos educativosAlex Rayón Jerez
Primer Webinar de SNOLA (Spanish Network Of Learning Analytics,http://snola.deusto.es/), titulado "Mejorando la calidad y el ciclo de vida de los datos en proyectos educativos"
Disponible también en vídeo aquí: https://plus.google.com/u/0/events/c5keobqquhp1k1h3o7dekd561bo?cfem=1
Organizaciones exitosas gobernando sobre los datosIT-NOVA
Un estudio de Beg y Mussain en 2008 asegura que “Los problemas con la mala calidad de los datos pueden costar alrededor del 10% de los beneficios de una compañía”.
En este webinario conocerá la importancia del análisis de los datos traducidos en el aprovechamiento de estos como un activo empresarial, y la seguridad que sus decisiones estén basadas en fuentes confiables y reales. Aprenderá cómo podrá ayudar a su empresa a reducir costos, incrementar utilidades y minimizar riesgos.
10 beneficios de la analítica para la saludIT-NOVA
Le presentamos 10 beneficios de la analítica para el sector de la salud, cómo puede aportarle y qué significa para los pacientes y la mejora del sistema.
Estrategias para la creación de una plataforma analíticaSolidQ
http://training.solidq.com/es/class/solidq-summit-madrid-2016/
Presentación de Javier Torrenteras, Director del área de BI en SolidQ, durante la sesión de Data Driven en colaboración con Pyramid Analytics.
Presentación de un enfoque para administrar eficientemente los riesgos e impacto en las capacidades de su compañía trabajando fuertemente en los estilos de inteligencia de negocio predominantes y las técnicas para monitorizar y gestionar la calidad de datos de principio a fin
Calidad de datos: La base del éxito para la modernización de sistemas de información
La ponencia tratará los aspectos más importantes a considerar para llevar a cabo una exitosa migración de datos de una organización en la modernización de los sistemas de información o la adquisición de nuevos sistemas o aplicaciones. Se cubren aspectos como la metodología, buenas prácticas y el proceso para la migración de bases de datos, haciendo énfasis en el análisis de la calidad de los datos.
Ponente; Magda Meléndez
Presentación corporativa de la empresa Data Quality Team S.L. En esta presentación se indican los aspectos básicos del enfoque que tiene DQTeam sobre Calidad de Datos y Calidad de Procesos de Datos.
Para más información contacte con nosotros a través de nuestra web: http://dqteam.es/index.php/es/contacto
Una estrategia de autoservicio ayuda a crear una cultura analítica al interior de las organizaciones, y mejora la labor de análisis de los usuarios de negocio.
En este whitepaper podrá conocer la importancia de la estrategia de BI de Autoservicio en las organizaciones.
El presente trabajo nos permitirá comprender la importancia de la analítica de datos en las empresas, ya que ha sido una herramienta que ha permitido estimar escenarios futuros y con base a ello poder tomar decisiones estratégicas para asegurar el posicionamiento de las empresas en el mercado
Somos una empresa presente en el mercado desde 1996, otorgamos servicios y soluciones tecnológicas que permiten mejorar la rentabilidad y productividad de las empresas.
NetFlow es un software de atención de clientes customizable que te permitirá responder las consultas online más rápido y mejor.
Somos una empresa presente en el mercado desde 1996, otorgamos servicios y soluciones tecnológicas que permiten mejorar la rentabilidad y productividad de las empresas.
Dentro del portafolio de servicios y productos comercializados destacan: servicios de desarrollo de proyectos a medida, mantención de aplicaciones, software de atención de clientes (NetFlow), software de evaluación de desempeño (HumaNet), entre otros
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocioPowerData
WEBINAR: http://landings.powerdata.es/webinar-integracion-datos-metadata-manager-business-glossary
Lograr identificar el impacto de nuestros proyectos en nuestros modelos, procesos y reportes de información en un corto tiempo, es un reto importante para las áreas de IT y de negocio, si no se realiza correctamente pueden conllevar a malas estimaciones de tiempo y costo, e incluso no tener un real overview de las repercusiones de los cambios a realizarse. Así como poder gestionar nuestros metadatos correctamente permitiendo que tanto usuarios de negocio como de IT puedan entender nuestros modelos de datos, lógicas de negocios, indicadores, etc. Es un reto a tener en cuenta.
La posibilidad de gestionar e integrar metadatos de distintas aplicaciones proporciona a la empresa una fuerte alineación entre IT y negocios, de forma que mejora la agilidad de negocio, aumenta las capacidades de análisis y permite un conocimiento más profundo de las relaciones de los
Durante este webinar veremos las ventajas que nos proporciona “Metadata Manager & Business Glossary” para el negocio y el departamento de IT, y cómo nos ayuda a generar una visibilidad completa de los posibles efectos de los cambios de una regla de negocio, un campo o una tabla, permitiendo conocer rápidamente como están relacionados nuestros metadatos así como conocer el significado de negocio.
Reduciendo el tiempo de entrega y ayudar a los equipos de IT a obtener estimaciones de costos más precisas. Del mismo modo veremos como “Business Glossary”, complemento de MM, nos ayuda a entender mejor cada componente desarrollado bajo las definiciones de negocios dadas
Creación de un modelo de análisis predictivo en la nubeSpanishPASSVC
Microsoft Azure ofrece una solución de análisis predictivo 100% Cloud, donde es posible realizar el proceso analítico de búsqueda de patrones en los datos, y a la vez la explotación de estos modelos en un ambiente de producción altamente disponible y escalable como lo es Microsoft Azure.
Analizando la performance del subsistema de IOSpanishPASSVC
Analizaremos el subsistema de I/O para detectar los posibles cuellos de botella. Para llevar a cabo esto utilizaremos distintas técnicas y herramientas
Mejoras de Rendimiento para Replicación TransaccionalSpanishPASSVC
A pesar de ser una tecnología sin mayores cambios en las últimas versiones del producto de SQL Server, muchos clientes siguen utilizando esta herramienta en sus ambientes productivos, en esta sesión veremos los problemas más comunes relacionados con rendimiento , como identificarlos y sus posibles soluciones.
Todo el mundo que trabaja con base de datos siempre se ha preguntado alguna vez qué son los planes de ejecución y como se leen. Saber leer un plan de ejecución nos va a dar información valiosísima de cara a mejorar el rendimiento de una consulta. En esta sesión vamos a centrarnos en aprender a leer T-SQL para interpretar lo que está haciendo SQL Server para devolvernos la información.
VMs de alto rendimiento para SQL Server en AWS y AzureSpanishPASSVC
Primero todo era puro metal, luego la virtualizacion inicio la revolucion. Ahora la nube va a cambiar el data center de nuevo con su rapidez de provicionamiento y ofrecimiento de recursos bajo demanda. Pero como eligimos las mejores opciones para maquinas virtuales de SQL en estos proveedores de nube? Venga y aprenda sobre las mejores configuraciones, tips y lecciones aprendidas de clientes que han movido sus SQL Servers de alto rendimiento a la nube.
En esta charla estaremos demostrando Tecnicas avanzadas de Monitoreo tales como
- Analizando la actividad de SQL Server
- Utilizando Extended events para realizar monitoreo en SQL Server
- monitoreo proactivo
- Auditoria Utilizando Service Broker
Principios de diseño para procesos de ETLSpanishPASSVC
Aun cuando SSIS es una tecnología robusta para ETL, los procesos de integración de datos son las causa más frecuente por los que los proyectos fracasan. En muchos casos esto se debe a la falta de planeamiento y el uso de cuestionables técnicas de diseño. En esta charla vamos a evaluar los procesos de ETL de una manera general para luego identificar áreas claves que muchas veces son dejadas al azar, y que en un momento determinado pudiesen comprometer la estabilidad del sistema e incrementar su costo de operación.
Planeando e implementando servicios de datos con Microsoft AzureSpanishPASSVC
Analizaremos las diferencias entre bases de datos SQL Server on premise y Azure SQL Database. Como implementar SQL Azure Database, como migrar, monitorear y mantener la continuidad operativa con Self Service Restore y Geo Replicación.
Mejores prácticas para SQL Server en ambientes virtualizadosSpanishPASSVC
Recomendaciones sobre configuraciones en Máquinas Virtuales, Almacenamiento, Redes y otros components al ejecutar SQL-Server en ambientes Virtualizados como Hyper-V y Windows Azure con ejemplos prácticos.
La receta de la abuela para mejores cargas de datosSpanishPASSVC
En esta sesión veremos mejores prácticas para cargas de datos a ser utilizados en ETLs de alto volumen, veremos técnicas de carga y configuración de la base de datos, uso de particiones, compresión, indexes columnstore y más. Esta receta estará cargada de buenas demos, todas aprobadas por la abuela desde épocas que datan antes del windows 3.1!
El Aprendizaje Automático (AA), conocido en inglés como Machine Learning, es una rama de la Inteligencia Artificial en la cual su principal objetivo es desarrollar técnicas que permitan a las computadoras aprender, es decir, se considera como un proceso de inducción del conocimiento. Dentro de las aplicaciones de aprendizaje automático están diversas aplicaciones de negocio como motores de búsqueda, diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis del mercado de valores, clasificación de secuencias de ADN, reconocimiento del habla entre otros. En esta sesión presentaremos alguno de los conceptos fundamentales del AA y mostraremos cómo crear este tipo de soluciones usando Azure Machine Learning, el nuevo servicio de Azure completamente administrado en la nube y que puede ser integrado en nuestras aplicaciones tradicionales de negocio.
Cuadros de mando el todo es más que la suma de las partesSpanishPASSVC
No es suficiente con hacer tablas, gráficos y/o indicadores de forma individual. Debemos pensar en agregar valor a la visualización y el análisis con un conjunto de estos elementos que se complementen entre sí para enriquecer las respuestas. En esta sesión veremos diversas técnicas de visualización para mejorar los cuadros de mando, incluso algunas de ellas también se pueden aplicar sobre informes. Veremos también diversos ejemplos, en algunos de ellos partiremos de una mala solución que iremos comentando y mejorando.
Automatizando la generación de Datawarehouses a través de metadatosSpanishPASSVC
Nos enfrentamos cada vez a retos mas difíciles y complejos en la creación de Datawarehouses con SQL Server. Esto nos hace pensar en como quitarnos el trabajo superfluo, el que no aporta valor de negocio para centrar nuestras energías en resolver las cuestiones propias del negocio. La charla explorará alguna de las posibilidades de automatización de creación de procesos ETL. Para ello hablaremos de BIML, SSIS, JSON y metadatos.
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”SpanishPASSVC
Las estadísticas son la base para calcular los registros en un query y permite a Sql Server calcular y solicitar recursos necesarios para el mejor procesamiento. En eta sesión vamos a explicar que son, como funcionan y cómo influyen en la ejecución de consultas.
Power BI es un servicio en la nube para el manejo de datos y una moderna solución de reportes accesible en todas las plataformas, pero ¿realmente cómo funciona? No importa cuán simple sea su gestión de datos, para tomar ventaja de este servicio deberá diseñar y administrar algunos de sus componentes. En esta sesión aprenderemos de las diferencias entre versiones, seguridad, colaboración y estrategias para refrescar la data tanto en escenarios de uso personal como empresariales.
Vista 360 grados de DataZen - Juan AlvaradoSpanishPASSVC
En esta charla se vera un vistazo general a DataZen, sus componentes a nivel servidor y cliente, tambien se vera la forma en que se desarrolla en proyectos de inteligencia de negocios con datazen.
Ipsos, empresa de investigación de mercados y opinión pública, divulgó su informe N°29 “Claves Ipsos” correspondiente al mes de abril, que encuestó a 800 personas con el fin de identificar las principales opiniones y comportamientos de las y los ciudadanos respecto de temas de interés para el país. En esta edición se abordó la a Carabineros de Chile, su evaluación, legitimidad en su actuar y el asesinato de tres funcionarios en Cañete. Además, se consultó sobre el Ejército y la opinión respecto de la marcha en Putre.
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxWalterOrdoez22
Es un conjunto de diapositivas creadas para la información sobre la importancia que tienen la interpol en honduras y los tratados entre ambas instituciones
Instituciones financieras globales por efectivo disponible (2024).pdf
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi - Mary Arcia
1. Asegurando la Calidad del
Dato en mi Proyecto de BI
Mary Arcia
MCTS SQL Server
SQL PASS Venezuela
maryarcia@hotmail.com
Moderador: David Sanchez
2. Gracias a nuestros auspiciadores
Database Security as Easy as A-B-C
http://www.greensql.com
Hardcore Developer and IT
Training
http://www.pluralsight.com
SQL Server Performance
Try PlanExplorer today!
http://www.sqlsentry.com
3. Próximos SQL Saturday
6 de Diciembre de 2014
https://www.sqlsaturday.com/351/register.aspx
24 de Enero de 2015
https://www.sqlsaturday.com/346/register.aspx
18 de Abril de 2015
https://www.sqlsaturday.com/368/register.aspx
9 de Mayo de 2015
https://www.sqlsaturday.com/373/register.aspx
4. Capítulo Global PASS en Español
4
4
Reuniones semanales todos los miércoles a
las 12PM UTC-5 (Hora de Colombia)
https://www.facebook.com/SpanishPASSVC
5. 5
Asistencia Técnica
Si requiere asistencia
durante la sesión debe
usar la sección de
preguntas que esta en el
menú de la derecha.
Use el botón de Zoom
para ajustar su pantalla
al tamaño deseado
Escriba sus preguntas
en la sección de
preguntas que esta en el
menú de la derecha
6. Mary es Especialista de Business Intelligence en Grupo de Desarrollo GD,
Caracas, Venezuela
Lleva +12 años trabajando en proyectos de Business Intelligence y
Administracion de Bases de Datos.
Colaborador activo de eventos SQL Server para LATAM (IT Woman PASS
LATAM, 24 Horas de PASS en español)
Coordinador del Cápítulo de PASS en Venezuela.
7. 7
Agenda
o Qué es la Calidad del Dato
o Cinco estilos de BI que impactan la calidad del dato
o Procesos para asegurar la Calidad del Dato
o Qué es Data Quality Services
o Proyectos de Data Quality Services
7
9. Qué es calidad de datos
Se refiere a los procesos, técnicas, algoritmos y operaciones
encaminados a mejorar la calidad de los datos existentes en las
empresas y organizaciones.
9
Según el TDWI
Se define como la medida de correspondencia y exactitud
entre los datos de un sistema de información y su valor y
significado en el mundo real.
9
10. Etapas de Madurez de los datos
10
10
Conocimiento
Información
Datos
• Información
Consolidada para la
toma de decisiones
• Datos combinados y
agregados para
responder preguntas
sencillas del negocio
• Aplicaciones ERP, CRM
y otros sistemas que
guardan la
transaccionabilidad
Soporte a
Decisiones
estratégicas
Soporte a
Operativa
Del negocio
11. Problemas de la mala calidad de los datos
Calidad de Dato Problema Ejemplo
Formato Tenemos un formateo consistente
en los estándares?
11 11
Nro de teléfono:
(xxx)-xxx-xxxx,
58+ xxx.xxx.xx.xx, xxx-xxxx
Estandarización Son los elementos de dato
definidos y se comprenden sus
valores?
Código de Género:
M, F, U,
0, 1, 2
Consistencia Representan los valores lo mismo?
Tienen el mismo significado?
Consumos representados en
Bs, $, reales o pesos
Completitud Se encuentra completa toda la data
que necesitamos?
20% de los apellidos de los
clientes están en blanco, 50%
de las direcciones no tienen
código postal
12. Problemas de la mala calidad de los datos (cont)
Calidad de Dato Problema Ejemplo
Exactitud Representa la data la realidad
exacta? Son las fuentes
verificables?
12 12
Los clientes no se encuentran
en las direcciones registradas.
Los proveedores listados como
activos no lo están desde hace
6 años
Validez Se encuentran los valores entre los
rangos aceptables?
Los límites de crédito de los
clientes no corresponden a su
perfil
Duplicidad Los datos aparecen varias veces? Los clientes Maria Alejandra
Pérez y Marialejandra Pérez
son lo mismo
13. Características de nuestros sistemas de BI …
o Datos extraídos de sistemas y aplicaciones dispares.
o Único punto de consulta o reporting en la organización.
o Información correcta expresada de otra forma.
o Reflejo de la realidad de lo que está pasando en la empresa.
13
13
14. Implementaciones comunes en BI y sus requisitos de
calidad de datos
o Cuadros de Mando y Tablas de Resultados
14
o Reporting Empresarial
o Análisis de Cubos OLAP
o Análisis Avanzado-Predictivo
o Notificaciones y Alertas
14
15. Por qué prestar atención a la calidad de los datos?
o Los datos necesitan estar accesibles y ser agregados para poder
consumirse por el BI.
Independientemente del formato donde sea que el usuario los necesite
o Las acciones que los usuarios emprenden están influenciadas por la
precisión de los datos en los informes.
o La confianza en los datos es un aspecto crítico entre los equipos de IT y los
usuarios de BI
La confianza debe ganarse y los datos no son la excepción
15
15
16. Por qué prestar atención a la calidad de los datos? (Cont)
o Los conocimientos empresariales obtenidos a través del BI se convierten en
16
útiles con mayor rapidez.
o Los directivos, responsables y usuarios de negocio pueden actuar
inmediatamente ante nuevos patrones y tendencias con una granularidad y
precisión mas elevada.
o Identificar sobrecostes y oportunidades para ahorrar y reducir gastos.
o Se incrementa la auditabilidad y visibilidad del dato para futuras revisiones y
monitoreo.
o El ROI sobre el BI es directo e inmediato.
16
17. Qué podemos hacer para asegurar la calidad de los datos
17
Monitorear la calidad
de los datos vs los
objetivos
17
1. Descubrir
2. Perfilar
3. Limpiar
4. Match
6.
Monitorizar
5. Consolidar
Identificar y medir la calidad de los datos
Definir reglas y objetivos
de la calidad de los datos
Diseñar los procesos de
mejora de la calidad de los
datos
Matcheo de información y
estadísticas
Implementar los
procesos de mejora
de calidad
20. Qué es Data Quality Services
Data Quality Services (DQS) es una solución
basada en el conocimiento de la calidad de datos
que permite a los administradores de datos y
profesionales de IT la mejora de la calidad de sus
datos fácilmente.
20
20
21. En qué nos apoya Data Quality Services?
Conocimiento
Limpieza
Consolidación
Aporte de Valor
21 21
22. Arquitectura Básica de DQS
CLIENTE SERVIDOR
Data Quality Services Client
Componente Integration
Services
22 22
DQS_MAIN
DQS_PROJECT
DQS_STAGING
27. Proyectos de Matching
Creación de
Reglas
Matching Exportación
Política de
comportamiento del
motor DQS
Lógica Difusa
Agrega Metadatos
27 27
Datos que quedan en el
modelo
SQL Server, Excel, DQS
28. Proyectos de Cleansing
Limpieza de
datos
Información
Extra
28 28
Base de
Conocimiento
en la Nube
Partiendo de la Base
de Conocimiento
Sobre las decisiones
que toma Consumir datos
30. Resumen
o Qué es la calidad de los datos
o Implementaciones de BI y sus requisitos de calidad de datos
o Qué es Data Quality Services
o Desarrollo de Bases de Conocmiento
o Proyectos de Data Quality Services
30
30
31. Conclusiones
o Al adoptar un enfoque de calidad de datos en toda la empresa, los estrategas y arquitectos
de la solución de BI pueden diseñar e implementar estilos de BI con mucha mayor
confianza.
o Data Quality Services es una herramienta que permite velar por la integridad de los datos
basada en una base de conocimiento diseñada a partir de valores y reglas de negocio y con
el propósito de conseguir datos de mayor calidad de una manera fácil e intuitiva para el
trabajo en conjunto entre equipo de IT y usuarios de negocio.
o El despliegue exitoso de la calidad de datos ayuda a una organización a maximizar los
retornos sobre sus inversiones de BI, mediante la mejora de su capacidad para aprovechar
el BI impulsando la ventaja competitiva y el liderazgo de mercado.
31
31
La falta de calidad de los datos es uno de los principales problemas a los que se enfrentan los responsables de sistemas de información y las empresas en general, pues representa claramente uno de los problemas "ocultos" más graves y persistentes en cualquier organización.
En efecto, una buena calidad de datos es el activo corporativo más potente, ya que permite acelerar el crecimiento y administrar de mejor manera los costos y las iniciativas para obtener mejores rentabilidades.
Calidad de datos se refiere a los procesos, técnicas, algoritmos y operaciones encaminados a mejorar la calidad de los datos existentes en empresas y organismos.
Cuando decimos si un dato tiene calidad o no, nos referimos a lo útil que es ese dato para una aplicación en concreto o para un usuario. Si el dato responde a nuestras preguntas podemos decir que el dato es adecuado o de calidad para nosotros
Generalmente cuando hablamos de calidad de los datos, nos referimos al mejoramiento de la calidad de los datos de personas, ya que éstos probablemente son los datos que más tienden a degradarse y cuya falta de calidad más impacta en la productividad de las organizaciones.
Un dato puede ser muy válido para un uso pero puede no servir de nada para otro.
Según el TDWI., la calidad de los datos se define como la medida de correspondencia y exactitud entre los datos de un sistema de información y su valor y significado en el mundo real. La premisa fundamental es: “Si los datos son la materia prima con la cual creamos la Información; entonces la confiabilidad de la información depende directamente de la calidad de los datos utilizados para producirla”
---------------------
Según lo que plantea la norma ISO 9000: 2000, la calidad se podría definir como “el grado en el que un conjunto de características inherentes cumple con los requisitos, esto es, con la necesidad o expectativa establecida, generalmente implícita u obligatoria".
Los problemas de calidad de datos existen, en diferentes medidas, en todas las organizaciones. Por lo general la baja calidad de datos obedece, no a una mala gestión, sino a la ejecución normal de los procesos asociados con el manejo de información en la organización.
Los datos ingresan a nuestras organizaciones a través de las aplicaciones, los cuales guardan la transaccionalidad de la empresa y por sí solos arrojan luces de lo que ocurre en la realidad del negocio. Estos datos combinados y agregados proporcionan información que puede responder a preguntas sencillas del negocio. Ejemplos ()
Cuando esta información es consolidada es utilizada para el apoyo en la toma de decisiones estratégicas y se usa para revelar tendencias, concer patrones de comportamiento en ventas, etc. Es el momento clave para la organización en las decisiones estratégicas que tomen
Datos e Información dan soporte a la operativa de negocio
Información y Conocimiento dan soporte a las decisiones del negocio.
.xx
En la operación diaria de cada negocio, a cada minuto se toman decisiones, la mayoría de éstas en base a información del negocio, mientras más utilizamos esta información disponible y menos la intuición, más seguros podemos estar de tomar la decisión acertada.
Es aquí donde surgen las dudas ¿Es una fuente única con la que todos en la compañía tomamos una decisión? , ¿Existe un sistema formal que apoye el proceso de toma de decisiones en la empresa? ¿Existen otras fuentes de información disponibles para validar las existencias de inventarios, los precios de los productos, los pedidos de los clientes, los gastos de un centro de costos, las ventas netas de la compañía?
El primer paso para tener una administración basada en información es tener una sola fuente o un único punto de consulta o reporting. Una vez logrado esto, debemos asegurarnos que esta fuente única de información tenga la información correcta, expresado de otra forma, que la información de nuestro sistema refleje la realidad de lo que está pasando en la empresa. Es aquí donde toman parte los procesos de calidad de datos.
Muchas organizaciones consideran que la calidad de datos es una de las principales cuestiones que afectan al
análisis y soporte para la toma de decisiones. Por un lado, la proliferación del BI, con datos extraídos de
sistemas y aplicaciones dispares, puede empeorar la calidad de los datos y provocar una pérdida de confianza
en el reporting BI.
A continuación se exponen los cinco estilos de BI que intentan dar respuesta a los crecientes requisitos que debe cumplir una organización y al creciente nivel de actividades de misión crítica. Cada uno de estos estilos tiene su propio conjunto de requisitos de calidad de datos.
Cuadros de Mando y Tablas de Resultados
Consumir y actuar rápidamente sobre datos completos en los indicadores de cuadros de mando.
Lograr una visión integrada utilizando datos estandarizados.
Profundizar para ver datos precisos sobre el rendimiento a nivel grupal e individual.
Reporting Empresarial
Navegar en múltiples informes e imprimirlos en múltiples formularios que agreguen datos de fuentes dispares.
Seleccionar una variedad de parámetros y personalizar informes con datos normalizados.
Permitir que los usuarios de negocio creen sus propios informes con datos de alta fidelidad.
Reducir comprobaciones y auditorias manuales con datos limpios y comparados para la gestión de la copnformidad.
Análisis de cubos OLAP
Recortar conjuntos interrelacionados de datos o “cubos” interactivamente y “al vuelo” con datos bien formateados y conformes .
Navegar por cualquier dimensión para una investigación profunda con completo acceso a los datos “target”.
Realizar análisis oportunos dirigidos por el usuario con datos correctos en múltiples dimensiones..
Análisis avanzado-predictivo
Buscar patrones y formatos de datos predictivos por formatos de datos estandarizados.
Lograr confianza en el hallazgo de tendencias interdependientes y resultados esperados.
Emplear regresión de múltiples variantes y otras técnicas sobre datos precisos.
Probar hipótesis con datos certificados.
Notificaciones y Alertas
Distribuir alertas a un amplio rango de puntos de usuario desde cualquier fuente de datos.
Mitigar el riesgo de distribuir alertas y notificaciones incorrectas con una calidad de datos predefinida y aprobada.
Aprovechar los datos autentificados para la personalización del contenido y la filiación de grupos.
Permitir dedencadenar alertas en tiempo real cuando múltiples datos de eventos cumplen umbrales específicos.
La amplia adopción del BI en todos los niveles de la organización ha propiciado que el BI avanzase más allá de las tradicionales funciones de query,
reporting analítico y procesamiento analítico online (OLAP), para incluir ahora cuadros de mando
operacionales, tablas de resultados personalizables y avanzadas técnicas de visualización.
Desde la perspectiva de la cadena de suministro de la información, esto implica que los datos necesitan estar
accesibles y ser agregados y racionalizados para poder consumirse por el BI, independientemente
del formato, donde sea que el usuario lo necesite. Y, cada día, la apuesta es más alta.
Frente a las tradicionales aplicaciones de BI centradas en las queries y las analíticas, muchos
nuevos usuarios de BI se centran en las decisiones operacionales y las consiguientes acciones. Esto
significa que toda acción que los usuarios emprenden basándose en la fortaleza de los informes y
las alertas está influida por la precisión de los datos utilizados para los informes, así como por la
capacidad que los usuarios tengan para confiar en estos datos. ¿Con qué frecuencia nos parecen
los datos raros o poco fiables cuando vemos los informes BI? Esta inquietante sensación, esté o no
justificada, provoca retrasos e incluso paraliza las acciones necesarias que resultan críticas para el
negocionales, tablas de resultados personalizables y avanzadas técnicas de visualización.
Si los datos están incompletos, son imprecisos o están llenos de duplicidades,
todo el sistema de confianza estará debilitado y la gente será reacia a utilizar sus herramientas de
BI. Pero más allá de la obvia limpieza y comparación de los datos está la red de confianza que debe construirse alrededor del data warehouse, los almacenes operacionales y otros sistemas y aplicaciones que generan una corriente continua de datos por toda la empresa. Por esta razón, un creciente número de organizaciones están emprendiendo iniciativas de calidad de datos como principio central de sus iniciativas de BI en la empresa.
La capacidad para perfilar, limpiar y suministrar todo tipo de datos con altos niveles de calidad en todo momento, independientemente de los volúmenes y complejidad de los datos, está en la base del éxito de BI. Y la recompensa es directa y muy alta.
Con una buena calidad de datos, los conocimientos empresariales obtenidos a través del BI se convierten en útiles con mayor rapidez (con frecuencia, con mucha mayor rapidez). Al incrementar la confianza en los datos, los directivos, responsables y usuarios de negocio pueden reconocer y actuar inmediatamente ante nuevos patrones y tendencias, así como ante los signos de peligro para el negocio, con una granularidad y precisión más elevadas. Identificar los sobrecostes y otras oportunidades para reducir gastos y ahorrar pueden ser resultados directos de la capacidad de los usuarios de negocio al utilizar datos precisos y verificables procedentes del reporting y las alertas. Y la gestión de la calidad de datos de punto a punto incrementa también la auditabilidad y la visibilidad
del reporting de BI, un aspecto especialmente valioso para los propósitos de conformidad y gestión de riesgos.
Un despliegue exitoso
de Business Intelligence (BI) puede ayudar a valorar la salud de una organización, establecer los
indicadores de rendimiento oportunos y monitorizar las operaciones del día a día con un ojo puesto
en el crecimiento global. Por consiguiente, la demanda de datos precisos para realizar las tareas de
BI continúa creciendo tanto en el lado de la demanda como en el del suministro de información.