SlideShare una empresa de Scribd logo
1 de 76
Descargar para leer sin conexión
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
DAMA-DMBOK
ÓRGANO DE CONOCIMIENTO DE GESTIÓN DE DATOS SEGUNDO
EDICIÓN
DAMA Internacional
Publicaciones técnicas
BASKING R IDGE, NUEVA JERSEY
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
Dedicado a la memoria de
Patricia Cupoli, MLS, MBA, CCP, CDMP
(25 de mayo de 1948-28 de julio de 2015)
por su compromiso de por vida con la profesión de gestión de datos
y sus contribuciones a esta publicación.
Publicado por:
2 Lindsley Road
Basking Ridge, Nueva Jersey 07920 EE. UU.
https://www.TechnicsPub.com
Editor en jefe:
Editor:
Editor de producción:
Investigador de bibliografía:
Administrador de herramientas de colaboración:
Deborah Henderson, CDMP
Susan Earley, CDMP
Laura Sebastian-Coleman, CDMP, IQCP Elena
Sykora, DGSP
Eva Smith, CDMP
Diseño de portada de Lorena Molinari
Reservados todos los derechos. Ninguna parte de este libro puede ser reproducida o transmitida en cualquier forma o por cualquier medio, electrónico o mecánico,
incluyendo fotocopias, grabaciones o por cualquier sistema de almacenamiento y recuperación de información, sin el permiso por escrito del editor, excepto por la
inclusión de breves citas en una revisión.
El autor y el editor se han ocupado de la preparación de este libro, pero no ofrecen garantía expresa o implícita de ningún tipo y no asumen ninguna
responsabilidad por errores u omisiones. No se asume ninguna responsabilidad por daños incidentales o consecuentes en relación con o que surjan del
uso de la información o los programas contenidos en este documento.
Todos los nombres comerciales y de productos son marcas comerciales, marcas comerciales registradas o marcas de servicio de sus respectivas empresas y son propiedad
de sus respectivos titulares y deben tratarse como tales.
Segunda edicion
Primera impresión 2017
Copyright © 2017 DAMA Internacional
ISBN, edición impresa.
ISBN, PDF ed.
ISBN, servidor ed.
Enterprise ed.
9781634622349
9781634622363
9781634622486 ISBN,
9781634622479
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
Número de control de la Biblioteca del Congreso: 2017941854
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
Contenido
Prefacio _________________________________________________________ 15
Capítulo 1: Gestión de datos _______________________________________
17
1. Introducción ____________________________________________________________ 17
2. Conceptos esenciales _______________________________________________________ 18
2.1 Datos ______________________________________________________________________ 18
2.2 Datos e información ________________________________________________________ 20
2.3 Los datos como activo organizativo _______________________________________________ 20
2.4 Principios de gestión de datos __________________________________________________ 21
2.5 Desafíos de la gestión de datos _________________________________________________ 23
2.6 Estrategia de gestión de datos ___________________________________________________ 31
3. Marcos de gestión de datos ____________________________________________ 33
3.1 Modelo de alineación estratégica ____________________________________________________ 33
3.2 El modelo de información de Amsterdam ____________________________________________
34
3.3 El marco DAMA-DMBOK _______________________________________________ 35
3.4 Pirámide DMBOK (Aiken) _____________________________________________________ 39
3.5 Marco de gestión de datos de DAMA evolucionado ___________________________________ 40
4. DAMA y el DMBOK ___________________________________________________ 43
5. Trabajos citados / recomendados ______________________________________________
46
Capítulo 2: Ética en el manejo de datos ____________________________________ 49
1. Introducción ____________________________________________________________ 49
2. Impulsores comerciales ________________________________________________________ 51
3. Conceptos esenciales _______________________________________________________ 52
3.1 Principios éticos para los datos ____________________________________________________ 52
3.2 Principios detrás de la ley de privacidad de datos ____________________________________________ 53
3.3 Datos en línea en un contexto ético ______________________________________________ 56
3.4 Riesgos de prácticas de manejo de datos poco éticas ______________________________________ 56
3,5 Estableciendo un Ético Datos Cultura
____________________________________________ 60
3.6 Gobernanza y ética de los datos __________________________________________________ 64
4. Obras citadas / recomendadas ______________________________________________ sesenta y cinco
Capítulo 3: Gobierno de datos ________________________________________
67
1. Introducción ____________________________________________________________ 67
1.1 Impulsores comerciales ____________________________________________________________ 70
1.2 Metas y principios _________________________________________________________ 71
1.3 Conceptos esenciales __________________________________________________________ 72
2. Actividades _______________________________________________________________ 79
2.1 Definir la gobernanza de datos para la organización ____________________________________ 79 2.2
Realizar evaluación de preparación _______________________________________________ 79 2.3 Realizar descubrimiento y
alineación empresarial _____________________________________ 80
2.4 Desarrollar puntos de contacto organizacionales ___________________________________________ 81
2.5 Desarrollar una estrategia de gobernanza de datos _____________________________________________ 82
2.6 Definir el marco operativo de la DG ___________________________________________ 82
2,7 Desarrollar Objetivos, Principios y Políticas
__________________________________________ 83 2.8 Suscribir proyectos de gestión de datos
_________________________________________ 84
2.9 Implicar la gestión del cambio __________________________________________________ 85
1
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
2 • DMBOK2
2.10 Participar en la gestión de problemas ________________________________________________ 86
2.11 Evaluar los requisitos de cumplimiento normativo ___________________________________ 87
2.12 Implementar la gobernanza de datos _________________________________________________
88
2.13 Estándares y procedimientos de datos del patrocinador _______________________________________ 88
2.14 Desarrollar a Negocio Glosario
_________________________________________________ 90
2.15 Coordinar con grupos de arquitectura _________________________________________ 90
2.16 Valoración de activos de datos del patrocinador ________________________________________________ 91
2.17 Gobernanza de datos incorporados ____________________________________________________ 91
3. Herramientas y técnicas____________________________________________________ 92
3.1 Presencia en línea / Sitios web ___________________________________________________ 92
3.2 Glosario empresarial ___________________________________________________________ 92
3.3 Herramientas de flujo de trabajo ____________________________________________________________ 93
3.4 Documento administración Herramientas
_________________________________________________ 93
3.5 Cuadros de mando de la gobernanza de datos __________________________________________________ 93
4. Directrices de implementación _______________________________________________ 93
4.1 Organización y cultura _____________________________________________________
93
4.2 Ajuste y comunicación ______________________________________________ 94
5. Métricas ________________________________________________________________ 94
6. Obras citadas / recomendadas _____________________________________________
95
Capítulo 4: Arquitectura de datos _______________________________________
97
1. Introducción ___________________________________________________________ 97
1.1 Impulsores comerciales ____________________________________________________________
99
1.2 Resultados y prácticas de la arquitectura de datos _____________________________________ 100
1.3 Conceptos esenciales _________________________________________________________ 101
2. Actividades _____________________________________________________________ 109
2.1 Establecer la práctica de arquitectura de datos __________________________________________ 110
2.2 Integrar con la arquitectura empresarial ________________________________________ 115
3. Herramientas ________________________________________________________________ 115
3.1 Herramientas de modelado de datos________________________________________________________ 115
3.2 Software de gestión de activos _________________________________________________
115
3.3 Aplicaciones de diseño gráfico _______________________________________________ 115
4. Técnicas ___________________________________________________________ 116
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
CONTENIDO • 3
4.1 Proyecciones del ciclo de vida _______________________________________________________ 116
4.2 Diagramación de claridad _______________________________________________________ 116
5. Directrices de implementación ______________________________________________ 117
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 118
5.2 Organización y cambio cultural ____________________________________________ 119
6. Gobierno de la arquitectura de datos ___________________________________________ 119
6.1 Métricas ___________________________________________________________________
120 7. Trabajos Citado / Recomendado
____________________________________________ 120
Capítulo 5: Modelado y diseño de datos _______________________________
123
1. Introducción __________________________________________________________ 123
1.1 Impulsores comerciales ___________________________________________________________
125
________________________________________________________ 125
1.3 Conceptos esenciales _________________________________________________________ 126
1.2 Objetivos y Principios
2. Actividades _____________________________________________________________ 152
2.1 Plan de modelado de datos ______________________________________________________ 152
2.2 Construya el modelo de datos _______________________________________________________ 153
2.3 Revisar los modelos de datos _____________________________________________________
158
2.4 Mantener los modelos de datos ___________________________________________________ 159
3. Herramientas _________________________________________________________________
159
3.1 Herramientas de modelado de datos ________________________________________________________
159
3.2 Herramientas de linaje _____________________________________________________________ 159
3.3 Herramientas de creación de perfiles de datos ________________________________________________________ 160
3.4 Repositorios de metadatos ______________________________________________________ 160
3.5 Patrones del modelo de datos ________________________________________________________
160
3.6 Modelos de datos de la industria _______________________________________________________ 160
4. Mejores prácticas __________________________________________________________
161
4.1 Mejores prácticas en las convenciones de nomenclatura _________________________________________ 161
4.2 Mejores prácticas en el diseño de bases de datos _____________________________________________ 161
5. Gobierno del modelo de datos _________________________________________________ 162
5.1 Modelo de datos y gestión de la calidad del diseño ___________________________________ 162
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
4 • DMBOK2
5.2 Métricas de modelado de datos ______________________________________________________ 164
6. Obras citadas / recomendadas _____________________________________________
166
Capítulo 6: Almacenamiento de datos y operaciones _____________________________
169
1. Introducción ___________________________________________________________
169
1.1 Impulsores comerciales ___________________________________________________________
171
1.2 Metas y principios ________________________________________________________ 171
1.3 Conceptos esenciales _________________________________________________________ 172
2. Actividades ______________________________________________________________
193 2.1 Gestionar la tecnología de la base de datos
________________________________________________ 194
2.2 Administrar bases de datos _________________________________________________________ 196
3. Herramientas _________________________________________________________________
209
3.1 Herramientas de modelado de datos ________________________________________________________
209
__________________________________________________ 209
3.3 Herramientas de administración de bases de datos _________________________________________________
209
3.4 Herramientas de soporte para desarrolladores ____________________________________________________ 209
3.2 Base de datos Supervisión Herramientas
4. Técnicas ____________________________________________________________
210
4.1 Prueba en entornos inferiores _________________________________________________ 210
4.2 Estándares de denominación física __________________________________________________
210
4.3 Uso de scripts para todos los cambios _________________________________________________ 210
5. Directrices de implementación _______________________________________________
210
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 210
5.2 Organización y cambio cultural ____________________________________________ 211
6. Almacenamiento de datos y gobernanza de operaciones ___________________________________
212
6.1 Métricas ___________________________________________________________________
212
__________________________________________________ 213
6.2 Información Activo Seguimiento
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
CONTENIDO • 5
6.3 Auditorías de datos y validación de datos ______________________________________________ 213
7. Trabajos citados / recomendados _____________________________________________
214
Capítulo 7: Seguridad de los datos __________________________________________
217
1. Introducción ___________________________________________________________
217
1.1 Impulsores comerciales ___________________________________________________________
220
1.2 Metas y principios ________________________________________________________ 222
1.3 Conceptos esenciales _________________________________________________________ 223
2. Actividades _____________________________________________________________ 245
2.1 Identificar los requisitos de seguridad de los datos __________________________________________ 245
2.2 Definir la política de seguridad de datos __________________________________________________ 247
2.3 Definir estándares de seguridad de datos _______________________________________________ 248
3. Herramientas ________________________________________________________________ 256
3.1 Software antivirus / Software de seguridad _______________________________________ 256
3.2 HTTPS ___________________________________________________________________ 256
3.3 Tecnología de gestión de identidad ____________________________________________ 257
3.4 Software de detección y prevención de intrusiones ___________________________________ 257
3.5 Cortafuegos (prevención) ______________________________________________________
257
3.6 Seguimiento de metadatos _________________________________________________________ 257
3.7 Enmascaramiento / cifrado de datos ___________________________________________________ 258
4. Técnicas ___________________________________________________________ 258
4.1 Uso de CRUDMatrix ________________________________________________________ 258
4.2 Implementación inmediata del parche de seguridad ________________________________________ 258
4.3 Atributos de seguridad de datos en metadatos __________________________________________ 258
4.4 Métricas ___________________________________________________________________
259
4.5 Necesidades de seguridad en los requisitos del proyecto _______________________________________ 261
4.6 Búsqueda eficiente de datos cifrados ____________________________________________ 262
4.7 Desinfección de documentos ______________________________________________________
262
5. Directrices de implementación ______________________________________________ 262
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 262
5.2 Organización y cambio cultural ____________________________________________ 263
5.3 Visibilidad de la titularidad de los datos del usuario __________________________________________ 263
5.4 Seguridad de los datos en un mundo subcontratado _________________________________________ 264
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
6 • DMBOK2
5.5 Seguridad de datos en entornos de nube __________________________________________ 265
6. Gobierno de la seguridad de los datos _______________________________________________ 265
6.1 Seguridad de datos y arquitectura empresarial _____________________________________ 265
7. Trabajos Citado / Recomendado
____________________________________________ 266
Capítulo 8: Integración e interoperabilidad de datos ______________________
269
1. Introducción __________________________________________________________ 269
1.1 Impulsores comerciales ___________________________________________________________
270
1.2 Metas y principios ________________________________________________________ 272
1.3 Conceptos esenciales _________________________________________________________ 273
2. Actividades de integración de datos _______________________________________________ 286
2.1 Planificar y analizar __________________________________________________________ 286
2.2 Diseño de soluciones de integración de datos ____________________________________________ 289
2.3 Desarrollar soluciones de integración de datos ___________________________________________
291
2.4 Implementar y monitorear _____________________________________________________ 293
3. Herramientas ________________________________________________________________ 294
3.1 Motor de transformación de datos / Herramienta ETL ________________________________________ 294
3.2 Servidor de virtualización de datos ___________________________________________________ 294
3.3 Enterprise Service Bus ______________________________________________________ 294
3.4 Motor de reglas comerciales ______________________________________________________
295
_____________________________________________ 295
3.6 Herramienta de creación de perfiles de datos _________________________________________________________ 295
3.7 Repositorio de metadatos _______________________________________________________ 296
3,5 Datos y Proceso Modelado Herramientas
4. Técnicas ___________________________________________________________ 296
5. Directrices de implementación _______________________________________________
296
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 296
5.2 Organización y cambio cultural ____________________________________________ 297
6. Gobernanza DII _________________________________________________________
297
6.1 Acuerdos de intercambio de datos ___________________________________________________ 298
6.2 DII y linaje de datos _______________________________________________________ 298
6.3 Métricas de integración de datos ____________________________________________________ 299
7. Trabajos citados / recomendados _____________________________________________
299
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
CONTENIDO • 7
Capítulo 9: Gestión de contenido y documentos_______________________
303
1. Introducción ___________________________________________________________
303
1.1 Impulsores comerciales ___________________________________________________________
305
1.2 Metas y principios ________________________________________________________ 305
1.3 Conceptos esenciales _________________________________________________________ 307
2. Actividades ______________________________________________________________
323 2.1 Plan de gestión del ciclo de vida
_______________________________________________ 323
2.2 Gestionar el ciclo de vida _______________________________________________________ 326
2.3 Publicar y entregar contenido _________________________________________________ 329
3. Herramientas _________________________________________________________________
330
3.1 Sistemas de gestión de contenido empresarial ______________________________________ 330
3.2 Herramientas de colaboración ________________________________________________________
333
3.3 Herramientas de metadatos y vocabulario controlado _____________________________________ 333
3.4 Formatos estándar de marcado e intercambio ______________________________________ 333
3.5 Tecnología de descubrimiento electrónico _____________________________________________________
336
4. Técnicas ____________________________________________________________
336
4.1 Manual de estrategias de respuesta a litigios ________________________________________________ 336
4.2 Mapa de datos de respuesta a litigios ________________________________________________ 337
5. Directrices de implementación _______________________________________________
337
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 338
5.2 Organización y cambio cultural ____________________________________________ 339
6. Documentos y gobernanza de contenido _______________________________________
340
6.1 Marcos de gobernanza de la información _________________________________________ 340
6.2 Proliferación de información _________________________________________________ 342
6.3 Gobernar el contenido de calidad __________________________________________________
342
6.4 Métricas ___________________________________________________________________
343 7. Trabajos citados / recomendados _____________________________________________
344
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
8 • DMBOK2
Capítulo 10: Referencia y datos maestros _____________________________
347
1. Introducción ___________________________________________________________
347
1.1 Impulsores comerciales ___________________________________________________________
349
________________________________________________________ 349
1.3 Conceptos esenciales _________________________________________________________ 350
1.2 Objetivos y Principios
2. Actividades ______________________________________________________________
370
2.1 Actividades de MDM ____________________________________________________________ 371
2.2 Actividades de datos de referencia ____________________________________________________ 373
3. Herramientas y técnicas ___________________________________________________ 375
4. Directrices de implementación _______________________________________________
375
4.1 Adherirse a la arquitectura de datos maestros ___________________________________________ 376
4.2 Supervisar el movimiento de datos ____________________________________________________ 376
4.3 Gestionar el cambio de datos de referencia ______________________________________________ 376
4.4 Acuerdos de intercambio de datos ___________________________________________________ 377
5. Organización y cambio cultural ________________________________________ 378
6. Referencia y gobernanza de datos maestros ____________________________________ 378
6.1 Métricas ___________________________________________________________________
379 7. Trabajos Citado / Recomendado
____________________________________________ 379
Capítulo 11: Almacenamiento de datos e inteligencia empresarial_______________
381
1. Introducción __________________________________________________________ 381
1.1 Impulsores comerciales ___________________________________________________________
383
1.2 Metas y principios ________________________________________________________ 383
1.3 Conceptos esenciales _________________________________________________________ 384
2. Actividades _____________________________________________________________ 394
2.1 Comprender los requisitos __________________________________________________ 394
2.2 Definir y mantener la arquitectura DW / BI ___________________________________ 395
2.3 Desarrollar el almacén de datos y los Data Marts ___________________________________
396
2.4 Llene el almacén de datos ________________________________________________ 397
2.5 Implementar la cartera de Business Intelligence __________________________________ 398
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
CONTENIDO • 9
2.6 Mantener productos de datos _____________________________________________________ 399
3. Herramientas ________________________________________________________________ 402
3.1 Repositorio de metadatos _______________________________________________________ 402
3.2 Herramientas de integración de datos ______________________________________________________ 403
3.3 Tipos de herramientas de inteligencia empresarial ____________________________________________ 403
4. Técnicas ___________________________________________________________ 407
4.1 Prototipos para impulsar los requisitos ____________________________________________ 407
4.2 BI de autoservicio _____________________________________________________________ 408
4.3 Datos de auditoría que se pueden consultar _______________________________________________ 408
5. Directrices de implementación ______________________________________________ 408
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 408
5.2 Hoja de ruta de lanzamiento __________________________________________________________ 409
5.3 Gestión de la configuración __________________________________________________ 409
5.4 Organización y cambio cultural ____________________________________________ 410
6. Gobierno de DW / BI _____________________________________________________ 411
6.1 Habilitación de la aceptación comercial _______________________________________________ 411
6.2 Satisfacción del cliente / usuario _________________________________________________
412
___________________________________________________ 412
6.3 Servicio Nivel Acuerdos
6.4 Reportando Estrategia
_________________________________________________________ 412
6.5 Métrica
___________________________________________________________________ 413 7. Obras
Citado / Recomendado ____________________________________________ 414
Capítulo 12: Gestión de metadatos ________________________________ 417
1. Introducción __________________________________________________________ 417
1.1 Impulsores comerciales ___________________________________________________________
420
1.2 Metas y principios ________________________________________________________ 420
1.3 Conceptos esenciales _________________________________________________________ 421
2. Actividades _____________________________________________________________ 434
2.1 Definir la estrategia de metadatos____________________________________________________ 434
2.2 Comprender los requisitos de metadatos __________________________________________ 435
2.3 Definir la arquitectura de metadatos ________________________________________________ 436
2.4 Crear y mantener metadatos________________________________________________ 438
2.5 Consultar, informar y analizar metadatos __________________________________________ 440
3. Herramientas _________________________________________________________________
440
3.1 Herramientas de gestión de repositorios de metadatos _______________________________________ 440
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
10 • DMBOK2
4. Técnicas ____________________________________________________________
441
4.1 Análisis de impacto y linaje de datos_____________________________________________ 441
4.2 Metadatos para la ingesta de Big Data _________________________________________________ 443
5. Directrices de implementación _______________________________________________
444
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 444
5.2 Cambio organizacional y cultural ___________________________________________ 445
6. Gobernanza de metadatos ___________________________________________________ 445
6.1 Controles de proceso ___________________________________________________________ 445
6.2 Documentación de soluciones de metadatos _________________________________________ 446
6.3 Normas y directrices de metadatos ___________________________________________
446
6.4 Métricas ___________________________________________________________________
447 7. Trabajos citados / recomendados _____________________________________________
448
Capítulo 13: Calidad de los datos _________________________________________ 449
1. Introducción ___________________________________________________________
449
1.1 Impulsores comerciales ___________________________________________________________
452
1.2 Metas y principios ________________________________________________________ 452
1.3 Conceptos esenciales _________________________________________________________ 453
2. Actividades ______________________________________________________________
473
2.1 Definir datos de alta calidad ____________________________________________________ 473
2.2 Definir una estrategia de calidad de datos ________________________________________________ 474
2.3 Identificar datos críticos y reglas comerciales _______________________________________ 474
2.4 Realizar la evaluación inicial de la calidad de los datos _____________________________________ 475
2.5 Identificar y priorizar las mejoras potenciales _________________________________
476
2.6 Definir objetivos para la mejora de la calidad de los datos ____________________________________ 477
2.7 Desarrollar e implementar operaciones de calidad de datos ___________________________________ 477
3. Herramientas _________________________________________________________________
484
3.1 Herramientas de creación de perfiles de datos ________________________________________________________ 485
3.2 Herramientas de consulta de datos ________________________________________________________ 485
3.3 Modelado y herramientas ETL _____________________________________________________
485
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
CONTENIDO • 11
3.4 Plantillas de reglas de calidad de datos _________________________________________________ 485
3.5 Repositorios de metadatos ______________________________________________________ 485
4. Técnicas ____________________________________________________________
486
4.1 Acciones preventivas _________________________________________________________ 486
4.2 Acciones correctivas _________________________________________________________
486
4.3 Módulos de verificación de calidad y código de auditoría ________________________________________ 487
4.4 Métricas de calidad de datos efectivas ________________________________________________ 487
4.5 Control estadístico del proceso ___________________________________________________
488
4.6 Análisis de causa raíz ________________________________________________________ 490
5. Directrices de implementación _______________________________________________
490
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 491
5.2 Organización y cambio cultural ____________________________________________ 492
6. Calidad y gobernanza de los datos _________________________________________
493
6.1 Política de calidad de datos _________________________________________________________ 493
___________________________________________________________________
6.2 Métricas
494
7. Obras citadas / recomendadas ____________________________________________ 494
Capítulo 14: Big Data y ciencia de datos ______________________________
497
1. Introducción __________________________________________________________ 497
1.1 Impulsores comerciales ___________________________________________________________
498
1.2 Principios ________________________________________________________________ 500
1.3 Conceptos esenciales _________________________________________________________ 500
2. Actividades _____________________________________________________________ 511
2.1 Definir la estrategia de Big Data y las necesidades comerciales ___________________________________ 511
2.2 Elija fuentes de datos _______________________________________________________ 512
2.3 Adquirir e ingerir fuentes de datos______________________________________________ 513
2.4 Desarrollar hipótesis y métodos de datos ________________________________________ 514
2.5 Integrar / alinear datos para análisis ____________________________________________ 514
2.6 Explorar datos usando modelos __________________________________________________ 514
2.7 Implementar y monitorear ________________________________________________________ 516
3. Herramientas ________________________________________________________________ 517
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
12 • DMBOK2
3.1 Arquitectura y tecnologías MPP Shared-Nothing _____________________________ 518
3.2 Bases de datos distribuidas basadas en archivos _____________________________________________
519
3.3 Algoritmos en la base de datos _____________________________________________________ 520
3.4 Soluciones de Big Data en la nube ____________________________________________________ 520
3.5 Computación estadística y lenguajes gráficos _________________________________ 520
3.6 Herramientas de visualización de datos ____________________________________________________ 520
4. Técnicas ___________________________________________________________ 521
4.1 Modelado analítico __________________________________________________________
521
4.2 Modelado de Big Data _________________________________________________________ 522
5. Directrices de implementación ______________________________________________ 523
5.1 Alineación de la estrategia _________________________________________________________
523
5.2 Evaluación de la preparación / Evaluación de riesgos ______________________________________ 523
5.3 Organización y cambio cultural ____________________________________________ 524
6. Big Data y gobernanza de la ciencia de datos _____________________________________ 525
6.1 Gestión de canales de visualización __________________________________________ 525
6.2 Estándares de visualización y ciencia de datos ______________________________________ 525
6.3 Seguridad de los datos ______________________________________________________________
526
6.4 Metadatos
_________________________________________________________________ 526
6.5 Datos Calidad
______________________________________________________________ 527 6.6 Métricas
___________________________________________________________________ 527 7. Obras
Citado / Recomendado ____________________________________________ 528
Capítulo 15: Evaluación de la madurez de la gestión de datos __________________ 531
1. Introducción __________________________________________________________ 531
1.1 Impulsores comerciales ___________________________________________________________
532
1.2 Metas y principios ________________________________________________________ 534
1.3 Conceptos esenciales _________________________________________________________ 534
2. Actividades _____________________________________________________________ 539
2.1 Planificar actividades de evaluación __________________________________________________ 540
2.2 Realizar una evaluación de madurez ________________________________________________
542
2.3 Interpretar los resultados __________________________________________________________ 543
2.4 Crear un programa específico de mejoras __________________________________ 544
2.5 Reevaluar la madurez _________________________________________________________ 545
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
CONTENIDO • 13
3. Herramientas _________________________________________________________________
545
4. Técnicas ____________________________________________________________
546
4.1 Selección de un marco DMM _________________________________________________
546
4.2 Uso del marco DAMA-DMBOK ______________________________________________ 546
5. Pautas para un DMMA __________________________________________________ 547
5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 547
5.2 Cambio organizacional y cultural ___________________________________________ 548
6. Gobierno de la gestión de la madurez ________________________________________ 548
6.1 Supervisión del proceso de DMMA ____________________________________________________
548
6.2 Métricas ___________________________________________________________________
548 7. Trabajos Citado / Recomendado
_____________________________________________ 549
Capítulo 16: Organización de la gestión de datos y expectativas de los roles _______
551
1. Introducción ___________________________________________________________
551
2. Comprender las normas culturales y de organización existentes ________________________
551
3. Construcciones organizativas de gestión de datos ________________________________
553
3.1 Modelo operativo descentralizado _______________________________________________
553
3.2 Modelo operativo de red ___________________________________________________ 554
3.3 Modelo operativo centralizado _________________________________________________
555
3.4 Modelo operativo híbrido ____________________________________________________ 556
3.5 Modelo de funcionamiento federado __________________________________________________ 557
3.6 Identificación del mejor modelo para una organización __________________________________ 557
3.7 Alternativas de DMO y consideraciones de diseño ___________________________________ 558
4. Factores críticos de éxito __________________________________________________
559
4.1 Patrocinio ejecutivo ______________________________________________________
559
_______________________________________________________________ 559
4.2 Claro Visión
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
14 • DMBOK2
4.3 Gestión proactiva del cambio _______________________________________________ 559
4.4 Alineación de liderazgo ______________________________________________________ 560
Comunicación ____________________________________________________________
560
Participación de los interesados ____________________________________________________
560
Orientación y formación ____________________________________________________
560
Medida de adopción _____________________________________________________
561
Adherencia a los principios rectores ______________________________________________
561
4.10 Evolución, no revolución __________________________________________________ 561
4.5
4.6
4,7
4.8
4.9
5. Construya la organización de gestión de datos ___________________________________
562
5.1 Identificar a los participantes actuales de la gestión de datos _________________________________ 562
5.2 Identificar a los participantes del comité ______________________________________________
562
____________________________________________ 563
5.4 Involucrar a las partes interesadas ____________________________________________________ 563
5.3 Identificar y Analizar Partes interesadas
6. Interacciones entre la OGD y otros organismos orientados a los datos ________________
564
6.1 El director de datos_______________________________________________________ 564
6.2 Gobierno de datos ___________________________________________________________
565
_______________________________________________________________ 566
6.4 Arquitectura empresarial _____________________________________________________ 566
6.5 Gestión de una organización global ______________________________________________ 567
6.3 Datos Calidad
7. Funciones de gestión de datos _________________________________________________ 568
7.1 Roles organizacionales _______________________________________________________ 568
7.2 Funciones individuales ___________________________________________________________
568
8. Trabajos citados / recomendados _____________________________________________
571
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
• DMBOK2
Capítulo 17: Gestión de datos y gestión de cambios organizacionales __ 573
1. Introducción __________________________________________________________ 573 2. Leyes de cambio
________________________________________________________ 574
3. No gestionar un cambio: gestionar una transición _____________________________ 575
4. Ocho errores de gestión del cambio de Kotter _______________________________ 577
4.1
4.2
4.3 Error # 3: Subestimar el poder de la visión _________________________________ 578
4.4 Error # 4: Comunicar la visión por un factor de 10, 100 o 1000 __________ 579
4.5 Error # 5: Permitir obstáculos para bloquear la visión _______________________________ 580
4.6 Error n. ° 6: No se pueden crear victorias a corto plazo ___________________________________ 580
Error # 1: Permitir demasiada complacencia ____________________________________ 577
Error n. ° 2: No crear una coalición rectora suficientemente poderosa ________________ 578
4.7 Error # 7: Declarar la victoria demasiado pronto _________________________________________ 581
4.8 Error # 8: Descuidar anclar firmemente los cambios en la cultura corporativa____________ 581
5. Proceso de ocho etapas de Kotter para un cambio importante ______________________________ 582
5.1
5.2
Establecer un sentido de urgencia ______________________________________________ 583
La Coalición de Orientación _______________________________________________________
586
5.3
5.4
6. La fórmula del cambio _________________________________________________ 598
Desarrollo de una visión y estrategia _____________________________________________ 590
Comunicando la visión del cambio ____________________________________________ 594
7. Difusión de innovaciones y cambio sostenido _____________________________ 599
7.1
7.2
7.3
7.4
8. Sosteniendo el cambio _____________________________________________________ 603 8.1
Los desafíos a superar a medida que se difunden las innovaciones ___________________________ 601
Elementos clave en la difusión de la innovación ____________________________________ 601
Las cinco etapas de la adopción _________________________________________________ 601
Factores que afectan la aceptación o el rechazo de una innovación o cambio ______________ 602
Sentido de urgencia / insatisfacción ____________________________________________ 604
8.2 Enmarcando la visión _________________________________________________________ 604
8.3 La Coalición Rectora _______________________________________________________ 605
8.4 Ventaja relativa y observabilidad _________________________________________ 605
9. Comunicación del valor de la gestión de datos __________________________________ 605
9.1 Principios de comunicación __________________________________________________
605
9.2
9.3
Evaluación y preparación de la audiencia _________________________________________ 606
El elemento humano ________________________________________________________
607
9.4
9.5
10. Obras citadas / recomendadas ___________________________________________ 609
Plan de comunicación _______________________________________________________ 608
Siga comunicándose _______________________________________________________ 609
Agradecimientos _____________________________________________ 611
Índice _________________________________________________________ 615
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
dieciséis
Cifras
Figura 1 Principios de gestión de datos ____________________________________________________________ 22 Figura 2 Actividades clave del ciclo de vida de los
datos_____________________________________________________________ 29 Figura 3 Modelo de alineación estratégica (Henderson y Venkatraman)
_____________________________________ 34 Figura 4 Modelo de información de Amsterdam (adaptado)
__________________________________________________ 35 Figura 5 El marco de gestión de datos DAMA-DMBOK2 (The DAMAWheel)
___________________________ 36 Figura 6 Hexágono de factores ambientales de DAMA ____________________________________________________ 36 Figura 7
Diagrama de contexto del área de conocimiento
________________________________________________________ 37 Figura 8 Capacidad de base de datos comprada o construida
____________________________________________________ 40 Figura 9 Dependencias del área funcional de DAMA
_____________________________________________________ 41 Figura 10 Marco de la función de gestión de datos de DAMA
_____________________________________________ 42 Figura 11 DAMA Rueda Evolucionado
________________________________________________________________ 44 Figura 12 Diagrama de contexto: Ética en el manejo de datos
___________________________________________________ 50 Figura 13 Modelo de riesgo ético para proyectos de muestreo
__________________________________________________ 64 Figura 14 Diagrama de contexto: gobernanza y administración de datos
_________________________________________ 69 Figura 15 Gobernanza y gestión de datos
__________________________________________________ 72 Figura 16 Partes de la organización de gobierno de datos
_____________________________________________________ 74 Figura 17 Ejemplos del marco operativo de la DG empresarial
_____________________________________________ 75 Figura 18 Puntos de contacto organizativos de CDO
________________________________________________________ 81 Figura 19 Un ejemplo de un marco operativo
__________________________________________________ 83 Figura 20 Datos Asunto Escalada Sendero
_____________________________________________________________ 86 Figura 21 Diagrama de contexto: Arquitectura de datos
_____________________________________________________ 100 Figura 22 Marco Zachman simplificado
________________________________________________________ 103 Figura 23 Empresa Datos Modelo
_______________________________________________________________ 106 Figura 24 Ejemplo de diagrama de modelos de área temática
___________________________________________________ 107 Figura 25 Flujo de datos representado en una matriz
________________________________________________________ 108 Figura 26 Ejemplo de diagrama de flujo de datos
__________________________________________________________ 109 Figura 27 Las dependencias de datos de las capacidades comerciales
____________________________________________ 112 Figura 28 Diagrama de contexto: modelado y diseño de datos
______________________________________________ 124
Figura 29 Entidades __________________________________________________________________________ 129 Figura 30 Relaciones
______________________________________________________________________ 130
Figura 31 Símbolos de cardinalidad _________________________________________________________________ 131 Figura 32 Relación unitaria - Jerarquía
________________________________________________________ 131 Figura 33 Relación unitaria - Red
_________________________________________________________ 131 Figura 34 Relación binaria
_________________________________________________________________ 132 Figura 35 Relación ternaria
________________________________________________________________ 132 Figura 36 Claves externas
______________________________________________________________________ 133 Figura 37 Atributos
________________________________________________________________________ 133 Figura 38 Entidad dependiente e independiente
_____________________________________________________ 134 Figura 39 Notación IE
_______________________________________________________________________ 137 Figura 40 Notación de ejes para modelos dimensionales
___________________________________________________ 138 Figura 41 Modelo de clase UML
___________________________________________________________________ 140 Figura 42 ORM Modelo
_______________________________________________________________________ 141 Figura 43 Modelo FCO-IM
_____________________________________________________________________ 142 Figura 44 Modelo de bóveda de datos
___________________________________________________________________ 143 Figura 45 Modelo de ancla
_____________________________________________________________________ 143 Figura 46 Modelo conceptual relacional
__________________________________________________________ 145 Figura 47 Modelo conceptual dimensional
________________________________________________________ 146
Figura 48 Modelo de datos lógicos relacionales _________________________________________________________ 146 Figura 49 Modelo de datos lógicos
dimensionales _______________________________________________________ 147 Figura 50 Modelo de datos físicos relacionales
________________________________________________________ 148 Figura 51
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
Modelo de datos físicos dimensionales _______________________________________________________ 149 Figura 52 Relaciones de supertipo y subtipo
___________________________________________________ 152
Figura 53 El modelado es iterativo ________________________________________________________________ 153
11
• DMBOK2
Figura 54 Diagrama de contexto: almacenamiento de datos y operaciones _____________________________________________ 170 Figura 55 Centralizado
frente a distribuido ____________________________________________________________ 175 Figura 56 Bases de datos federadas
________________________________________________________________ 176 Figura 57
Acoplamiento __________________________________________________________________________ 177 Figura 58 Teorema de CAP
______________________________________________________________________ 180 Figura 59 Espectro de organización de la base de datos
_______________________________________________________ 184 Figura 60 Envío de registros frente a duplicación
____________________________________________________________ 192 Figura 61 SLA para el rendimiento del sistema y la base de datos
_______________________________________________ 203 Figura 62 Fuentes de requisitos de seguridad de datos
___________________________________________________ 218 Figura 63 Diagrama de contexto: seguridad de datos
_________________________________________________________ 219 Figura 64 DMZ Ejemplo
______________________________________________________________________ 231 Figura 65 Diagrama de ejemplo de jerarquía de roles de seguridad
________________________________________________ 251 Figura 66 Diagrama de contexto: Integración e interoperabilidad de datos
______________________________________ 271 Figura 67 Flujo del proceso ETL
___________________________________________________________________ 274
Figura 68 Flujo de proceso ELT ___________________________________________________________________ 275 Figura 69 Acoplamiento de aplicación
________________________________________________________________ 282 Figura 70 Enterprise Service Bus
_______________________________________________________________ 283 Figura 71 Diagrama de contexto: documentos y contenido
________________________________________________ 304 Figura 72 Jerarquía de documentos basada en ISO 9001-4.2
_______________________________________________ 317 Figura 73 Modelo de referencia de descubrimiento electrónico
___________________________________________________ 319
Figura 74 Modelo de referencia de gobierno de la información_________________________________________________ 341 Figura 75 Diagrama de contexto: datos
maestros y de referencia ______________________________________________ 348 Figura 76 Pasos de procesamiento clave para MDM
_________________________________________________________ 361 Figura 77 Ejemplo de arquitectura de intercambio de datos maestros
________________________________________________ 370 Figura 78 Proceso de solicitud de cambio de datos de referencia
__________________________________________________ 377
Figura 79 Diagrama de contexto: DW / BI _____________________________________________________________ 382 Figura 80 La fábrica de información
corporativa ______________________________________________________ 388 Figura 81 Piezas de ajedrez del almacén de datos de Kimball
__________________________________________________ 390 Figura 82 Arquitectura conceptual de DW / BI y Big Data
______________________________________________ 391 Figura 83 Ejemplo de proceso de liberación
_____________________________________________________________ 400 Figura 84 Diagrama de contexto: Metadatos
____________________________________________________________ 419
Figura 85 Arquitectura de metadatos centralizada ______________________________________________________ 432
Figura 86 Arquitectura de metadatos distribuidos ______________________________________________________ 433 Figura 87 Arquitectura de metadatos híbrida
__________________________________________________________ 434 Figura 88 Ejemplo de metamodelo de repositorio de metadatos
________________________________________________ 437 Figura 89 Diagrama de flujo de linaje de elementos de datos de muestra
_______________________________________________ 442 Figura 90 Diagrama de flujo de linaje del sistema de muestra
___________________________________________________ 442 Figura 91 Diagrama de contexto: Calidad de los datos
_________________________________________________________ 451 Figura 92 Relación entre dimensiones de calidad de datos
____________________________________________ 460 Figura 93 Un ciclo de gestión de la calidad de los datos basado en el gráfico de Shewhart
________________________________ 463 Figura 94 Barreras para administrar la información como un activo comercial ________________________________________ 467
Figura 95 Gráfico de control de un proceso en control estadístico
_____________________________________________ 489 Figura 96 Disminuir Información Triángulo
____________________________________________________________ 498 Figura 97 Diagrama de contexto: BigData y Ciencia de datos
_______________________________________________ 499 Figura 98 Datos Ciencia Proceso
________________________________________________________________ 501
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
18
Figura 99 Desafíos del almacenamiento de datos ______________________________________________________________ 503 Figura 100 Arquitectura
conceptual de DW / BI y Big Data _____________________________________________ 504 Figura 101 Arquitectura basada en servicios
__________________________________________________________ 506 Figura 102
Arquitectura de dispositivo en columna ______________________________________________________ 519 Figura 103 Diagrama de contexto: Evaluación de la
madurez de la gestión de datos ___________________________________ 533 Figura 104 Ejemplo de modelo de madurez de gestión de datos
______________________________________________ 535 Figura 105 Ejemplo de visualización de una evaluación de la madurez de la gestión de datos
_____________________________ 537 Figura 106 Evaluar el estado actual para crear un modelo operativo _________________________________________ 552 Figura
107 Modelo operativo descentralizado ________________________________________________________ 554
FIGURAS Y TABLAS • 13
Figura 108 Modelo operativo de red ___________________________________________________________ 554 Figura 109 Modelo de funcionamiento
centralizado _________________________________________________________ 555 Figura 110 Modelo operativo híbrido
____________________________________________________________ 556
Figura 111 Modelo operativo federado __________________________________________________________ 557 Figura 112 Mapa de interés de las partes
interesadas ____________________________________________________________ 564 Figura 113 Fases de transición de Bridges
__________________________________________________________ 576 Figura 114 Proceso de ocho etapas de Kotter para un cambio importante
____________________________________________ 583 Figura 115 Fuentes de complacencia
_____________________________________________________________ 585 Figura 116 La visión se abre paso
Estado Quo _____________________________________________________ 591 Figura 117
Contraste gestión / liderazgo _____________________________________________________ 593 Figura 118 Difusión de innovaciones de Everett Rogers
_________________________________________________ 600
Figura 119 Las etapas de adopción _____________________________________________________________ 602
Mesas
Tabla 1 Principios del RGPD ______________________________________________________________________ 54 Tabla 2 Obligaciones legales de privacidad de
Canadá _____________________________________________________ 55 Tabla 3 Criterios del programa de privacidad de Estados Unidos
_____________________________________________________ 55 Tabla 4 Comités / órganos de gobernanza de datos típicos
_______________________________________________ 74 Tabla 5 Principios para la contabilidad de activos de datos
_______________________________________________________ 78 Tabla 6 Dominios de la arquitectura
_________________________________________________________________ 101 Tabla 7 Categorías de entidades más utilizadas
________________________________________________________ 127 Tabla 8 Entidad, tipo de entidad e instancia de entidad
____________________________________________________ 128 Tabla 9 Esquemas y notaciones de modelado
________________________________________________________ 136 Tabla 10 Referencia cruzada de esquema a base de datos
_____________________________________________________ 137 Tabla 11 Cuadro de mando del modelo de datos ® Modelo
_______________________________________________________ 164 Mesa 12 ÁCIDO vs BASE
______________________________________________________________________ 180 Tabla 13 Tabla de inventario de regulación de muestra
______________________________________________________ 246 Tabla 14 Ejemplo de cuadrícula de asignación de roles
_________________________________________________________ 250 Tabla 15 Niveles de control para documentos según ANSI-859
_____________________________________________ 327
Tabla 16 Muestra de medidas de auditoría _______________________________________________________________ 329 Tabla 17 Lista de referencia simple
________________________________________________________________ 353 Tabla 18 Lista de referencia simple ampliada
________________________________________________________ 354 Tabla 19 Lista de referencias cruzadas
_________________________________________________________________ 354 Tabla 20 Multi-idioma
Lista de referencia _________________________________________________________ 354 Tabla 21 UNSPSC (Clasificación estándar universal de productos y
servicios) ______________________________ 355 Tabla 22 NAICS (Sistema de clasificación industrial de América del Norte)
_______________________________________ 355 Tabla 23 Atributos de metadatos de datos de referencia críticos
_______________________________________________ 357 Tabla 24 Datos de origen recibidos por el sistema MDM
_______________________________________________ 361 Tabla 25 Datos de entrada enriquecidos y estandarizados
___________________________________________________ 362 Tabla 26 Identificación de candidatos y resolución de identidad
____________________________________________ 364 Mesa 27 Autobús DW Matriz Ejemplo
______________________________________________________________ 389 Tabla 28 Comparación de técnicas de los CDC
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
___________________________________________________________ 393 Tabla 29 Dimensiones comunes de la calidad de los datos
_____________________________________________________ 458 Mesa 30 DQ Métrico Ejemplos de
_________________________________________________________________ 480 Tabla 31 Técnicas de monitoreo de la calidad de los datos
_____________________________________________________ 481 Tabla 32 Progresión analítica
________________________________________________________________ 501 Tabla 33 Riesgos y mitigaciones típicos para un DMMA
_________________________________________________ 547 Tabla 34 Fases de transición de Bridges
____________________________________________________________ 575 Tabla 35 Escenarios de complacencia
_______________________________________________________________ 578 Tabla 36 Escenarios de declaración de victoria demasiado pronto
____________________________________________________ 581 Cuadro 37 Categorías de difusión de innovaciones adaptadas a la gestión de la información
_________________________ 600 Cuadro 38 Las etapas de adopción (Adaptado de Rogers, 1964) ________________________________________ 602
Tabla 39 Elementos del plan de comunicación _________________________________________________________ 608
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
Prefacio
Cuerpo de conocimientos (DAMA-DMBOK2). Desde la publicación de la primera edición en 2009, importantes
International se complace en publicar la segunda edición de la Guía DAMA para la gestión de datos que han tenido lugar en el campo de
la gestión de datos. La gobernanza de datos se ha convertido en un estándar
estructura en muchas organizaciones, las nuevas tecnologías han permitido la recopilación y el uso de 'Big Data' (datos semiestructurados y no estructurados en una
amplia gama de formatos), y la importancia de la ética de los datos ha crecido junto con nuestra capacidad para explorar y explotar la gran cantidad de datos e
información producidos como parte de nuestra vida diaria.
AMA
Estos cambios son emocionantes. También imponen nuevas y crecientes exigencias a nuestra profesión. DAMA tiene
D respondió a estos cambios reformulando el Marco de Gestión de Datos de DAMA (el DAMA
• Se han mejorado y actualizado los diagramas de contexto para todas las áreas de conocimiento.
Wheel), agregando detalles y aclaraciones, y ampliando el alcance del DMBOK:
• La Integración de Datos e Interoperabilidad se ha agregado como una nueva Área de Conocimiento para resaltar su importancia (Capítulo 8).
• La ética de los datos se ha destacado como un capítulo separado debido a la creciente necesidad de un enfoque ético para todos los aspectos de la
gestión de datos (Capítulo 2).
• El papel de la gobernanza se ha descrito tanto como una función (Capítulo 3) como en relación con cada Área de Conocimiento.
• Se ha adoptado un enfoque similar con la gestión del cambio organizacional, que se describe en el Capítulo 17 y se incorpora a los
capítulos del Área de conocimiento.
• Los nuevos capítulos sobre Big Data y ciencia de datos (Capítulo 14) y Evaluación de la madurez de la gestión de datos (Capítulo 15) ayudan a las
organizaciones a comprender hacia dónde quieren ir y les brindan las herramientas para llegar allí.
• La segunda edición también incluye un conjunto recientemente formulado de principios de administración de datos para respaldar la capacidad de las organizaciones para
administrar sus datos de manera efectiva y obtener valor de sus activos de datos (Capítulo 1).
Esperamos que el DMBOK2 sirva a los profesionales de la gestión de datos en todo el mundo como un recurso y una guía valiosos. Sin embargo, también reconocemos
que es solo un punto de partida. El verdadero avance vendrá a medida que apliquemos y aprendamos de estas ideas. DAMA existe para permitir que los miembros
aprendan continuamente, compartir ideas, tendencias, problemas y soluciones.
Sue Geuens
presidente
DAMA Internacional
Laura Sebastián-Coleman
Oficial de publicaciones
DAMA Internacional
15
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
CAPÍTULO 1
Gestión de datos
METRO les da información sobre sus clientes, productos y servicios. Puede ayudarlos a innovar y alcanzar cualquier
que pueden derivar valor continuo (Evans y Price, 2012). No se obtiene valor a partir de los datos.
en el vacío o por accidente. Requiere intención, planificación, coordinación y compromiso. Requiere gestión y liderazgo.
1. Introducción
Las organizaciones reconocen que sus datos son un activo empresarial vital. Los datos y la información pueden dar
metas estratégicas. A pesar de ese reconocimiento, pocas organizaciones gestionan activamente los datos como un activo de
Gestión de datos es el desarrollo, ejecución y supervisión de planes, políticas, programas y prácticas que entregan, controlan, protegen y mejoran el
valor de los datos y los activos de información a lo largo de sus ciclos de vida.
A Profesional de gestión de datos es cualquier persona que trabaje en cualquier faceta de la gestión de datos (desde la gestión técnica de los datos a lo largo de su ciclo de vida
hasta garantizar que los datos se utilicen y aprovechen correctamente) para cumplir los objetivos estratégicos de la organización. Los profesionales de la gestión de datos cumplen
numerosos roles, desde los más técnicos (por ejemplo, administradores de bases de datos, administradores de red, programadores) hasta negocios estratégicos (por ejemplo,
administradores de datos, estrategas de datos, directores de datos).
Las actividades de gestión de datos son muy variadas. Incluyen todo, desde la capacidad de tomar decisiones consistentes sobre cómo obtener valor estratégico de los datos
hasta la implementación técnica y el rendimiento de las bases de datos. Por lo tanto, la gestión de datos requiere habilidades tanto técnicas como no técnicas (es decir,
"comerciales"). La responsabilidad de la gestión de datos debe compartirse entre los roles empresariales y de tecnología de la información, y las personas de ambas áreas
deben poder colaborar para garantizar que una organización tenga datos de alta calidad que satisfagan sus necesidades estratégicas.
Los datos y la información no son solo activos en el sentido de que las organizaciones invierten en ellos para obtener valor futuro. Los datos y la información también son
vitales para las operaciones diarias de la mayoría de las organizaciones. Se les ha llamado la "moneda", la "sangre vital" e incluso el "nuevo petróleo" de la economía de la
información. 1 Independientemente de que una organización obtenga valor de sus análisis o no, ni siquiera puede realizar transacciones comerciales sin datos.
Para apoyar a los profesionales de la gestión de datos que llevan a cabo el trabajo, DAMA International (The Data Management Association) ha
elaborado este libro, la segunda edición de La guía de datos de DAMA
1 Google 'datos como moneda', 'datos como sangre vital' y 'el nuevo petróleo', para numerosas referencias.
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
17
GESTIÓN DE DATOS • 23
Cuerpo de conocimientos de gestión (DMBOK2). Esta edición se basa en la primera, publicada en 2009, que proporcionó conocimientos fundamentales sobre los
que construir a medida que la profesión avanzaba y maduraba.
Este capítulo describe un conjunto de principios para la gestión de datos. Analiza los desafíos relacionados con el seguimiento de esos principios y
sugiere enfoques para hacer frente a estos desafíos. El capítulo también describe el marco de gestión de datos DAMA, que proporciona el contexto para
el trabajo realizado por los profesionales de la gestión de datos dentro de varias áreas de conocimiento de gestión de datos.
1.1 Impulsores del negocio
La información y el conocimiento son la clave de la ventaja competitiva. Las organizaciones que tienen datos confiables y de alta calidad sobre sus clientes, productos,
servicios y operaciones pueden tomar mejores decisiones que aquellas sin datos o con datos no confiables. La incapacidad de administrar los datos es similar a la
incapacidad de administrar el capital. Resulta en desperdicio y pérdida de oportunidades. El principal impulsor de la gestión de datos es permitir que las organizaciones
obtengan valor de sus activos de datos, del mismo modo que la gestión eficaz de los activos financieros y físicos permite a las organizaciones obtener valor de esos activos.
1.2 Objetivos
Dentro de una organización, los objetivos de la gestión de datos incluyen:
• Comprender y respaldar las necesidades de información de la empresa y sus partes interesadas, incluidos clientes, empleados y
socios comerciales.
Capturar, almacenar, proteger y garantizar la integridad de los activos de datos Garantizar la
calidad de los datos y la información
Garantizar la privacidad y confidencialidad de los datos de las partes interesadas
Evitar el acceso, la manipulación o el uso no autorizados o inapropiados de datos e información • Asegurar que los datos se puedan usar de manera
efectiva para agregar valor a la empresa
•
•
•
•
2. Conceptos esenciales
2.1 Datos
Definiciones de larga data de datos enfatizar su papel en la representación de hechos sobre el mundo. 2 En relación con la tecnología de la información, datos también se
entiende como información que ha sido almacenada en forma digital (aunque los datos no se limitan a
2 El NewOxford American Dictionary define los datos como "hechos y estadísticas recopilados para su análisis". La Sociedad Estadounidense de Calidad (ASQ) define los datos
como “un conjunto de hechos recopilados” y describe dos tipos de datos numéricos: medidos o variables y contados o atribuidos. La Organización Internacional de Normalización
(ISO) define los datos como "reinterpretables
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
24 • DMBOK2
información que ha sido digitalizada y los principios de gestión de datos se aplican a los datos capturados en papel y en bases de datos). Aún así, debido a
que hoy podemos capturar tanta información electrónicamente, llamamos 'datos' a muchas cosas que no se habrían llamado 'datos' en épocas anteriores:
cosas como nombres, direcciones, fechas de nacimiento, lo que uno cenó el sábado, lo más reciente libro uno comprado.
Estos hechos sobre personas individuales pueden agregarse, analizarse y utilizarse para obtener ganancias, mejorar la salud o influir en las políticas públicas.
Además, nuestra capacidad tecnológica para medir una amplia gama de eventos y actividades (desde las repercusiones del Big Bang hasta nuestros propios
latidos) y para recopilar, almacenar y analizar versiones electrónicas de cosas que antes no se pensaban como datos (videos, imágenes , grabaciones de
sonido, documentos) está cerca de superar nuestra capacidad para sintetizar estos datos en información utilizable. 3 Para aprovechar la variedad de datos sin
sentirse abrumado por su volumen y velocidad, se requieren prácticas de administración de datos confiables y extensibles.
La mayoría de la gente asume que, debido a que los datos representan hechos, es una forma de verdad sobre el mundo y que los hechos encajarán. Pero los
'hechos' no siempre son simples o directos. Los datos son un medio de representación. Representa otras cosas además de sí mismo (Chisholm, 2010). Los datos
son tanto una interpretación de los objetos que representan como un objeto que debe ser interpretado (Sebastian-Coleman, 2013). Esta es otra forma de decir que
necesitamos contexto para que los datos sean significativos. Se puede pensar en el contexto como un sistema de representación de datos; tal sistema incluye un
vocabulario común y un conjunto de relaciones entre componentes. Si conocemos las convenciones de tal sistema, entonces podemos interpretar los datos que
contiene. 4 Estas convenciones a menudo se documentan en un tipo específico de datos denominados Metadatos.
Sin embargo, debido a que las personas a menudo toman decisiones diferentes sobre cómo representar conceptos, crean diferentes formas de representar los mismos
conceptos. A partir de estas opciones, los datos adquieren diferentes formas. Piense en la variedad de formas que tenemos para representar las fechas del calendario,
un concepto sobre el que existe una definición acordada. Ahora considere conceptos más complejos (como cliente o producto), donde la granularidad y el nivel de
detalle de lo que necesita ser representado no siempre es evidente, y el proceso de representación se vuelve más complejo, al igual que el proceso de gestión de esa
información. tiempo extraordinario. (Ver Capítulo 10).
Incluso dentro de una sola organización, a menudo hay varias formas de representar la misma idea. De ahí la necesidad de arquitectura de datos, modelado,
gobernanza y administración, y gestión de metadatos y calidad de datos, todo lo cual ayuda a las personas a comprender y utilizar los datos. En todas las
organizaciones, el problema de la multiplicidad se multiplica. De ahí la necesidad de estándares de datos a nivel industrial que puedan aportar más coherencia a los
datos.
Las organizaciones siempre han necesitado administrar sus datos, pero los cambios en la tecnología han ampliado el alcance de esta necesidad de administración, ya que
han cambiado la comprensión de las personas sobre qué son los datos. Estos cambios han permitido a las organizaciones utilizar los datos de nuevas formas para crear
productos, compartir información, generar conocimiento y mejorar.
representación de la información de manera formalizada adecuada para la comunicación, interpretación o procesamiento ”(ISO 11179). Esta definición enfatiza la
naturaleza electrónica de los datos y asume, correctamente, que los datos requieren estándares porque se manejan a través de sistemas de tecnología de la información.
Dicho esto, no habla de los desafíos de formalizar los datos de manera consistente, en sistemas dispares. Tampoco explica bien el concepto de datos no estructurados.
3 http://ubm.io/2c4yPOJ (Consultado 20016-12-04). http://bit.ly/1rOQkt1 (Consultado 20016-12-04).
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
GESTIÓN DE DATOS • 25
4 Para obtener información adicional sobre la estructura de los datos, consulte: Kent, Datos y realidad ( 2012) y Devlin, Falta de inteligencia empresarial ( 2013).
éxito organizacional. Pero el rápido crecimiento de la tecnología y con ella la capacidad humana para producir, capturar y extraer datos en busca de significado ha intensificado la
necesidad de administrar los datos de manera efectiva.
2.2 Datos e información
Se ha derramado mucha tinta sobre la relación entre datos e información. Los datos se han denominado "materia prima de la información" y la información se ha
denominado "datos en contexto". 3 A menudo, se utiliza una pirámide en capas para describir la relación entre los datos (en la base), la información, el
conocimiento y la sabiduría (en la parte superior). Si bien la pirámide puede ser útil para describir por qué los datos deben administrarse bien, esta
representación presenta varios desafíos para la administración de datos.
• Se basa en el supuesto de que los datos simplemente existen. Pero los datos no existen simplemente. Deben crearse datos.
• Al describir una secuencia lineal de datos a través de la sabiduría, no reconoce que se necesita conocimiento para crear datos en primer
lugar.
• Implica que los datos y la información son cosas separadas, cuando en realidad, los dos conceptos están entrelazados y dependen el uno del otro.
Los datos son una forma de información y la información es una forma de datos.
Dentro de una organización, puede resultar útil trazar una línea divisoria entre la información y los datos con el fin de comunicar claramente los requisitos y
expectativas de los diferentes usos por parte de las diferentes partes interesadas. ("Aquí hay un informe de ventas del último trimestre [información]. Se
basa en los datos de nuestro almacén de datos [datos]. El próximo trimestre estos resultados [datos] se utilizarán para generar nuestras medidas de
rendimiento trimestrales [información] ] ”). Reconocer que los datos y la información deben estar preparados para diferentes propósitos impulsa un principio
central de la gestión de datos: tanto los datos como la información deben gestionarse. Ambos serán de mayor calidad si se gestionan junto con los usos y
los requisitos del cliente. En todo el DMBOK, los términos se utilizarán indistintamente.
2.3 Los datos como activo organizativo
Un activo es un recurso económico, que se puede poseer o controlar, y que contiene o produce valor. Los activos se pueden convertir en dinero. Los datos son ampliamente
reconocidos como un activo empresarial, aunque la comprensión de lo que significa administrar los datos como un activo aún está evolucionando. A principios de la década de
1990, algunas organizaciones consideraron cuestionable si el valor de la plusvalía debería recibir un valor monetario. Ahora, el 'valor de la plusvalía' aparece comúnmente como
un elemento en el estado de pérdidas y ganancias (P&L). Del mismo modo, aunque no se ha adoptado universalmente, la monetización de datos se está volviendo cada vez más
común. No pasará mucho tiempo antes de que veamos esto como una característica de las pérdidas y ganancias. (Vea el Capítulo 3.)
Las organizaciones de hoy confían en sus activos de datos para tomar decisiones más efectivas y operar de manera más eficiente. Las empresas utilizan los
datos para comprender a sus clientes, crear nuevos productos y servicios y mejorar las operaciones
3 Ver English, 1999 y DAMA, 2009.
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
26 • DMBOK2
eficiencia mediante la reducción de costes y el control de riesgos. Las agencias gubernamentales, las instituciones educativas y las organizaciones sin fines de lucro también necesitan
datos de alta calidad para guiar sus actividades operativas, tácticas y estratégicas. A medida que las organizaciones dependen cada vez más de los datos, el valor de los activos de datos
se puede establecer con mayor claridad.
Muchas organizaciones se identifican a sí mismas como "impulsadas por datos". Las empresas que aspiran a seguir siendo competitivas deben dejar de tomar decisiones basadas en
intuiciones o instintos y, en su lugar, deben utilizar desencadenantes de eventos y aplicar análisis para obtener información procesable. Estar impulsado por los datos incluye el
reconocimiento de que los datos deben administrarse de manera eficiente y con disciplina profesional, a través de una asociación de liderazgo empresarial y experiencia técnica.
Además, el ritmo del negocio actual significa que el cambio ya no es opcional; la disrupción digital es la norma. Para reaccionar ante esto, las empresas deben crear
conjuntamente soluciones de información con profesionales de datos técnicos que trabajen junto con sus contrapartes de líneas de negocio. Deben planificar cómo
obtener y administrar los datos que saben que necesitan para respaldar la estrategia comercial. También deben posicionarse para aprovechar las oportunidades de
aprovechar los datos de nuevas formas.
2.4 Principios de gestión de datos
La gestión de datos comparte características con otras formas de gestión de activos, como se ve en la Figura 1. Implica saber qué datos tiene una organización y
qué se podría lograr con ellos, y luego determinar la mejor manera de utilizar los activos de datos para alcanzar los objetivos de la organización.
Como otros procesos de gestión, debe equilibrar las necesidades estratégicas y operativas. Este equilibrio se puede lograr mejor siguiendo un conjunto de principios
que reconocen las características destacadas de la gestión de datos y guían la práctica de la gestión de datos.
• Los datos son un activo con propiedades únicas: Los datos son un activo, pero se diferencian de otros activos en aspectos importantes que influyen en la
forma en que se gestionan. La más obvia de estas propiedades es que los datos no se consumen cuando se utilizan, al igual que los activos financieros y físicos.
• El valor de los datos puede y debe expresarse en términos económicos: Llamar a los datos un activo implica que tienen valor. Si bien existen
técnicas para medir el valor cualitativo y cuantitativo de los datos, aún no existen estándares para hacerlo. Las organizaciones que quieran tomar
mejores decisiones sobre sus datos deben desarrollar formas coherentes de cuantificar ese valor. También deben medir tanto los costos de los datos
de baja calidad como los beneficios de los datos de alta calidad.
• Gestionar datos significa gestionar la calidad de los datos: Asegurarse de que los datos sean adecuados para su propósito es un objetivo principal de la
gestión de datos. Para gestionar la calidad, las organizaciones deben asegurarse de comprender los requisitos de calidad de las partes interesadas y medir los
datos frente a estos requisitos.
• Se necesitan metadatos para administrar los datos: La gestión de cualquier activo requiere tener datos sobre ese activo (número de empleados, códigos
contables, etc.). Los datos que se utilizan para gestionar y utilizar los datos se denominan Metadatos. Debido a que los datos no se pueden guardar ni tocar, para
comprender qué son y cómo usarlos se requiere definición y conocimiento en forma de metadatos. Los metadatos se originan en una variedad de procesos
relacionados con la creación, procesamiento y
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
GESTIÓN DE DATOS • 27
y uso, incluida la arquitectura, el modelado, la administración, el gobierno, la gestión de la calidad de los datos, el desarrollo de sistemas, las operaciones
comerciales y de TI, y la analítica.
DATOS
ADMINISTRACIÓN
PRINCIPIOS
Los datos son valiosos
•
• Los datos son un activo con
propiedades únicas
da • ejército de reserva El valor de los datos puede y
Eficaz
la gestión requiere debe expresarse en
liderazgo términos económicos
compromiso
Los requisitos de gestión de datos son requisitos comerciales •
• Gestionar datos significa gestionar la calidad de los datos
• Se necesitan metadatos para administrar los datos
• Se necesita planificación para administrar los datos
• Los requisitos de gestión de datos deben impulsar las decisiones de tecnología de la información
La gestión de datos depende de diversas habilidades
•
•
La gestión de datos es multifuncional •
La gestión de datos requiere una perspectiva
empresarial
La gestión de datos debe tener en cuenta una variedad de
perspectivas
•
La gestión de datos es la gestión del ciclo de vida
•
•
Los diferentes tipos de datos tienen diferentes características de ciclo de vida La gestión de
datos incluye la gestión de los riesgos asociados con los datos
Figura 1 Principios de gestión de datos
• Se necesita planificación para administrar los datos: Incluso las organizaciones pequeñas pueden tener entornos de procesos comerciales y técnicos
complejos. Los datos se crean en muchos lugares y se mueven entre lugares para su uso. Coordinar el trabajo y mantener alineados los resultados finales
requiere una planificación desde una perspectiva arquitectónica y de procesos.
• La gestión de datos es multifuncional; Requiere una variedad de habilidades y experiencia: Un solo equipo no puede administrar todos los
datos de una organización. La gestión de datos requiere habilidades técnicas y no técnicas y la capacidad de colaborar.
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
28 • DMBOK2
• La gestión de datos requiere una perspectiva empresarial: La gestión de datos tiene aplicaciones locales, pero debe aplicarse en toda la empresa
para que sea lo más eficaz posible. Esta es una de las razones por las que la gestión de datos y el gobierno de datos están entrelazados.
• La gestión de datos debe tener en cuenta una variedad de perspectivas: Los datos son fluidos. La gestión de datos debe evolucionar constantemente para mantenerse
al día con las formas en que se crean y utilizan los datos y los consumidores de datos que los utilizan.
• La gestión de datos es la gestión del ciclo de vida: Los datos tienen un ciclo de vida y la gestión de datos requiere gestionar su ciclo de vida. Dado que los datos
generan más datos, el ciclo de vida de los datos en sí mismo puede ser muy complejo. Las prácticas de gestión de datos deben tener en cuenta el ciclo de vida de los
datos.
• Los diferentes tipos de datos tienen diferentes características de ciclo de vida: Y por esta razón, tienen diferentes requisitos de gestión. Las prácticas
de gestión de datos deben reconocer estas diferencias y ser lo suficientemente flexibles para cumplir con los diferentes tipos de requisitos del ciclo de vida de
los datos.
• La gestión de datos incluye la gestión de los riesgos asociados con los datos: Además de ser un activo, los datos también representan un riesgo para una
organización. Los datos pueden perderse, ser robados o mal utilizados. Las organizaciones deben considerar las implicaciones éticas de su uso de datos. Los riesgos
relacionados con los datos deben gestionarse como parte del ciclo de vida de los datos.
• Los requisitos de gestión de datos deben impulsar las decisiones sobre tecnología de la información: La gestión de datos y datos está profundamente
entrelazada con la tecnología de la información y la gestión de la tecnología de la información. La gestión de datos requiere un enfoque que garantice que la tecnología
atienda, en lugar de impulsar, las necesidades estratégicas de datos de una organización.
• La gestión eficaz de los datos requiere el compromiso de los líderes: La gestión de datos implica un conjunto complejo de procesos que, para
ser eficaces, requieren coordinación, colaboración y compromiso. Llegar allí requiere no solo habilidades de gestión, sino también la visión y el
propósito que provienen de un liderazgo comprometido.
2.5 Desafíos de la gestión de datos
Debido a que la gestión de datos tiene características distintas derivadas de las propiedades de los datos en sí, también presenta desafíos para seguir
estos principios. Los detalles de estos desafíos se discuten en las Secciones 2.5.1 a 2.5.13. Muchos de estos desafíos se refieren a más de un principio.
2.5.1 Los datos difieren de otros activos4
Los activos físicos se pueden señalar, tocar y mover. Pueden estar en un solo lugar a la vez. Los activos financieros deben contabilizarse en un balance. Sin
embargo, los datos son diferentes. Los datos no son tangibles. Sin embargo, es duradero; eso
4 Esta sección se deriva de Redman, Thomas. Calidad de datos para la era de la información ( 1996) págs. 41-42, 232-36; y Impulsado por datos
(2008), Capítulo Uno, "Las maravillosas y peligrosas propiedades de los datos y la información".
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
GESTIÓN DE DATOS • 29
no se desgasta, aunque el valor de los datos a menudo cambia a medida que envejecen. Los datos son fáciles de copiar y transportar. Pero no es fácil de reproducir si se
pierde o se destruye. Debido a que no se consume cuando se usa, incluso se puede robar sin que se haya ido. Los datos son dinámicos y pueden usarse para múltiples
propósitos. Los mismos datos pueden incluso ser utilizados por varias personas al mismo tiempo, algo que es imposible con activos físicos o financieros. Muchos usos de
los datos generan más datos. La mayoría de las organizaciones deben gestionar volúmenes crecientes de datos y la relación entre conjuntos de datos.
Estas diferencias dificultan la asignación de un valor monetario a los datos. Sin este valor monetario, es difícil medir cómo los datos contribuyen al éxito
organizacional. Estas diferencias también plantean otros problemas que afectan la gestión de datos, como definir la propiedad de los datos, hacer un inventario
de cuántos datos tiene una organización, protegerse contra el uso indebido de los datos, gestionar el riesgo asociado con la redundancia de datos y definir y
hacer cumplir los estándares de calidad de los datos.
A pesar de los desafíos para medir el valor de los datos, la mayoría de la gente reconoce que los datos, de hecho, tienen valor. Los datos de una organización son
únicos en sí mismos. Si se perdieran o destruyeran datos únicos de la organización (como listas de clientes, inventarios de productos o historial de reclamaciones),
reemplazarlos sería imposible o extremadamente costoso. Los datos también son el medio por el cual una organización se conoce a sí misma: es un metaactivo que
describe otros activos. Como tal, proporciona la base para el conocimiento organizacional.
Dentro de las organizaciones y entre ellas, los datos y la información son esenciales para realizar negocios. La mayoría de las transacciones comerciales operativas implican el
intercambio de información. La mayor parte de la información se intercambia electrónicamente, creando un rastro de datos. Este rastro de datos puede servir para propósitos
además de marcar los intercambios que han tenido lugar. Puede proporcionar información sobre cómo funciona una organización.
Debido al importante papel que desempeñan los datos en cualquier organización, es necesario administrarlos con cuidado.
2.5.2 Valoración de datos
Valor es la diferencia entre el costo de una cosa y el beneficio derivado de esa cosa. Para algunos activos, como las acciones, calcular el valor es
fácil. Es la diferencia entre lo que costaba la acción cuando se compró y para qué se vendió. Pero para los datos, estos cálculos son más
complicados, porque ni los costos ni los beneficios de los datos están estandarizados.
Dado que los datos de cada organización son únicos en sí mismos, un enfoque para la valoración de datos debe comenzar articulando categorías generales de costos y beneficios que se
pueden aplicar de manera consistente dentro de una organización. Las categorías de muestra incluyen 5:
•
•
•
•
•
Costo de obtener y almacenar datos Costo de
reemplazar los datos si se perdieran
Impacto en la organización si faltaran datos
Costo de la mitigación de riesgos y costo potencial de los riesgos asociados con los datos Costo de mejorar
los datos
5 Mientras el DMBOK2 se preparaba para ir a imprenta, otra forma de valorar los datos apareció en las noticias: el ataque de ransomware Wannacry (17 de mayo de 2017) afectó a más de
100.000 organizaciones en 150 países. Los culpables utilizaron el software para mantener los datos como rehenes hasta que las víctimas pagaran un rescate para que sus datos fueran
divulgados. http://bit.ly/2tNoyQ7.
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
30 • DMBOK2
•
•
•
•
Beneficios de los datos de mayor calidad
Qué pagarían los competidores por los datos Por qué
se podrían vender los datos
Ingresos esperados de usos innovadores de datos
Un desafío principal para la valoración de activos de datos es que el valor de los datos es contextual (lo que es valioso para una organización puede no serlo para otra)
y, a menudo, temporal (lo que era valioso ayer puede no serlo hoy). Dicho esto, dentro de una organización, es probable que ciertos tipos de datos sean
consistentemente valiosos a lo largo del tiempo. Tomemos, por ejemplo, información confiable del cliente. La información del cliente puede incluso volverse más valiosa
con el tiempo, a medida que se acumulan más datos relacionados con la actividad del cliente.
En relación con la gestión de datos, es fundamental establecer formas de asociar el valor financiero con los datos, ya que las organizaciones necesitan comprender los
activos en términos financieros para poder tomar decisiones consistentes. Poner valor en los datos se convierte en la base para poner valor en las actividades de gestión de
datos. 6 El proceso de valoración de datos también se puede utilizar como medio de gestión de cambios. Pedir a los profesionales de la gestión de datos y a las partes
interesadas a las que apoyan que comprendan el significado financiero de su trabajo puede ayudar a una organización a transformar su comprensión de sus propios datos
y, a través de eso, su enfoque de la gestión de datos.
2.5.3 Calidad de los datos
Asegurarse de que los datos sean de alta calidad es fundamental para la gestión de datos. Las organizaciones administran sus datos porque quieren usarlos. Si no pueden confiar en él para
satisfacer las necesidades comerciales, entonces el esfuerzo de recopilarlo, almacenarlo, protegerlo y permitir el acceso a él se desperdicia. Para garantizar que los datos satisfagan las
necesidades comerciales, deben trabajar con los consumidores de datos para definir estas necesidades, incluidas las características que hacen que los datos sean de alta calidad.
En gran parte porque los datos se han asociado tan estrechamente con la tecnología de la información, la gestión de la calidad de los datos se ha tratado históricamente
como una ocurrencia tardía. Los equipos de TI suelen despreciar los datos que se supone que deben almacenar los sistemas que crean. Probablemente fue un programador
quien primero observó 'basura adentro, basura afuera' - y quien sin duda quiso dejarlo así. Pero las personas que quieren utilizar los datos no pueden permitirse el lujo de
despreciar la calidad. Por lo general, asumen que los datos son confiables y dignos de confianza, hasta que tienen una razón para dudar de estas cosas. Una vez que
pierden la confianza, es difícil recuperarla.
La mayoría de los usos de los datos implican aprender de ellos para aplicar ese aprendizaje y crear valor. Los ejemplos incluyen comprender los hábitos de los
clientes para mejorar un producto o servicio y evaluar el desempeño organizacional o las tendencias del mercado para desarrollar una mejor estrategia
comercial, etc. Los datos de mala calidad tendrán un impacto negativo en estas decisiones.
Igual de importante, los datos de mala calidad son simplemente costosos para cualquier organización. Las estimaciones difieren, pero los expertos creen que las organizaciones gastan entre el
10 y el 30% de los ingresos en el manejo de problemas de calidad de datos. IBM calculó el costo de los datos de mala calidad en el
6 Para obtener estudios de casos y ejemplos, consulte Aiken y Billings, Monetización de la gestión de datos ( 2014).
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
GESTIÓN DE DATOS • 31
Estados Unidos en 2016 fue de $ 3,1 billones. 7 Muchos de los costos de los datos de mala calidad están ocultos, son indirectos y, por lo tanto, difíciles de medir. Otros, como las
multas, son directos y fáciles de calcular. Los costos provienen de:
•
•
Desecho y reelaboración
Soluciones provisionales y procesos de corrección ocultos
•
•
•
•
•
•
•
Ineficiencias organizativas o baja productividad Conflicto
organizativo
Baja satisfacción laboral
Insatisfacción del cliente
Costos de oportunidad, incluida la incapacidad de innovar Costos de
cumplimiento o multas
Costos de reputación
Los beneficios correspondientes de los datos de alta calidad incluyen:
•
•
•
•
•
•
Experiencia de cliente mejorada
Mayor productividad
Riesgo reducido
Capacidad para actuar sobre las oportunidades
Aumento de los ingresos
Ventaja competitiva obtenida a partir de conocimientos sobre clientes, productos, procesos y oportunidades.
Como implican estos costos y beneficios, la gestión de la calidad de los datos no es un trabajo de una sola vez. La producción de datos de alta calidad requiere planificación, compromiso
y una mentalidad que incorpore la calidad a los procesos y sistemas. Todas las funciones de gestión de datos pueden influir en la calidad de los datos, para bien o para mal, por lo que
todas deben tenerlo en cuenta a medida que ejecutan su trabajo. (Ver Capítulo 13).
2.5.4 Planificación para obtener mejores datos
Como se indicó en la introducción del capítulo, la obtención de valor a partir de los datos no ocurre por accidente. Requiere planificación de muchas formas. Comienza
con el reconocimiento de que las organizaciones pueden controlar cómo obtienen y crean datos. Si ven los datos como un producto que crean, tomarán mejores
decisiones al respecto a lo largo de su ciclo de vida. Estas decisiones requieren un pensamiento sistémico porque involucran:
•
•
•
•
Las formas en que los datos conectan los procesos comerciales que de otro modo podrían verse como separados La
relación entre los procesos comerciales y la tecnología que los respalda El diseño y la arquitectura de los sistemas y los
datos que producen y almacenan Las formas en que los datos podrían usarse para promover la estrategia organizacional
7 Reportado en Redman, Thomas. "Los datos incorrectos cuestan 3 billones de dólares al año". Harvard Business Review. 22 de septiembre de 2016.
https://hbr.org/2016/09/bad-data-costs-the-us-3-trillion-per-year.
Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2
Guía de gestión de datos (DMBOK2

Más contenido relacionado

La actualidad más candente

Reseña del Libro "Data Stewardship" de David Plotkin
Reseña del Libro "Data Stewardship" de David PlotkinReseña del Libro "Data Stewardship" de David Plotkin
Reseña del Libro "Data Stewardship" de David PlotkinRamón Hernández
 
Gobernabilidad De Datos
Gobernabilidad De Datos Gobernabilidad De Datos
Gobernabilidad De Datos Leydi Vargas
 
Reseña del libro "Disrupting Data Governance. A Call to Action"
Reseña del libro "Disrupting Data Governance. A Call to Action"Reseña del libro "Disrupting Data Governance. A Call to Action"
Reseña del libro "Disrupting Data Governance. A Call to Action"Ramón Hernández
 
Empresas que utilizan itil en mexico
Empresas que utilizan itil en mexicoEmpresas que utilizan itil en mexico
Empresas que utilizan itil en mexicoRazmli Rdz A
 
CDMP preparation workshop EDW2016
CDMP preparation workshop EDW2016CDMP preparation workshop EDW2016
CDMP preparation workshop EDW2016Christopher Bradley
 
Data Governance_Notes.pptx
Data Governance_Notes.pptxData Governance_Notes.pptx
Data Governance_Notes.pptxVivekDubley
 
The Chief Data Officer Agenda: Metrics for Information and Data Management
The Chief Data Officer Agenda: Metrics for Information and Data ManagementThe Chief Data Officer Agenda: Metrics for Information and Data Management
The Chief Data Officer Agenda: Metrics for Information and Data ManagementDATAVERSITY
 
Reference master data management
Reference master data managementReference master data management
Reference master data managementDr. Hamdan Al-Sabri
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Data Governance Best Practices
Data Governance Best PracticesData Governance Best Practices
Data Governance Best PracticesBoris Otto
 
Review of Data Management Maturity Models
Review of Data Management Maturity ModelsReview of Data Management Maturity Models
Review of Data Management Maturity ModelsAlan McSweeney
 
How to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityHow to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityDATAVERSITY
 
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...Christopher Bradley
 
A Comparative Study of Data Management Maturity Models
A Comparative Study of Data Management Maturity ModelsA Comparative Study of Data Management Maturity Models
A Comparative Study of Data Management Maturity ModelsData Crossroads
 
Implementing the Data Maturity Model (DMM)
Implementing the Data Maturity Model (DMM)Implementing the Data Maturity Model (DMM)
Implementing the Data Maturity Model (DMM)DATAVERSITY
 
Infraestructura de TI y Tecnologías Emergentes
Infraestructura de TI y Tecnologías EmergentesInfraestructura de TI y Tecnologías Emergentes
Infraestructura de TI y Tecnologías EmergentesAbel Bryan Iñamagua Paz
 
Capability Model_Data Governance
Capability Model_Data GovernanceCapability Model_Data Governance
Capability Model_Data GovernanceSteve Novak
 
CDMP SLIDE TRAINER .pptx
CDMP SLIDE TRAINER .pptxCDMP SLIDE TRAINER .pptx
CDMP SLIDE TRAINER .pptxssuser65981b
 
Seguridad en Base de Datos
Seguridad en Base de DatosSeguridad en Base de Datos
Seguridad en Base de Datosmyriam sarango
 

La actualidad más candente (20)

Reseña del Libro "Data Stewardship" de David Plotkin
Reseña del Libro "Data Stewardship" de David PlotkinReseña del Libro "Data Stewardship" de David Plotkin
Reseña del Libro "Data Stewardship" de David Plotkin
 
Gobernabilidad De Datos
Gobernabilidad De Datos Gobernabilidad De Datos
Gobernabilidad De Datos
 
Reseña del libro "Disrupting Data Governance. A Call to Action"
Reseña del libro "Disrupting Data Governance. A Call to Action"Reseña del libro "Disrupting Data Governance. A Call to Action"
Reseña del libro "Disrupting Data Governance. A Call to Action"
 
Empresas que utilizan itil en mexico
Empresas que utilizan itil en mexicoEmpresas que utilizan itil en mexico
Empresas que utilizan itil en mexico
 
CDMP preparation workshop EDW2016
CDMP preparation workshop EDW2016CDMP preparation workshop EDW2016
CDMP preparation workshop EDW2016
 
Data Governance_Notes.pptx
Data Governance_Notes.pptxData Governance_Notes.pptx
Data Governance_Notes.pptx
 
The Chief Data Officer Agenda: Metrics for Information and Data Management
The Chief Data Officer Agenda: Metrics for Information and Data ManagementThe Chief Data Officer Agenda: Metrics for Information and Data Management
The Chief Data Officer Agenda: Metrics for Information and Data Management
 
Reference master data management
Reference master data managementReference master data management
Reference master data management
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Data Governance Best Practices
Data Governance Best PracticesData Governance Best Practices
Data Governance Best Practices
 
Review of Data Management Maturity Models
Review of Data Management Maturity ModelsReview of Data Management Maturity Models
Review of Data Management Maturity Models
 
How to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityHow to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data Quality
 
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
DMBOK 2.0 and other frameworks including TOGAF & COBIT - keynote from DAMA Au...
 
A Comparative Study of Data Management Maturity Models
A Comparative Study of Data Management Maturity ModelsA Comparative Study of Data Management Maturity Models
A Comparative Study of Data Management Maturity Models
 
Implementing the Data Maturity Model (DMM)
Implementing the Data Maturity Model (DMM)Implementing the Data Maturity Model (DMM)
Implementing the Data Maturity Model (DMM)
 
Infraestructura de TI y Tecnologías Emergentes
Infraestructura de TI y Tecnologías EmergentesInfraestructura de TI y Tecnologías Emergentes
Infraestructura de TI y Tecnologías Emergentes
 
Capability Model_Data Governance
Capability Model_Data GovernanceCapability Model_Data Governance
Capability Model_Data Governance
 
CDMP SLIDE TRAINER .pptx
CDMP SLIDE TRAINER .pptxCDMP SLIDE TRAINER .pptx
CDMP SLIDE TRAINER .pptx
 
Seguridad en Base de Datos
Seguridad en Base de DatosSeguridad en Base de Datos
Seguridad en Base de Datos
 
Formando Un Departamento De Ti Enfocado A ITIL
Formando Un Departamento De Ti Enfocado A ITILFormando Un Departamento De Ti Enfocado A ITIL
Formando Un Departamento De Ti Enfocado A ITIL
 

Similar a Guía de gestión de datos (DMBOK2

Encuesta corregida sena 2
Encuesta corregida sena 2Encuesta corregida sena 2
Encuesta corregida sena 2notsaw herrera
 
Sistema de informacion_de_mercadotecnia
Sistema de informacion_de_mercadotecniaSistema de informacion_de_mercadotecnia
Sistema de informacion_de_mercadotecniaCLAUDIARIOSDELGADO
 
Sistemas de Informacion en el Ambiente Interno
Sistemas de Informacion en el Ambiente InternoSistemas de Informacion en el Ambiente Interno
Sistemas de Informacion en el Ambiente InternoVíctor Mqz
 
Activity 1 2 data production - sampling
Activity 1 2 data production - samplingActivity 1 2 data production - sampling
Activity 1 2 data production - samplingEdgar Mata
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big DataGrupo DIRCOM
 
Informe de prácticas módulo I
Informe de prácticas módulo IInforme de prácticas módulo I
Informe de prácticas módulo Ijmoralesrim
 
Alexis nicolas saucedo_ramirez_unidad ii
Alexis nicolas saucedo_ramirez_unidad iiAlexis nicolas saucedo_ramirez_unidad ii
Alexis nicolas saucedo_ramirez_unidad iialexis saucedo ramirez
 
Informe nacional honduras sanidad e inocuidad pecuaria
Informe nacional   honduras sanidad e inocuidad pecuariaInforme nacional   honduras sanidad e inocuidad pecuaria
Informe nacional honduras sanidad e inocuidad pecuariaGerman Perez Destephen
 
Proyecto integrador procesos empresariales noche
Proyecto integrador procesos empresariales nocheProyecto integrador procesos empresariales noche
Proyecto integrador procesos empresariales nocheKAREN SALCEDO
 
Análisis de Minería de Datos y Machine Learning en Marketing Digital
Análisis de Minería de Datos y Machine Learning en Marketing DigitalAnálisis de Minería de Datos y Machine Learning en Marketing Digital
Análisis de Minería de Datos y Machine Learning en Marketing DigitalPedro Arcos Méndez
 
Actividad de aprendizaje 8
Actividad de aprendizaje 8Actividad de aprendizaje 8
Actividad de aprendizaje 8MaxQD
 
Nt 2017 c1-actividad 9_ sinastra
Nt 2017 c1-actividad 9_ sinastraNt 2017 c1-actividad 9_ sinastra
Nt 2017 c1-actividad 9_ sinastraDaanaa Sinastra
 
Analitica web para la Empresa
Analitica web para la EmpresaAnalitica web para la Empresa
Analitica web para la EmpresaAlvaro Alfonso
 

Similar a Guía de gestión de datos (DMBOK2 (20)

Comunicación
ComunicaciónComunicación
Comunicación
 
Encuesta corregida sena 2
Encuesta corregida sena 2Encuesta corregida sena 2
Encuesta corregida sena 2
 
Sistema de informacion_de_mercadotecnia
Sistema de informacion_de_mercadotecniaSistema de informacion_de_mercadotecnia
Sistema de informacion_de_mercadotecnia
 
Sistemas de Informacion en el Ambiente Interno
Sistemas de Informacion en el Ambiente InternoSistemas de Informacion en el Ambiente Interno
Sistemas de Informacion en el Ambiente Interno
 
Activity 1 2 data production - sampling
Activity 1 2 data production - samplingActivity 1 2 data production - sampling
Activity 1 2 data production - sampling
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big Data
 
Informe de prácticas módulo I
Informe de prácticas módulo IInforme de prácticas módulo I
Informe de prácticas módulo I
 
Informe de practicas mòdulo I
Informe de practicas mòdulo IInforme de practicas mòdulo I
Informe de practicas mòdulo I
 
Informe de prácticas módulo I
Informe de prácticas módulo IInforme de prácticas módulo I
Informe de prácticas módulo I
 
Belleza 2
Belleza 2Belleza 2
Belleza 2
 
Alexis nicolas saucedo_ramirez_unidad ii
Alexis nicolas saucedo_ramirez_unidad iiAlexis nicolas saucedo_ramirez_unidad ii
Alexis nicolas saucedo_ramirez_unidad ii
 
Informe nacional honduras sanidad e inocuidad pecuaria
Informe nacional   honduras sanidad e inocuidad pecuariaInforme nacional   honduras sanidad e inocuidad pecuaria
Informe nacional honduras sanidad e inocuidad pecuaria
 
Proyecto integrador procesos empresariales noche
Proyecto integrador procesos empresariales nocheProyecto integrador procesos empresariales noche
Proyecto integrador procesos empresariales noche
 
Análisis de Minería de Datos y Machine Learning en Marketing Digital
Análisis de Minería de Datos y Machine Learning en Marketing DigitalAnálisis de Minería de Datos y Machine Learning en Marketing Digital
Análisis de Minería de Datos y Machine Learning en Marketing Digital
 
Actividad de aprendizaje 8
Actividad de aprendizaje 8Actividad de aprendizaje 8
Actividad de aprendizaje 8
 
Nt 2017 c1-actividad 9_ sinastra
Nt 2017 c1-actividad 9_ sinastraNt 2017 c1-actividad 9_ sinastra
Nt 2017 c1-actividad 9_ sinastra
 
Analitica web para la Empresa
Analitica web para la EmpresaAnalitica web para la Empresa
Analitica web para la Empresa
 
Cuestionario Auditoría y consultoría administrativa
Cuestionario Auditoría y consultoría administrativa Cuestionario Auditoría y consultoría administrativa
Cuestionario Auditoría y consultoría administrativa
 
cuestionario de una auditoria administrativa
cuestionario de una auditoria administrativa cuestionario de una auditoria administrativa
cuestionario de una auditoria administrativa
 
Primer Informe Proyecto Base I
Primer Informe Proyecto Base IPrimer Informe Proyecto Base I
Primer Informe Proyecto Base I
 

Último

2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfResolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADOJosé Luis Palma
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfMaryRotonda1
 
Herramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdfHerramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdfMARIAPAULAMAHECHAMOR
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxPryhaSalam
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosCesarFernandez937857
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleJonathanCovena1
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 

Último (20)

2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.Defendamos la verdad. La defensa es importante.
Defendamos la verdad. La defensa es importante.
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdfResolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
Resolucion de Problemas en Educacion Inicial 5 años ED-2024 Ccesa007.pdf
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdf
 
Herramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdfHerramientas de Inteligencia Artificial.pdf
Herramientas de Inteligencia Artificial.pdf
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos Básicos
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo Sostenible
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 

Guía de gestión de datos (DMBOK2

  • 1. Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 2. DAMA-DMBOK ÓRGANO DE CONOCIMIENTO DE GESTIÓN DE DATOS SEGUNDO EDICIÓN DAMA Internacional Publicaciones técnicas BASKING R IDGE, NUEVA JERSEY Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 3. Dedicado a la memoria de Patricia Cupoli, MLS, MBA, CCP, CDMP (25 de mayo de 1948-28 de julio de 2015) por su compromiso de por vida con la profesión de gestión de datos y sus contribuciones a esta publicación. Publicado por: 2 Lindsley Road Basking Ridge, Nueva Jersey 07920 EE. UU. https://www.TechnicsPub.com Editor en jefe: Editor: Editor de producción: Investigador de bibliografía: Administrador de herramientas de colaboración: Deborah Henderson, CDMP Susan Earley, CDMP Laura Sebastian-Coleman, CDMP, IQCP Elena Sykora, DGSP Eva Smith, CDMP Diseño de portada de Lorena Molinari Reservados todos los derechos. Ninguna parte de este libro puede ser reproducida o transmitida en cualquier forma o por cualquier medio, electrónico o mecánico, incluyendo fotocopias, grabaciones o por cualquier sistema de almacenamiento y recuperación de información, sin el permiso por escrito del editor, excepto por la inclusión de breves citas en una revisión. El autor y el editor se han ocupado de la preparación de este libro, pero no ofrecen garantía expresa o implícita de ningún tipo y no asumen ninguna responsabilidad por errores u omisiones. No se asume ninguna responsabilidad por daños incidentales o consecuentes en relación con o que surjan del uso de la información o los programas contenidos en este documento. Todos los nombres comerciales y de productos son marcas comerciales, marcas comerciales registradas o marcas de servicio de sus respectivas empresas y son propiedad de sus respectivos titulares y deben tratarse como tales. Segunda edicion Primera impresión 2017 Copyright © 2017 DAMA Internacional ISBN, edición impresa. ISBN, PDF ed. ISBN, servidor ed. Enterprise ed. 9781634622349 9781634622363 9781634622486 ISBN, 9781634622479 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 4. Número de control de la Biblioteca del Congreso: 2017941854 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018 Contenido Prefacio _________________________________________________________ 15 Capítulo 1: Gestión de datos _______________________________________ 17 1. Introducción ____________________________________________________________ 17 2. Conceptos esenciales _______________________________________________________ 18 2.1 Datos ______________________________________________________________________ 18 2.2 Datos e información ________________________________________________________ 20 2.3 Los datos como activo organizativo _______________________________________________ 20 2.4 Principios de gestión de datos __________________________________________________ 21 2.5 Desafíos de la gestión de datos _________________________________________________ 23 2.6 Estrategia de gestión de datos ___________________________________________________ 31 3. Marcos de gestión de datos ____________________________________________ 33 3.1 Modelo de alineación estratégica ____________________________________________________ 33 3.2 El modelo de información de Amsterdam ____________________________________________ 34 3.3 El marco DAMA-DMBOK _______________________________________________ 35 3.4 Pirámide DMBOK (Aiken) _____________________________________________________ 39 3.5 Marco de gestión de datos de DAMA evolucionado ___________________________________ 40 4. DAMA y el DMBOK ___________________________________________________ 43 5. Trabajos citados / recomendados ______________________________________________ 46 Capítulo 2: Ética en el manejo de datos ____________________________________ 49 1. Introducción ____________________________________________________________ 49 2. Impulsores comerciales ________________________________________________________ 51 3. Conceptos esenciales _______________________________________________________ 52 3.1 Principios éticos para los datos ____________________________________________________ 52 3.2 Principios detrás de la ley de privacidad de datos ____________________________________________ 53 3.3 Datos en línea en un contexto ético ______________________________________________ 56 3.4 Riesgos de prácticas de manejo de datos poco éticas ______________________________________ 56 3,5 Estableciendo un Ético Datos Cultura ____________________________________________ 60 3.6 Gobernanza y ética de los datos __________________________________________________ 64 4. Obras citadas / recomendadas ______________________________________________ sesenta y cinco Capítulo 3: Gobierno de datos ________________________________________ 67 1. Introducción ____________________________________________________________ 67
  • 5. 1.1 Impulsores comerciales ____________________________________________________________ 70 1.2 Metas y principios _________________________________________________________ 71 1.3 Conceptos esenciales __________________________________________________________ 72 2. Actividades _______________________________________________________________ 79 2.1 Definir la gobernanza de datos para la organización ____________________________________ 79 2.2 Realizar evaluación de preparación _______________________________________________ 79 2.3 Realizar descubrimiento y alineación empresarial _____________________________________ 80 2.4 Desarrollar puntos de contacto organizacionales ___________________________________________ 81 2.5 Desarrollar una estrategia de gobernanza de datos _____________________________________________ 82 2.6 Definir el marco operativo de la DG ___________________________________________ 82 2,7 Desarrollar Objetivos, Principios y Políticas __________________________________________ 83 2.8 Suscribir proyectos de gestión de datos _________________________________________ 84 2.9 Implicar la gestión del cambio __________________________________________________ 85 1 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 6. 2 • DMBOK2 2.10 Participar en la gestión de problemas ________________________________________________ 86 2.11 Evaluar los requisitos de cumplimiento normativo ___________________________________ 87 2.12 Implementar la gobernanza de datos _________________________________________________ 88 2.13 Estándares y procedimientos de datos del patrocinador _______________________________________ 88 2.14 Desarrollar a Negocio Glosario _________________________________________________ 90 2.15 Coordinar con grupos de arquitectura _________________________________________ 90 2.16 Valoración de activos de datos del patrocinador ________________________________________________ 91 2.17 Gobernanza de datos incorporados ____________________________________________________ 91 3. Herramientas y técnicas____________________________________________________ 92 3.1 Presencia en línea / Sitios web ___________________________________________________ 92 3.2 Glosario empresarial ___________________________________________________________ 92 3.3 Herramientas de flujo de trabajo ____________________________________________________________ 93 3.4 Documento administración Herramientas _________________________________________________ 93 3.5 Cuadros de mando de la gobernanza de datos __________________________________________________ 93 4. Directrices de implementación _______________________________________________ 93 4.1 Organización y cultura _____________________________________________________ 93 4.2 Ajuste y comunicación ______________________________________________ 94 5. Métricas ________________________________________________________________ 94 6. Obras citadas / recomendadas _____________________________________________ 95 Capítulo 4: Arquitectura de datos _______________________________________ 97 1. Introducción ___________________________________________________________ 97 1.1 Impulsores comerciales ____________________________________________________________ 99 1.2 Resultados y prácticas de la arquitectura de datos _____________________________________ 100 1.3 Conceptos esenciales _________________________________________________________ 101 2. Actividades _____________________________________________________________ 109 2.1 Establecer la práctica de arquitectura de datos __________________________________________ 110 2.2 Integrar con la arquitectura empresarial ________________________________________ 115 3. Herramientas ________________________________________________________________ 115 3.1 Herramientas de modelado de datos________________________________________________________ 115 3.2 Software de gestión de activos _________________________________________________ 115 3.3 Aplicaciones de diseño gráfico _______________________________________________ 115 4. Técnicas ___________________________________________________________ 116 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 7. CONTENIDO • 3 4.1 Proyecciones del ciclo de vida _______________________________________________________ 116 4.2 Diagramación de claridad _______________________________________________________ 116 5. Directrices de implementación ______________________________________________ 117 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 118 5.2 Organización y cambio cultural ____________________________________________ 119 6. Gobierno de la arquitectura de datos ___________________________________________ 119 6.1 Métricas ___________________________________________________________________ 120 7. Trabajos Citado / Recomendado ____________________________________________ 120 Capítulo 5: Modelado y diseño de datos _______________________________ 123 1. Introducción __________________________________________________________ 123 1.1 Impulsores comerciales ___________________________________________________________ 125 ________________________________________________________ 125 1.3 Conceptos esenciales _________________________________________________________ 126 1.2 Objetivos y Principios 2. Actividades _____________________________________________________________ 152 2.1 Plan de modelado de datos ______________________________________________________ 152 2.2 Construya el modelo de datos _______________________________________________________ 153 2.3 Revisar los modelos de datos _____________________________________________________ 158 2.4 Mantener los modelos de datos ___________________________________________________ 159 3. Herramientas _________________________________________________________________ 159 3.1 Herramientas de modelado de datos ________________________________________________________ 159 3.2 Herramientas de linaje _____________________________________________________________ 159 3.3 Herramientas de creación de perfiles de datos ________________________________________________________ 160 3.4 Repositorios de metadatos ______________________________________________________ 160 3.5 Patrones del modelo de datos ________________________________________________________ 160 3.6 Modelos de datos de la industria _______________________________________________________ 160 4. Mejores prácticas __________________________________________________________ 161 4.1 Mejores prácticas en las convenciones de nomenclatura _________________________________________ 161 4.2 Mejores prácticas en el diseño de bases de datos _____________________________________________ 161 5. Gobierno del modelo de datos _________________________________________________ 162 5.1 Modelo de datos y gestión de la calidad del diseño ___________________________________ 162 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 8. 4 • DMBOK2 5.2 Métricas de modelado de datos ______________________________________________________ 164 6. Obras citadas / recomendadas _____________________________________________ 166 Capítulo 6: Almacenamiento de datos y operaciones _____________________________ 169 1. Introducción ___________________________________________________________ 169 1.1 Impulsores comerciales ___________________________________________________________ 171 1.2 Metas y principios ________________________________________________________ 171 1.3 Conceptos esenciales _________________________________________________________ 172 2. Actividades ______________________________________________________________ 193 2.1 Gestionar la tecnología de la base de datos ________________________________________________ 194 2.2 Administrar bases de datos _________________________________________________________ 196 3. Herramientas _________________________________________________________________ 209 3.1 Herramientas de modelado de datos ________________________________________________________ 209 __________________________________________________ 209 3.3 Herramientas de administración de bases de datos _________________________________________________ 209 3.4 Herramientas de soporte para desarrolladores ____________________________________________________ 209 3.2 Base de datos Supervisión Herramientas 4. Técnicas ____________________________________________________________ 210 4.1 Prueba en entornos inferiores _________________________________________________ 210 4.2 Estándares de denominación física __________________________________________________ 210 4.3 Uso de scripts para todos los cambios _________________________________________________ 210 5. Directrices de implementación _______________________________________________ 210 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 210 5.2 Organización y cambio cultural ____________________________________________ 211 6. Almacenamiento de datos y gobernanza de operaciones ___________________________________ 212 6.1 Métricas ___________________________________________________________________ 212 __________________________________________________ 213 6.2 Información Activo Seguimiento Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 9. CONTENIDO • 5 6.3 Auditorías de datos y validación de datos ______________________________________________ 213 7. Trabajos citados / recomendados _____________________________________________ 214 Capítulo 7: Seguridad de los datos __________________________________________ 217 1. Introducción ___________________________________________________________ 217 1.1 Impulsores comerciales ___________________________________________________________ 220 1.2 Metas y principios ________________________________________________________ 222 1.3 Conceptos esenciales _________________________________________________________ 223 2. Actividades _____________________________________________________________ 245 2.1 Identificar los requisitos de seguridad de los datos __________________________________________ 245 2.2 Definir la política de seguridad de datos __________________________________________________ 247 2.3 Definir estándares de seguridad de datos _______________________________________________ 248 3. Herramientas ________________________________________________________________ 256 3.1 Software antivirus / Software de seguridad _______________________________________ 256 3.2 HTTPS ___________________________________________________________________ 256 3.3 Tecnología de gestión de identidad ____________________________________________ 257 3.4 Software de detección y prevención de intrusiones ___________________________________ 257 3.5 Cortafuegos (prevención) ______________________________________________________ 257 3.6 Seguimiento de metadatos _________________________________________________________ 257 3.7 Enmascaramiento / cifrado de datos ___________________________________________________ 258 4. Técnicas ___________________________________________________________ 258 4.1 Uso de CRUDMatrix ________________________________________________________ 258 4.2 Implementación inmediata del parche de seguridad ________________________________________ 258 4.3 Atributos de seguridad de datos en metadatos __________________________________________ 258 4.4 Métricas ___________________________________________________________________ 259 4.5 Necesidades de seguridad en los requisitos del proyecto _______________________________________ 261 4.6 Búsqueda eficiente de datos cifrados ____________________________________________ 262 4.7 Desinfección de documentos ______________________________________________________ 262 5. Directrices de implementación ______________________________________________ 262 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 262 5.2 Organización y cambio cultural ____________________________________________ 263 5.3 Visibilidad de la titularidad de los datos del usuario __________________________________________ 263 5.4 Seguridad de los datos en un mundo subcontratado _________________________________________ 264 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 10. 6 • DMBOK2 5.5 Seguridad de datos en entornos de nube __________________________________________ 265 6. Gobierno de la seguridad de los datos _______________________________________________ 265 6.1 Seguridad de datos y arquitectura empresarial _____________________________________ 265 7. Trabajos Citado / Recomendado ____________________________________________ 266 Capítulo 8: Integración e interoperabilidad de datos ______________________ 269 1. Introducción __________________________________________________________ 269 1.1 Impulsores comerciales ___________________________________________________________ 270 1.2 Metas y principios ________________________________________________________ 272 1.3 Conceptos esenciales _________________________________________________________ 273 2. Actividades de integración de datos _______________________________________________ 286 2.1 Planificar y analizar __________________________________________________________ 286 2.2 Diseño de soluciones de integración de datos ____________________________________________ 289 2.3 Desarrollar soluciones de integración de datos ___________________________________________ 291 2.4 Implementar y monitorear _____________________________________________________ 293 3. Herramientas ________________________________________________________________ 294 3.1 Motor de transformación de datos / Herramienta ETL ________________________________________ 294 3.2 Servidor de virtualización de datos ___________________________________________________ 294 3.3 Enterprise Service Bus ______________________________________________________ 294 3.4 Motor de reglas comerciales ______________________________________________________ 295 _____________________________________________ 295 3.6 Herramienta de creación de perfiles de datos _________________________________________________________ 295 3.7 Repositorio de metadatos _______________________________________________________ 296 3,5 Datos y Proceso Modelado Herramientas 4. Técnicas ___________________________________________________________ 296 5. Directrices de implementación _______________________________________________ 296 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 296 5.2 Organización y cambio cultural ____________________________________________ 297 6. Gobernanza DII _________________________________________________________ 297 6.1 Acuerdos de intercambio de datos ___________________________________________________ 298 6.2 DII y linaje de datos _______________________________________________________ 298 6.3 Métricas de integración de datos ____________________________________________________ 299 7. Trabajos citados / recomendados _____________________________________________ 299 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 11. CONTENIDO • 7 Capítulo 9: Gestión de contenido y documentos_______________________ 303 1. Introducción ___________________________________________________________ 303 1.1 Impulsores comerciales ___________________________________________________________ 305 1.2 Metas y principios ________________________________________________________ 305 1.3 Conceptos esenciales _________________________________________________________ 307 2. Actividades ______________________________________________________________ 323 2.1 Plan de gestión del ciclo de vida _______________________________________________ 323 2.2 Gestionar el ciclo de vida _______________________________________________________ 326 2.3 Publicar y entregar contenido _________________________________________________ 329 3. Herramientas _________________________________________________________________ 330 3.1 Sistemas de gestión de contenido empresarial ______________________________________ 330 3.2 Herramientas de colaboración ________________________________________________________ 333 3.3 Herramientas de metadatos y vocabulario controlado _____________________________________ 333 3.4 Formatos estándar de marcado e intercambio ______________________________________ 333 3.5 Tecnología de descubrimiento electrónico _____________________________________________________ 336 4. Técnicas ____________________________________________________________ 336 4.1 Manual de estrategias de respuesta a litigios ________________________________________________ 336 4.2 Mapa de datos de respuesta a litigios ________________________________________________ 337 5. Directrices de implementación _______________________________________________ 337 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 338 5.2 Organización y cambio cultural ____________________________________________ 339 6. Documentos y gobernanza de contenido _______________________________________ 340 6.1 Marcos de gobernanza de la información _________________________________________ 340 6.2 Proliferación de información _________________________________________________ 342 6.3 Gobernar el contenido de calidad __________________________________________________ 342 6.4 Métricas ___________________________________________________________________ 343 7. Trabajos citados / recomendados _____________________________________________ 344 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 12. 8 • DMBOK2 Capítulo 10: Referencia y datos maestros _____________________________ 347 1. Introducción ___________________________________________________________ 347 1.1 Impulsores comerciales ___________________________________________________________ 349 ________________________________________________________ 349 1.3 Conceptos esenciales _________________________________________________________ 350 1.2 Objetivos y Principios 2. Actividades ______________________________________________________________ 370 2.1 Actividades de MDM ____________________________________________________________ 371 2.2 Actividades de datos de referencia ____________________________________________________ 373 3. Herramientas y técnicas ___________________________________________________ 375 4. Directrices de implementación _______________________________________________ 375 4.1 Adherirse a la arquitectura de datos maestros ___________________________________________ 376 4.2 Supervisar el movimiento de datos ____________________________________________________ 376 4.3 Gestionar el cambio de datos de referencia ______________________________________________ 376 4.4 Acuerdos de intercambio de datos ___________________________________________________ 377 5. Organización y cambio cultural ________________________________________ 378 6. Referencia y gobernanza de datos maestros ____________________________________ 378 6.1 Métricas ___________________________________________________________________ 379 7. Trabajos Citado / Recomendado ____________________________________________ 379 Capítulo 11: Almacenamiento de datos e inteligencia empresarial_______________ 381 1. Introducción __________________________________________________________ 381 1.1 Impulsores comerciales ___________________________________________________________ 383 1.2 Metas y principios ________________________________________________________ 383 1.3 Conceptos esenciales _________________________________________________________ 384 2. Actividades _____________________________________________________________ 394 2.1 Comprender los requisitos __________________________________________________ 394 2.2 Definir y mantener la arquitectura DW / BI ___________________________________ 395 2.3 Desarrollar el almacén de datos y los Data Marts ___________________________________ 396 2.4 Llene el almacén de datos ________________________________________________ 397 2.5 Implementar la cartera de Business Intelligence __________________________________ 398 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 13. CONTENIDO • 9 2.6 Mantener productos de datos _____________________________________________________ 399 3. Herramientas ________________________________________________________________ 402 3.1 Repositorio de metadatos _______________________________________________________ 402 3.2 Herramientas de integración de datos ______________________________________________________ 403 3.3 Tipos de herramientas de inteligencia empresarial ____________________________________________ 403 4. Técnicas ___________________________________________________________ 407 4.1 Prototipos para impulsar los requisitos ____________________________________________ 407 4.2 BI de autoservicio _____________________________________________________________ 408 4.3 Datos de auditoría que se pueden consultar _______________________________________________ 408 5. Directrices de implementación ______________________________________________ 408 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 408 5.2 Hoja de ruta de lanzamiento __________________________________________________________ 409 5.3 Gestión de la configuración __________________________________________________ 409 5.4 Organización y cambio cultural ____________________________________________ 410 6. Gobierno de DW / BI _____________________________________________________ 411 6.1 Habilitación de la aceptación comercial _______________________________________________ 411 6.2 Satisfacción del cliente / usuario _________________________________________________ 412 ___________________________________________________ 412 6.3 Servicio Nivel Acuerdos 6.4 Reportando Estrategia _________________________________________________________ 412 6.5 Métrica ___________________________________________________________________ 413 7. Obras Citado / Recomendado ____________________________________________ 414 Capítulo 12: Gestión de metadatos ________________________________ 417 1. Introducción __________________________________________________________ 417 1.1 Impulsores comerciales ___________________________________________________________ 420 1.2 Metas y principios ________________________________________________________ 420 1.3 Conceptos esenciales _________________________________________________________ 421 2. Actividades _____________________________________________________________ 434 2.1 Definir la estrategia de metadatos____________________________________________________ 434 2.2 Comprender los requisitos de metadatos __________________________________________ 435 2.3 Definir la arquitectura de metadatos ________________________________________________ 436 2.4 Crear y mantener metadatos________________________________________________ 438 2.5 Consultar, informar y analizar metadatos __________________________________________ 440 3. Herramientas _________________________________________________________________ 440 3.1 Herramientas de gestión de repositorios de metadatos _______________________________________ 440 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 14. 10 • DMBOK2 4. Técnicas ____________________________________________________________ 441 4.1 Análisis de impacto y linaje de datos_____________________________________________ 441 4.2 Metadatos para la ingesta de Big Data _________________________________________________ 443 5. Directrices de implementación _______________________________________________ 444 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 444 5.2 Cambio organizacional y cultural ___________________________________________ 445 6. Gobernanza de metadatos ___________________________________________________ 445 6.1 Controles de proceso ___________________________________________________________ 445 6.2 Documentación de soluciones de metadatos _________________________________________ 446 6.3 Normas y directrices de metadatos ___________________________________________ 446 6.4 Métricas ___________________________________________________________________ 447 7. Trabajos citados / recomendados _____________________________________________ 448 Capítulo 13: Calidad de los datos _________________________________________ 449 1. Introducción ___________________________________________________________ 449 1.1 Impulsores comerciales ___________________________________________________________ 452 1.2 Metas y principios ________________________________________________________ 452 1.3 Conceptos esenciales _________________________________________________________ 453 2. Actividades ______________________________________________________________ 473 2.1 Definir datos de alta calidad ____________________________________________________ 473 2.2 Definir una estrategia de calidad de datos ________________________________________________ 474 2.3 Identificar datos críticos y reglas comerciales _______________________________________ 474 2.4 Realizar la evaluación inicial de la calidad de los datos _____________________________________ 475 2.5 Identificar y priorizar las mejoras potenciales _________________________________ 476 2.6 Definir objetivos para la mejora de la calidad de los datos ____________________________________ 477 2.7 Desarrollar e implementar operaciones de calidad de datos ___________________________________ 477 3. Herramientas _________________________________________________________________ 484 3.1 Herramientas de creación de perfiles de datos ________________________________________________________ 485 3.2 Herramientas de consulta de datos ________________________________________________________ 485 3.3 Modelado y herramientas ETL _____________________________________________________ 485 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 15. CONTENIDO • 11 3.4 Plantillas de reglas de calidad de datos _________________________________________________ 485 3.5 Repositorios de metadatos ______________________________________________________ 485 4. Técnicas ____________________________________________________________ 486 4.1 Acciones preventivas _________________________________________________________ 486 4.2 Acciones correctivas _________________________________________________________ 486 4.3 Módulos de verificación de calidad y código de auditoría ________________________________________ 487 4.4 Métricas de calidad de datos efectivas ________________________________________________ 487 4.5 Control estadístico del proceso ___________________________________________________ 488 4.6 Análisis de causa raíz ________________________________________________________ 490 5. Directrices de implementación _______________________________________________ 490 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 491 5.2 Organización y cambio cultural ____________________________________________ 492 6. Calidad y gobernanza de los datos _________________________________________ 493 6.1 Política de calidad de datos _________________________________________________________ 493 ___________________________________________________________________ 6.2 Métricas 494 7. Obras citadas / recomendadas ____________________________________________ 494 Capítulo 14: Big Data y ciencia de datos ______________________________ 497 1. Introducción __________________________________________________________ 497 1.1 Impulsores comerciales ___________________________________________________________ 498 1.2 Principios ________________________________________________________________ 500 1.3 Conceptos esenciales _________________________________________________________ 500 2. Actividades _____________________________________________________________ 511 2.1 Definir la estrategia de Big Data y las necesidades comerciales ___________________________________ 511 2.2 Elija fuentes de datos _______________________________________________________ 512 2.3 Adquirir e ingerir fuentes de datos______________________________________________ 513 2.4 Desarrollar hipótesis y métodos de datos ________________________________________ 514 2.5 Integrar / alinear datos para análisis ____________________________________________ 514 2.6 Explorar datos usando modelos __________________________________________________ 514 2.7 Implementar y monitorear ________________________________________________________ 516 3. Herramientas ________________________________________________________________ 517 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 16. 12 • DMBOK2 3.1 Arquitectura y tecnologías MPP Shared-Nothing _____________________________ 518 3.2 Bases de datos distribuidas basadas en archivos _____________________________________________ 519 3.3 Algoritmos en la base de datos _____________________________________________________ 520 3.4 Soluciones de Big Data en la nube ____________________________________________________ 520 3.5 Computación estadística y lenguajes gráficos _________________________________ 520 3.6 Herramientas de visualización de datos ____________________________________________________ 520 4. Técnicas ___________________________________________________________ 521 4.1 Modelado analítico __________________________________________________________ 521 4.2 Modelado de Big Data _________________________________________________________ 522 5. Directrices de implementación ______________________________________________ 523 5.1 Alineación de la estrategia _________________________________________________________ 523 5.2 Evaluación de la preparación / Evaluación de riesgos ______________________________________ 523 5.3 Organización y cambio cultural ____________________________________________ 524 6. Big Data y gobernanza de la ciencia de datos _____________________________________ 525 6.1 Gestión de canales de visualización __________________________________________ 525 6.2 Estándares de visualización y ciencia de datos ______________________________________ 525 6.3 Seguridad de los datos ______________________________________________________________ 526 6.4 Metadatos _________________________________________________________________ 526 6.5 Datos Calidad ______________________________________________________________ 527 6.6 Métricas ___________________________________________________________________ 527 7. Obras Citado / Recomendado ____________________________________________ 528 Capítulo 15: Evaluación de la madurez de la gestión de datos __________________ 531 1. Introducción __________________________________________________________ 531 1.1 Impulsores comerciales ___________________________________________________________ 532 1.2 Metas y principios ________________________________________________________ 534 1.3 Conceptos esenciales _________________________________________________________ 534 2. Actividades _____________________________________________________________ 539 2.1 Planificar actividades de evaluación __________________________________________________ 540 2.2 Realizar una evaluación de madurez ________________________________________________ 542 2.3 Interpretar los resultados __________________________________________________________ 543 2.4 Crear un programa específico de mejoras __________________________________ 544 2.5 Reevaluar la madurez _________________________________________________________ 545 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 17. CONTENIDO • 13 3. Herramientas _________________________________________________________________ 545 4. Técnicas ____________________________________________________________ 546 4.1 Selección de un marco DMM _________________________________________________ 546 4.2 Uso del marco DAMA-DMBOK ______________________________________________ 546 5. Pautas para un DMMA __________________________________________________ 547 5.1 Evaluación de preparación / Evaluación de riesgos ______________________________________ 547 5.2 Cambio organizacional y cultural ___________________________________________ 548 6. Gobierno de la gestión de la madurez ________________________________________ 548 6.1 Supervisión del proceso de DMMA ____________________________________________________ 548 6.2 Métricas ___________________________________________________________________ 548 7. Trabajos Citado / Recomendado _____________________________________________ 549 Capítulo 16: Organización de la gestión de datos y expectativas de los roles _______ 551 1. Introducción ___________________________________________________________ 551 2. Comprender las normas culturales y de organización existentes ________________________ 551 3. Construcciones organizativas de gestión de datos ________________________________ 553 3.1 Modelo operativo descentralizado _______________________________________________ 553 3.2 Modelo operativo de red ___________________________________________________ 554 3.3 Modelo operativo centralizado _________________________________________________ 555 3.4 Modelo operativo híbrido ____________________________________________________ 556 3.5 Modelo de funcionamiento federado __________________________________________________ 557 3.6 Identificación del mejor modelo para una organización __________________________________ 557 3.7 Alternativas de DMO y consideraciones de diseño ___________________________________ 558 4. Factores críticos de éxito __________________________________________________ 559 4.1 Patrocinio ejecutivo ______________________________________________________ 559 _______________________________________________________________ 559 4.2 Claro Visión Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 18. 14 • DMBOK2 4.3 Gestión proactiva del cambio _______________________________________________ 559 4.4 Alineación de liderazgo ______________________________________________________ 560 Comunicación ____________________________________________________________ 560 Participación de los interesados ____________________________________________________ 560 Orientación y formación ____________________________________________________ 560 Medida de adopción _____________________________________________________ 561 Adherencia a los principios rectores ______________________________________________ 561 4.10 Evolución, no revolución __________________________________________________ 561 4.5 4.6 4,7 4.8 4.9 5. Construya la organización de gestión de datos ___________________________________ 562 5.1 Identificar a los participantes actuales de la gestión de datos _________________________________ 562 5.2 Identificar a los participantes del comité ______________________________________________ 562 ____________________________________________ 563 5.4 Involucrar a las partes interesadas ____________________________________________________ 563 5.3 Identificar y Analizar Partes interesadas 6. Interacciones entre la OGD y otros organismos orientados a los datos ________________ 564 6.1 El director de datos_______________________________________________________ 564 6.2 Gobierno de datos ___________________________________________________________ 565 _______________________________________________________________ 566 6.4 Arquitectura empresarial _____________________________________________________ 566 6.5 Gestión de una organización global ______________________________________________ 567 6.3 Datos Calidad 7. Funciones de gestión de datos _________________________________________________ 568 7.1 Roles organizacionales _______________________________________________________ 568 7.2 Funciones individuales ___________________________________________________________ 568 8. Trabajos citados / recomendados _____________________________________________ 571 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 19. • DMBOK2 Capítulo 17: Gestión de datos y gestión de cambios organizacionales __ 573 1. Introducción __________________________________________________________ 573 2. Leyes de cambio ________________________________________________________ 574 3. No gestionar un cambio: gestionar una transición _____________________________ 575 4. Ocho errores de gestión del cambio de Kotter _______________________________ 577 4.1 4.2 4.3 Error # 3: Subestimar el poder de la visión _________________________________ 578 4.4 Error # 4: Comunicar la visión por un factor de 10, 100 o 1000 __________ 579 4.5 Error # 5: Permitir obstáculos para bloquear la visión _______________________________ 580 4.6 Error n. ° 6: No se pueden crear victorias a corto plazo ___________________________________ 580 Error # 1: Permitir demasiada complacencia ____________________________________ 577 Error n. ° 2: No crear una coalición rectora suficientemente poderosa ________________ 578 4.7 Error # 7: Declarar la victoria demasiado pronto _________________________________________ 581 4.8 Error # 8: Descuidar anclar firmemente los cambios en la cultura corporativa____________ 581 5. Proceso de ocho etapas de Kotter para un cambio importante ______________________________ 582 5.1 5.2 Establecer un sentido de urgencia ______________________________________________ 583 La Coalición de Orientación _______________________________________________________ 586 5.3 5.4 6. La fórmula del cambio _________________________________________________ 598 Desarrollo de una visión y estrategia _____________________________________________ 590 Comunicando la visión del cambio ____________________________________________ 594 7. Difusión de innovaciones y cambio sostenido _____________________________ 599 7.1 7.2 7.3 7.4 8. Sosteniendo el cambio _____________________________________________________ 603 8.1 Los desafíos a superar a medida que se difunden las innovaciones ___________________________ 601 Elementos clave en la difusión de la innovación ____________________________________ 601 Las cinco etapas de la adopción _________________________________________________ 601 Factores que afectan la aceptación o el rechazo de una innovación o cambio ______________ 602 Sentido de urgencia / insatisfacción ____________________________________________ 604 8.2 Enmarcando la visión _________________________________________________________ 604 8.3 La Coalición Rectora _______________________________________________________ 605 8.4 Ventaja relativa y observabilidad _________________________________________ 605 9. Comunicación del valor de la gestión de datos __________________________________ 605 9.1 Principios de comunicación __________________________________________________ 605 9.2 9.3 Evaluación y preparación de la audiencia _________________________________________ 606 El elemento humano ________________________________________________________ 607 9.4 9.5 10. Obras citadas / recomendadas ___________________________________________ 609 Plan de comunicación _______________________________________________________ 608 Siga comunicándose _______________________________________________________ 609 Agradecimientos _____________________________________________ 611 Índice _________________________________________________________ 615 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 20. dieciséis Cifras Figura 1 Principios de gestión de datos ____________________________________________________________ 22 Figura 2 Actividades clave del ciclo de vida de los datos_____________________________________________________________ 29 Figura 3 Modelo de alineación estratégica (Henderson y Venkatraman) _____________________________________ 34 Figura 4 Modelo de información de Amsterdam (adaptado) __________________________________________________ 35 Figura 5 El marco de gestión de datos DAMA-DMBOK2 (The DAMAWheel) ___________________________ 36 Figura 6 Hexágono de factores ambientales de DAMA ____________________________________________________ 36 Figura 7 Diagrama de contexto del área de conocimiento ________________________________________________________ 37 Figura 8 Capacidad de base de datos comprada o construida ____________________________________________________ 40 Figura 9 Dependencias del área funcional de DAMA _____________________________________________________ 41 Figura 10 Marco de la función de gestión de datos de DAMA _____________________________________________ 42 Figura 11 DAMA Rueda Evolucionado ________________________________________________________________ 44 Figura 12 Diagrama de contexto: Ética en el manejo de datos ___________________________________________________ 50 Figura 13 Modelo de riesgo ético para proyectos de muestreo __________________________________________________ 64 Figura 14 Diagrama de contexto: gobernanza y administración de datos _________________________________________ 69 Figura 15 Gobernanza y gestión de datos __________________________________________________ 72 Figura 16 Partes de la organización de gobierno de datos _____________________________________________________ 74 Figura 17 Ejemplos del marco operativo de la DG empresarial _____________________________________________ 75 Figura 18 Puntos de contacto organizativos de CDO ________________________________________________________ 81 Figura 19 Un ejemplo de un marco operativo __________________________________________________ 83 Figura 20 Datos Asunto Escalada Sendero _____________________________________________________________ 86 Figura 21 Diagrama de contexto: Arquitectura de datos _____________________________________________________ 100 Figura 22 Marco Zachman simplificado ________________________________________________________ 103 Figura 23 Empresa Datos Modelo _______________________________________________________________ 106 Figura 24 Ejemplo de diagrama de modelos de área temática ___________________________________________________ 107 Figura 25 Flujo de datos representado en una matriz ________________________________________________________ 108 Figura 26 Ejemplo de diagrama de flujo de datos __________________________________________________________ 109 Figura 27 Las dependencias de datos de las capacidades comerciales ____________________________________________ 112 Figura 28 Diagrama de contexto: modelado y diseño de datos ______________________________________________ 124 Figura 29 Entidades __________________________________________________________________________ 129 Figura 30 Relaciones ______________________________________________________________________ 130 Figura 31 Símbolos de cardinalidad _________________________________________________________________ 131 Figura 32 Relación unitaria - Jerarquía ________________________________________________________ 131 Figura 33 Relación unitaria - Red _________________________________________________________ 131 Figura 34 Relación binaria _________________________________________________________________ 132 Figura 35 Relación ternaria ________________________________________________________________ 132 Figura 36 Claves externas ______________________________________________________________________ 133 Figura 37 Atributos ________________________________________________________________________ 133 Figura 38 Entidad dependiente e independiente _____________________________________________________ 134 Figura 39 Notación IE _______________________________________________________________________ 137 Figura 40 Notación de ejes para modelos dimensionales ___________________________________________________ 138 Figura 41 Modelo de clase UML ___________________________________________________________________ 140 Figura 42 ORM Modelo _______________________________________________________________________ 141 Figura 43 Modelo FCO-IM _____________________________________________________________________ 142 Figura 44 Modelo de bóveda de datos ___________________________________________________________________ 143 Figura 45 Modelo de ancla _____________________________________________________________________ 143 Figura 46 Modelo conceptual relacional __________________________________________________________ 145 Figura 47 Modelo conceptual dimensional ________________________________________________________ 146 Figura 48 Modelo de datos lógicos relacionales _________________________________________________________ 146 Figura 49 Modelo de datos lógicos dimensionales _______________________________________________________ 147 Figura 50 Modelo de datos físicos relacionales ________________________________________________________ 148 Figura 51 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 21. Modelo de datos físicos dimensionales _______________________________________________________ 149 Figura 52 Relaciones de supertipo y subtipo ___________________________________________________ 152 Figura 53 El modelado es iterativo ________________________________________________________________ 153 11 • DMBOK2 Figura 54 Diagrama de contexto: almacenamiento de datos y operaciones _____________________________________________ 170 Figura 55 Centralizado frente a distribuido ____________________________________________________________ 175 Figura 56 Bases de datos federadas ________________________________________________________________ 176 Figura 57 Acoplamiento __________________________________________________________________________ 177 Figura 58 Teorema de CAP ______________________________________________________________________ 180 Figura 59 Espectro de organización de la base de datos _______________________________________________________ 184 Figura 60 Envío de registros frente a duplicación ____________________________________________________________ 192 Figura 61 SLA para el rendimiento del sistema y la base de datos _______________________________________________ 203 Figura 62 Fuentes de requisitos de seguridad de datos ___________________________________________________ 218 Figura 63 Diagrama de contexto: seguridad de datos _________________________________________________________ 219 Figura 64 DMZ Ejemplo ______________________________________________________________________ 231 Figura 65 Diagrama de ejemplo de jerarquía de roles de seguridad ________________________________________________ 251 Figura 66 Diagrama de contexto: Integración e interoperabilidad de datos ______________________________________ 271 Figura 67 Flujo del proceso ETL ___________________________________________________________________ 274 Figura 68 Flujo de proceso ELT ___________________________________________________________________ 275 Figura 69 Acoplamiento de aplicación ________________________________________________________________ 282 Figura 70 Enterprise Service Bus _______________________________________________________________ 283 Figura 71 Diagrama de contexto: documentos y contenido ________________________________________________ 304 Figura 72 Jerarquía de documentos basada en ISO 9001-4.2 _______________________________________________ 317 Figura 73 Modelo de referencia de descubrimiento electrónico ___________________________________________________ 319 Figura 74 Modelo de referencia de gobierno de la información_________________________________________________ 341 Figura 75 Diagrama de contexto: datos maestros y de referencia ______________________________________________ 348 Figura 76 Pasos de procesamiento clave para MDM _________________________________________________________ 361 Figura 77 Ejemplo de arquitectura de intercambio de datos maestros ________________________________________________ 370 Figura 78 Proceso de solicitud de cambio de datos de referencia __________________________________________________ 377 Figura 79 Diagrama de contexto: DW / BI _____________________________________________________________ 382 Figura 80 La fábrica de información corporativa ______________________________________________________ 388 Figura 81 Piezas de ajedrez del almacén de datos de Kimball __________________________________________________ 390 Figura 82 Arquitectura conceptual de DW / BI y Big Data ______________________________________________ 391 Figura 83 Ejemplo de proceso de liberación _____________________________________________________________ 400 Figura 84 Diagrama de contexto: Metadatos ____________________________________________________________ 419 Figura 85 Arquitectura de metadatos centralizada ______________________________________________________ 432 Figura 86 Arquitectura de metadatos distribuidos ______________________________________________________ 433 Figura 87 Arquitectura de metadatos híbrida __________________________________________________________ 434 Figura 88 Ejemplo de metamodelo de repositorio de metadatos ________________________________________________ 437 Figura 89 Diagrama de flujo de linaje de elementos de datos de muestra _______________________________________________ 442 Figura 90 Diagrama de flujo de linaje del sistema de muestra ___________________________________________________ 442 Figura 91 Diagrama de contexto: Calidad de los datos _________________________________________________________ 451 Figura 92 Relación entre dimensiones de calidad de datos ____________________________________________ 460 Figura 93 Un ciclo de gestión de la calidad de los datos basado en el gráfico de Shewhart ________________________________ 463 Figura 94 Barreras para administrar la información como un activo comercial ________________________________________ 467 Figura 95 Gráfico de control de un proceso en control estadístico _____________________________________________ 489 Figura 96 Disminuir Información Triángulo ____________________________________________________________ 498 Figura 97 Diagrama de contexto: BigData y Ciencia de datos _______________________________________________ 499 Figura 98 Datos Ciencia Proceso ________________________________________________________________ 501 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 22. 18 Figura 99 Desafíos del almacenamiento de datos ______________________________________________________________ 503 Figura 100 Arquitectura conceptual de DW / BI y Big Data _____________________________________________ 504 Figura 101 Arquitectura basada en servicios __________________________________________________________ 506 Figura 102 Arquitectura de dispositivo en columna ______________________________________________________ 519 Figura 103 Diagrama de contexto: Evaluación de la madurez de la gestión de datos ___________________________________ 533 Figura 104 Ejemplo de modelo de madurez de gestión de datos ______________________________________________ 535 Figura 105 Ejemplo de visualización de una evaluación de la madurez de la gestión de datos _____________________________ 537 Figura 106 Evaluar el estado actual para crear un modelo operativo _________________________________________ 552 Figura 107 Modelo operativo descentralizado ________________________________________________________ 554 FIGURAS Y TABLAS • 13 Figura 108 Modelo operativo de red ___________________________________________________________ 554 Figura 109 Modelo de funcionamiento centralizado _________________________________________________________ 555 Figura 110 Modelo operativo híbrido ____________________________________________________________ 556 Figura 111 Modelo operativo federado __________________________________________________________ 557 Figura 112 Mapa de interés de las partes interesadas ____________________________________________________________ 564 Figura 113 Fases de transición de Bridges __________________________________________________________ 576 Figura 114 Proceso de ocho etapas de Kotter para un cambio importante ____________________________________________ 583 Figura 115 Fuentes de complacencia _____________________________________________________________ 585 Figura 116 La visión se abre paso Estado Quo _____________________________________________________ 591 Figura 117 Contraste gestión / liderazgo _____________________________________________________ 593 Figura 118 Difusión de innovaciones de Everett Rogers _________________________________________________ 600 Figura 119 Las etapas de adopción _____________________________________________________________ 602 Mesas Tabla 1 Principios del RGPD ______________________________________________________________________ 54 Tabla 2 Obligaciones legales de privacidad de Canadá _____________________________________________________ 55 Tabla 3 Criterios del programa de privacidad de Estados Unidos _____________________________________________________ 55 Tabla 4 Comités / órganos de gobernanza de datos típicos _______________________________________________ 74 Tabla 5 Principios para la contabilidad de activos de datos _______________________________________________________ 78 Tabla 6 Dominios de la arquitectura _________________________________________________________________ 101 Tabla 7 Categorías de entidades más utilizadas ________________________________________________________ 127 Tabla 8 Entidad, tipo de entidad e instancia de entidad ____________________________________________________ 128 Tabla 9 Esquemas y notaciones de modelado ________________________________________________________ 136 Tabla 10 Referencia cruzada de esquema a base de datos _____________________________________________________ 137 Tabla 11 Cuadro de mando del modelo de datos ® Modelo _______________________________________________________ 164 Mesa 12 ÁCIDO vs BASE ______________________________________________________________________ 180 Tabla 13 Tabla de inventario de regulación de muestra ______________________________________________________ 246 Tabla 14 Ejemplo de cuadrícula de asignación de roles _________________________________________________________ 250 Tabla 15 Niveles de control para documentos según ANSI-859 _____________________________________________ 327 Tabla 16 Muestra de medidas de auditoría _______________________________________________________________ 329 Tabla 17 Lista de referencia simple ________________________________________________________________ 353 Tabla 18 Lista de referencia simple ampliada ________________________________________________________ 354 Tabla 19 Lista de referencias cruzadas _________________________________________________________________ 354 Tabla 20 Multi-idioma Lista de referencia _________________________________________________________ 354 Tabla 21 UNSPSC (Clasificación estándar universal de productos y servicios) ______________________________ 355 Tabla 22 NAICS (Sistema de clasificación industrial de América del Norte) _______________________________________ 355 Tabla 23 Atributos de metadatos de datos de referencia críticos _______________________________________________ 357 Tabla 24 Datos de origen recibidos por el sistema MDM _______________________________________________ 361 Tabla 25 Datos de entrada enriquecidos y estandarizados ___________________________________________________ 362 Tabla 26 Identificación de candidatos y resolución de identidad ____________________________________________ 364 Mesa 27 Autobús DW Matriz Ejemplo ______________________________________________________________ 389 Tabla 28 Comparación de técnicas de los CDC Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 23. ___________________________________________________________ 393 Tabla 29 Dimensiones comunes de la calidad de los datos _____________________________________________________ 458 Mesa 30 DQ Métrico Ejemplos de _________________________________________________________________ 480 Tabla 31 Técnicas de monitoreo de la calidad de los datos _____________________________________________________ 481 Tabla 32 Progresión analítica ________________________________________________________________ 501 Tabla 33 Riesgos y mitigaciones típicos para un DMMA _________________________________________________ 547 Tabla 34 Fases de transición de Bridges ____________________________________________________________ 575 Tabla 35 Escenarios de complacencia _______________________________________________________________ 578 Tabla 36 Escenarios de declaración de victoria demasiado pronto ____________________________________________________ 581 Cuadro 37 Categorías de difusión de innovaciones adaptadas a la gestión de la información _________________________ 600 Cuadro 38 Las etapas de adopción (Adaptado de Rogers, 1964) ________________________________________ 602 Tabla 39 Elementos del plan de comunicación _________________________________________________________ 608 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 24. Orden 13967 de Ramón Arroyo de 13 de marzo de 2018 Prefacio Cuerpo de conocimientos (DAMA-DMBOK2). Desde la publicación de la primera edición en 2009, importantes International se complace en publicar la segunda edición de la Guía DAMA para la gestión de datos que han tenido lugar en el campo de la gestión de datos. La gobernanza de datos se ha convertido en un estándar estructura en muchas organizaciones, las nuevas tecnologías han permitido la recopilación y el uso de 'Big Data' (datos semiestructurados y no estructurados en una amplia gama de formatos), y la importancia de la ética de los datos ha crecido junto con nuestra capacidad para explorar y explotar la gran cantidad de datos e información producidos como parte de nuestra vida diaria. AMA Estos cambios son emocionantes. También imponen nuevas y crecientes exigencias a nuestra profesión. DAMA tiene D respondió a estos cambios reformulando el Marco de Gestión de Datos de DAMA (el DAMA • Se han mejorado y actualizado los diagramas de contexto para todas las áreas de conocimiento. Wheel), agregando detalles y aclaraciones, y ampliando el alcance del DMBOK: • La Integración de Datos e Interoperabilidad se ha agregado como una nueva Área de Conocimiento para resaltar su importancia (Capítulo 8). • La ética de los datos se ha destacado como un capítulo separado debido a la creciente necesidad de un enfoque ético para todos los aspectos de la gestión de datos (Capítulo 2). • El papel de la gobernanza se ha descrito tanto como una función (Capítulo 3) como en relación con cada Área de Conocimiento. • Se ha adoptado un enfoque similar con la gestión del cambio organizacional, que se describe en el Capítulo 17 y se incorpora a los capítulos del Área de conocimiento. • Los nuevos capítulos sobre Big Data y ciencia de datos (Capítulo 14) y Evaluación de la madurez de la gestión de datos (Capítulo 15) ayudan a las organizaciones a comprender hacia dónde quieren ir y les brindan las herramientas para llegar allí. • La segunda edición también incluye un conjunto recientemente formulado de principios de administración de datos para respaldar la capacidad de las organizaciones para administrar sus datos de manera efectiva y obtener valor de sus activos de datos (Capítulo 1). Esperamos que el DMBOK2 sirva a los profesionales de la gestión de datos en todo el mundo como un recurso y una guía valiosos. Sin embargo, también reconocemos que es solo un punto de partida. El verdadero avance vendrá a medida que apliquemos y aprendamos de estas ideas. DAMA existe para permitir que los miembros aprendan continuamente, compartir ideas, tendencias, problemas y soluciones. Sue Geuens presidente DAMA Internacional Laura Sebastián-Coleman Oficial de publicaciones DAMA Internacional 15 Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 25. CAPÍTULO 1 Gestión de datos METRO les da información sobre sus clientes, productos y servicios. Puede ayudarlos a innovar y alcanzar cualquier que pueden derivar valor continuo (Evans y Price, 2012). No se obtiene valor a partir de los datos. en el vacío o por accidente. Requiere intención, planificación, coordinación y compromiso. Requiere gestión y liderazgo. 1. Introducción Las organizaciones reconocen que sus datos son un activo empresarial vital. Los datos y la información pueden dar metas estratégicas. A pesar de ese reconocimiento, pocas organizaciones gestionan activamente los datos como un activo de Gestión de datos es el desarrollo, ejecución y supervisión de planes, políticas, programas y prácticas que entregan, controlan, protegen y mejoran el valor de los datos y los activos de información a lo largo de sus ciclos de vida. A Profesional de gestión de datos es cualquier persona que trabaje en cualquier faceta de la gestión de datos (desde la gestión técnica de los datos a lo largo de su ciclo de vida hasta garantizar que los datos se utilicen y aprovechen correctamente) para cumplir los objetivos estratégicos de la organización. Los profesionales de la gestión de datos cumplen numerosos roles, desde los más técnicos (por ejemplo, administradores de bases de datos, administradores de red, programadores) hasta negocios estratégicos (por ejemplo, administradores de datos, estrategas de datos, directores de datos). Las actividades de gestión de datos son muy variadas. Incluyen todo, desde la capacidad de tomar decisiones consistentes sobre cómo obtener valor estratégico de los datos hasta la implementación técnica y el rendimiento de las bases de datos. Por lo tanto, la gestión de datos requiere habilidades tanto técnicas como no técnicas (es decir, "comerciales"). La responsabilidad de la gestión de datos debe compartirse entre los roles empresariales y de tecnología de la información, y las personas de ambas áreas deben poder colaborar para garantizar que una organización tenga datos de alta calidad que satisfagan sus necesidades estratégicas. Los datos y la información no son solo activos en el sentido de que las organizaciones invierten en ellos para obtener valor futuro. Los datos y la información también son vitales para las operaciones diarias de la mayoría de las organizaciones. Se les ha llamado la "moneda", la "sangre vital" e incluso el "nuevo petróleo" de la economía de la información. 1 Independientemente de que una organización obtenga valor de sus análisis o no, ni siquiera puede realizar transacciones comerciales sin datos. Para apoyar a los profesionales de la gestión de datos que llevan a cabo el trabajo, DAMA International (The Data Management Association) ha elaborado este libro, la segunda edición de La guía de datos de DAMA 1 Google 'datos como moneda', 'datos como sangre vital' y 'el nuevo petróleo', para numerosas referencias. Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 26. 17
  • 27. GESTIÓN DE DATOS • 23 Cuerpo de conocimientos de gestión (DMBOK2). Esta edición se basa en la primera, publicada en 2009, que proporcionó conocimientos fundamentales sobre los que construir a medida que la profesión avanzaba y maduraba. Este capítulo describe un conjunto de principios para la gestión de datos. Analiza los desafíos relacionados con el seguimiento de esos principios y sugiere enfoques para hacer frente a estos desafíos. El capítulo también describe el marco de gestión de datos DAMA, que proporciona el contexto para el trabajo realizado por los profesionales de la gestión de datos dentro de varias áreas de conocimiento de gestión de datos. 1.1 Impulsores del negocio La información y el conocimiento son la clave de la ventaja competitiva. Las organizaciones que tienen datos confiables y de alta calidad sobre sus clientes, productos, servicios y operaciones pueden tomar mejores decisiones que aquellas sin datos o con datos no confiables. La incapacidad de administrar los datos es similar a la incapacidad de administrar el capital. Resulta en desperdicio y pérdida de oportunidades. El principal impulsor de la gestión de datos es permitir que las organizaciones obtengan valor de sus activos de datos, del mismo modo que la gestión eficaz de los activos financieros y físicos permite a las organizaciones obtener valor de esos activos. 1.2 Objetivos Dentro de una organización, los objetivos de la gestión de datos incluyen: • Comprender y respaldar las necesidades de información de la empresa y sus partes interesadas, incluidos clientes, empleados y socios comerciales. Capturar, almacenar, proteger y garantizar la integridad de los activos de datos Garantizar la calidad de los datos y la información Garantizar la privacidad y confidencialidad de los datos de las partes interesadas Evitar el acceso, la manipulación o el uso no autorizados o inapropiados de datos e información • Asegurar que los datos se puedan usar de manera efectiva para agregar valor a la empresa • • • • 2. Conceptos esenciales 2.1 Datos Definiciones de larga data de datos enfatizar su papel en la representación de hechos sobre el mundo. 2 En relación con la tecnología de la información, datos también se entiende como información que ha sido almacenada en forma digital (aunque los datos no se limitan a 2 El NewOxford American Dictionary define los datos como "hechos y estadísticas recopilados para su análisis". La Sociedad Estadounidense de Calidad (ASQ) define los datos como “un conjunto de hechos recopilados” y describe dos tipos de datos numéricos: medidos o variables y contados o atribuidos. La Organización Internacional de Normalización (ISO) define los datos como "reinterpretables Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 28. 24 • DMBOK2 información que ha sido digitalizada y los principios de gestión de datos se aplican a los datos capturados en papel y en bases de datos). Aún así, debido a que hoy podemos capturar tanta información electrónicamente, llamamos 'datos' a muchas cosas que no se habrían llamado 'datos' en épocas anteriores: cosas como nombres, direcciones, fechas de nacimiento, lo que uno cenó el sábado, lo más reciente libro uno comprado. Estos hechos sobre personas individuales pueden agregarse, analizarse y utilizarse para obtener ganancias, mejorar la salud o influir en las políticas públicas. Además, nuestra capacidad tecnológica para medir una amplia gama de eventos y actividades (desde las repercusiones del Big Bang hasta nuestros propios latidos) y para recopilar, almacenar y analizar versiones electrónicas de cosas que antes no se pensaban como datos (videos, imágenes , grabaciones de sonido, documentos) está cerca de superar nuestra capacidad para sintetizar estos datos en información utilizable. 3 Para aprovechar la variedad de datos sin sentirse abrumado por su volumen y velocidad, se requieren prácticas de administración de datos confiables y extensibles. La mayoría de la gente asume que, debido a que los datos representan hechos, es una forma de verdad sobre el mundo y que los hechos encajarán. Pero los 'hechos' no siempre son simples o directos. Los datos son un medio de representación. Representa otras cosas además de sí mismo (Chisholm, 2010). Los datos son tanto una interpretación de los objetos que representan como un objeto que debe ser interpretado (Sebastian-Coleman, 2013). Esta es otra forma de decir que necesitamos contexto para que los datos sean significativos. Se puede pensar en el contexto como un sistema de representación de datos; tal sistema incluye un vocabulario común y un conjunto de relaciones entre componentes. Si conocemos las convenciones de tal sistema, entonces podemos interpretar los datos que contiene. 4 Estas convenciones a menudo se documentan en un tipo específico de datos denominados Metadatos. Sin embargo, debido a que las personas a menudo toman decisiones diferentes sobre cómo representar conceptos, crean diferentes formas de representar los mismos conceptos. A partir de estas opciones, los datos adquieren diferentes formas. Piense en la variedad de formas que tenemos para representar las fechas del calendario, un concepto sobre el que existe una definición acordada. Ahora considere conceptos más complejos (como cliente o producto), donde la granularidad y el nivel de detalle de lo que necesita ser representado no siempre es evidente, y el proceso de representación se vuelve más complejo, al igual que el proceso de gestión de esa información. tiempo extraordinario. (Ver Capítulo 10). Incluso dentro de una sola organización, a menudo hay varias formas de representar la misma idea. De ahí la necesidad de arquitectura de datos, modelado, gobernanza y administración, y gestión de metadatos y calidad de datos, todo lo cual ayuda a las personas a comprender y utilizar los datos. En todas las organizaciones, el problema de la multiplicidad se multiplica. De ahí la necesidad de estándares de datos a nivel industrial que puedan aportar más coherencia a los datos. Las organizaciones siempre han necesitado administrar sus datos, pero los cambios en la tecnología han ampliado el alcance de esta necesidad de administración, ya que han cambiado la comprensión de las personas sobre qué son los datos. Estos cambios han permitido a las organizaciones utilizar los datos de nuevas formas para crear productos, compartir información, generar conocimiento y mejorar. representación de la información de manera formalizada adecuada para la comunicación, interpretación o procesamiento ”(ISO 11179). Esta definición enfatiza la naturaleza electrónica de los datos y asume, correctamente, que los datos requieren estándares porque se manejan a través de sistemas de tecnología de la información. Dicho esto, no habla de los desafíos de formalizar los datos de manera consistente, en sistemas dispares. Tampoco explica bien el concepto de datos no estructurados. 3 http://ubm.io/2c4yPOJ (Consultado 20016-12-04). http://bit.ly/1rOQkt1 (Consultado 20016-12-04). Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 29. GESTIÓN DE DATOS • 25 4 Para obtener información adicional sobre la estructura de los datos, consulte: Kent, Datos y realidad ( 2012) y Devlin, Falta de inteligencia empresarial ( 2013). éxito organizacional. Pero el rápido crecimiento de la tecnología y con ella la capacidad humana para producir, capturar y extraer datos en busca de significado ha intensificado la necesidad de administrar los datos de manera efectiva. 2.2 Datos e información Se ha derramado mucha tinta sobre la relación entre datos e información. Los datos se han denominado "materia prima de la información" y la información se ha denominado "datos en contexto". 3 A menudo, se utiliza una pirámide en capas para describir la relación entre los datos (en la base), la información, el conocimiento y la sabiduría (en la parte superior). Si bien la pirámide puede ser útil para describir por qué los datos deben administrarse bien, esta representación presenta varios desafíos para la administración de datos. • Se basa en el supuesto de que los datos simplemente existen. Pero los datos no existen simplemente. Deben crearse datos. • Al describir una secuencia lineal de datos a través de la sabiduría, no reconoce que se necesita conocimiento para crear datos en primer lugar. • Implica que los datos y la información son cosas separadas, cuando en realidad, los dos conceptos están entrelazados y dependen el uno del otro. Los datos son una forma de información y la información es una forma de datos. Dentro de una organización, puede resultar útil trazar una línea divisoria entre la información y los datos con el fin de comunicar claramente los requisitos y expectativas de los diferentes usos por parte de las diferentes partes interesadas. ("Aquí hay un informe de ventas del último trimestre [información]. Se basa en los datos de nuestro almacén de datos [datos]. El próximo trimestre estos resultados [datos] se utilizarán para generar nuestras medidas de rendimiento trimestrales [información] ] ”). Reconocer que los datos y la información deben estar preparados para diferentes propósitos impulsa un principio central de la gestión de datos: tanto los datos como la información deben gestionarse. Ambos serán de mayor calidad si se gestionan junto con los usos y los requisitos del cliente. En todo el DMBOK, los términos se utilizarán indistintamente. 2.3 Los datos como activo organizativo Un activo es un recurso económico, que se puede poseer o controlar, y que contiene o produce valor. Los activos se pueden convertir en dinero. Los datos son ampliamente reconocidos como un activo empresarial, aunque la comprensión de lo que significa administrar los datos como un activo aún está evolucionando. A principios de la década de 1990, algunas organizaciones consideraron cuestionable si el valor de la plusvalía debería recibir un valor monetario. Ahora, el 'valor de la plusvalía' aparece comúnmente como un elemento en el estado de pérdidas y ganancias (P&L). Del mismo modo, aunque no se ha adoptado universalmente, la monetización de datos se está volviendo cada vez más común. No pasará mucho tiempo antes de que veamos esto como una característica de las pérdidas y ganancias. (Vea el Capítulo 3.) Las organizaciones de hoy confían en sus activos de datos para tomar decisiones más efectivas y operar de manera más eficiente. Las empresas utilizan los datos para comprender a sus clientes, crear nuevos productos y servicios y mejorar las operaciones 3 Ver English, 1999 y DAMA, 2009. Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 30. 26 • DMBOK2 eficiencia mediante la reducción de costes y el control de riesgos. Las agencias gubernamentales, las instituciones educativas y las organizaciones sin fines de lucro también necesitan datos de alta calidad para guiar sus actividades operativas, tácticas y estratégicas. A medida que las organizaciones dependen cada vez más de los datos, el valor de los activos de datos se puede establecer con mayor claridad. Muchas organizaciones se identifican a sí mismas como "impulsadas por datos". Las empresas que aspiran a seguir siendo competitivas deben dejar de tomar decisiones basadas en intuiciones o instintos y, en su lugar, deben utilizar desencadenantes de eventos y aplicar análisis para obtener información procesable. Estar impulsado por los datos incluye el reconocimiento de que los datos deben administrarse de manera eficiente y con disciplina profesional, a través de una asociación de liderazgo empresarial y experiencia técnica. Además, el ritmo del negocio actual significa que el cambio ya no es opcional; la disrupción digital es la norma. Para reaccionar ante esto, las empresas deben crear conjuntamente soluciones de información con profesionales de datos técnicos que trabajen junto con sus contrapartes de líneas de negocio. Deben planificar cómo obtener y administrar los datos que saben que necesitan para respaldar la estrategia comercial. También deben posicionarse para aprovechar las oportunidades de aprovechar los datos de nuevas formas. 2.4 Principios de gestión de datos La gestión de datos comparte características con otras formas de gestión de activos, como se ve en la Figura 1. Implica saber qué datos tiene una organización y qué se podría lograr con ellos, y luego determinar la mejor manera de utilizar los activos de datos para alcanzar los objetivos de la organización. Como otros procesos de gestión, debe equilibrar las necesidades estratégicas y operativas. Este equilibrio se puede lograr mejor siguiendo un conjunto de principios que reconocen las características destacadas de la gestión de datos y guían la práctica de la gestión de datos. • Los datos son un activo con propiedades únicas: Los datos son un activo, pero se diferencian de otros activos en aspectos importantes que influyen en la forma en que se gestionan. La más obvia de estas propiedades es que los datos no se consumen cuando se utilizan, al igual que los activos financieros y físicos. • El valor de los datos puede y debe expresarse en términos económicos: Llamar a los datos un activo implica que tienen valor. Si bien existen técnicas para medir el valor cualitativo y cuantitativo de los datos, aún no existen estándares para hacerlo. Las organizaciones que quieran tomar mejores decisiones sobre sus datos deben desarrollar formas coherentes de cuantificar ese valor. También deben medir tanto los costos de los datos de baja calidad como los beneficios de los datos de alta calidad. • Gestionar datos significa gestionar la calidad de los datos: Asegurarse de que los datos sean adecuados para su propósito es un objetivo principal de la gestión de datos. Para gestionar la calidad, las organizaciones deben asegurarse de comprender los requisitos de calidad de las partes interesadas y medir los datos frente a estos requisitos. • Se necesitan metadatos para administrar los datos: La gestión de cualquier activo requiere tener datos sobre ese activo (número de empleados, códigos contables, etc.). Los datos que se utilizan para gestionar y utilizar los datos se denominan Metadatos. Debido a que los datos no se pueden guardar ni tocar, para comprender qué son y cómo usarlos se requiere definición y conocimiento en forma de metadatos. Los metadatos se originan en una variedad de procesos relacionados con la creación, procesamiento y Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 31. GESTIÓN DE DATOS • 27 y uso, incluida la arquitectura, el modelado, la administración, el gobierno, la gestión de la calidad de los datos, el desarrollo de sistemas, las operaciones comerciales y de TI, y la analítica. DATOS ADMINISTRACIÓN PRINCIPIOS Los datos son valiosos • • Los datos son un activo con propiedades únicas da • ejército de reserva El valor de los datos puede y Eficaz la gestión requiere debe expresarse en liderazgo términos económicos compromiso Los requisitos de gestión de datos son requisitos comerciales • • Gestionar datos significa gestionar la calidad de los datos • Se necesitan metadatos para administrar los datos • Se necesita planificación para administrar los datos • Los requisitos de gestión de datos deben impulsar las decisiones de tecnología de la información La gestión de datos depende de diversas habilidades • • La gestión de datos es multifuncional • La gestión de datos requiere una perspectiva empresarial La gestión de datos debe tener en cuenta una variedad de perspectivas • La gestión de datos es la gestión del ciclo de vida • • Los diferentes tipos de datos tienen diferentes características de ciclo de vida La gestión de datos incluye la gestión de los riesgos asociados con los datos Figura 1 Principios de gestión de datos • Se necesita planificación para administrar los datos: Incluso las organizaciones pequeñas pueden tener entornos de procesos comerciales y técnicos complejos. Los datos se crean en muchos lugares y se mueven entre lugares para su uso. Coordinar el trabajo y mantener alineados los resultados finales requiere una planificación desde una perspectiva arquitectónica y de procesos. • La gestión de datos es multifuncional; Requiere una variedad de habilidades y experiencia: Un solo equipo no puede administrar todos los datos de una organización. La gestión de datos requiere habilidades técnicas y no técnicas y la capacidad de colaborar. Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 32. 28 • DMBOK2 • La gestión de datos requiere una perspectiva empresarial: La gestión de datos tiene aplicaciones locales, pero debe aplicarse en toda la empresa para que sea lo más eficaz posible. Esta es una de las razones por las que la gestión de datos y el gobierno de datos están entrelazados. • La gestión de datos debe tener en cuenta una variedad de perspectivas: Los datos son fluidos. La gestión de datos debe evolucionar constantemente para mantenerse al día con las formas en que se crean y utilizan los datos y los consumidores de datos que los utilizan. • La gestión de datos es la gestión del ciclo de vida: Los datos tienen un ciclo de vida y la gestión de datos requiere gestionar su ciclo de vida. Dado que los datos generan más datos, el ciclo de vida de los datos en sí mismo puede ser muy complejo. Las prácticas de gestión de datos deben tener en cuenta el ciclo de vida de los datos. • Los diferentes tipos de datos tienen diferentes características de ciclo de vida: Y por esta razón, tienen diferentes requisitos de gestión. Las prácticas de gestión de datos deben reconocer estas diferencias y ser lo suficientemente flexibles para cumplir con los diferentes tipos de requisitos del ciclo de vida de los datos. • La gestión de datos incluye la gestión de los riesgos asociados con los datos: Además de ser un activo, los datos también representan un riesgo para una organización. Los datos pueden perderse, ser robados o mal utilizados. Las organizaciones deben considerar las implicaciones éticas de su uso de datos. Los riesgos relacionados con los datos deben gestionarse como parte del ciclo de vida de los datos. • Los requisitos de gestión de datos deben impulsar las decisiones sobre tecnología de la información: La gestión de datos y datos está profundamente entrelazada con la tecnología de la información y la gestión de la tecnología de la información. La gestión de datos requiere un enfoque que garantice que la tecnología atienda, en lugar de impulsar, las necesidades estratégicas de datos de una organización. • La gestión eficaz de los datos requiere el compromiso de los líderes: La gestión de datos implica un conjunto complejo de procesos que, para ser eficaces, requieren coordinación, colaboración y compromiso. Llegar allí requiere no solo habilidades de gestión, sino también la visión y el propósito que provienen de un liderazgo comprometido. 2.5 Desafíos de la gestión de datos Debido a que la gestión de datos tiene características distintas derivadas de las propiedades de los datos en sí, también presenta desafíos para seguir estos principios. Los detalles de estos desafíos se discuten en las Secciones 2.5.1 a 2.5.13. Muchos de estos desafíos se refieren a más de un principio. 2.5.1 Los datos difieren de otros activos4 Los activos físicos se pueden señalar, tocar y mover. Pueden estar en un solo lugar a la vez. Los activos financieros deben contabilizarse en un balance. Sin embargo, los datos son diferentes. Los datos no son tangibles. Sin embargo, es duradero; eso 4 Esta sección se deriva de Redman, Thomas. Calidad de datos para la era de la información ( 1996) págs. 41-42, 232-36; y Impulsado por datos (2008), Capítulo Uno, "Las maravillosas y peligrosas propiedades de los datos y la información". Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 33. GESTIÓN DE DATOS • 29 no se desgasta, aunque el valor de los datos a menudo cambia a medida que envejecen. Los datos son fáciles de copiar y transportar. Pero no es fácil de reproducir si se pierde o se destruye. Debido a que no se consume cuando se usa, incluso se puede robar sin que se haya ido. Los datos son dinámicos y pueden usarse para múltiples propósitos. Los mismos datos pueden incluso ser utilizados por varias personas al mismo tiempo, algo que es imposible con activos físicos o financieros. Muchos usos de los datos generan más datos. La mayoría de las organizaciones deben gestionar volúmenes crecientes de datos y la relación entre conjuntos de datos. Estas diferencias dificultan la asignación de un valor monetario a los datos. Sin este valor monetario, es difícil medir cómo los datos contribuyen al éxito organizacional. Estas diferencias también plantean otros problemas que afectan la gestión de datos, como definir la propiedad de los datos, hacer un inventario de cuántos datos tiene una organización, protegerse contra el uso indebido de los datos, gestionar el riesgo asociado con la redundancia de datos y definir y hacer cumplir los estándares de calidad de los datos. A pesar de los desafíos para medir el valor de los datos, la mayoría de la gente reconoce que los datos, de hecho, tienen valor. Los datos de una organización son únicos en sí mismos. Si se perdieran o destruyeran datos únicos de la organización (como listas de clientes, inventarios de productos o historial de reclamaciones), reemplazarlos sería imposible o extremadamente costoso. Los datos también son el medio por el cual una organización se conoce a sí misma: es un metaactivo que describe otros activos. Como tal, proporciona la base para el conocimiento organizacional. Dentro de las organizaciones y entre ellas, los datos y la información son esenciales para realizar negocios. La mayoría de las transacciones comerciales operativas implican el intercambio de información. La mayor parte de la información se intercambia electrónicamente, creando un rastro de datos. Este rastro de datos puede servir para propósitos además de marcar los intercambios que han tenido lugar. Puede proporcionar información sobre cómo funciona una organización. Debido al importante papel que desempeñan los datos en cualquier organización, es necesario administrarlos con cuidado. 2.5.2 Valoración de datos Valor es la diferencia entre el costo de una cosa y el beneficio derivado de esa cosa. Para algunos activos, como las acciones, calcular el valor es fácil. Es la diferencia entre lo que costaba la acción cuando se compró y para qué se vendió. Pero para los datos, estos cálculos son más complicados, porque ni los costos ni los beneficios de los datos están estandarizados. Dado que los datos de cada organización son únicos en sí mismos, un enfoque para la valoración de datos debe comenzar articulando categorías generales de costos y beneficios que se pueden aplicar de manera consistente dentro de una organización. Las categorías de muestra incluyen 5: • • • • • Costo de obtener y almacenar datos Costo de reemplazar los datos si se perdieran Impacto en la organización si faltaran datos Costo de la mitigación de riesgos y costo potencial de los riesgos asociados con los datos Costo de mejorar los datos 5 Mientras el DMBOK2 se preparaba para ir a imprenta, otra forma de valorar los datos apareció en las noticias: el ataque de ransomware Wannacry (17 de mayo de 2017) afectó a más de 100.000 organizaciones en 150 países. Los culpables utilizaron el software para mantener los datos como rehenes hasta que las víctimas pagaran un rescate para que sus datos fueran divulgados. http://bit.ly/2tNoyQ7. Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 34. 30 • DMBOK2 • • • • Beneficios de los datos de mayor calidad Qué pagarían los competidores por los datos Por qué se podrían vender los datos Ingresos esperados de usos innovadores de datos Un desafío principal para la valoración de activos de datos es que el valor de los datos es contextual (lo que es valioso para una organización puede no serlo para otra) y, a menudo, temporal (lo que era valioso ayer puede no serlo hoy). Dicho esto, dentro de una organización, es probable que ciertos tipos de datos sean consistentemente valiosos a lo largo del tiempo. Tomemos, por ejemplo, información confiable del cliente. La información del cliente puede incluso volverse más valiosa con el tiempo, a medida que se acumulan más datos relacionados con la actividad del cliente. En relación con la gestión de datos, es fundamental establecer formas de asociar el valor financiero con los datos, ya que las organizaciones necesitan comprender los activos en términos financieros para poder tomar decisiones consistentes. Poner valor en los datos se convierte en la base para poner valor en las actividades de gestión de datos. 6 El proceso de valoración de datos también se puede utilizar como medio de gestión de cambios. Pedir a los profesionales de la gestión de datos y a las partes interesadas a las que apoyan que comprendan el significado financiero de su trabajo puede ayudar a una organización a transformar su comprensión de sus propios datos y, a través de eso, su enfoque de la gestión de datos. 2.5.3 Calidad de los datos Asegurarse de que los datos sean de alta calidad es fundamental para la gestión de datos. Las organizaciones administran sus datos porque quieren usarlos. Si no pueden confiar en él para satisfacer las necesidades comerciales, entonces el esfuerzo de recopilarlo, almacenarlo, protegerlo y permitir el acceso a él se desperdicia. Para garantizar que los datos satisfagan las necesidades comerciales, deben trabajar con los consumidores de datos para definir estas necesidades, incluidas las características que hacen que los datos sean de alta calidad. En gran parte porque los datos se han asociado tan estrechamente con la tecnología de la información, la gestión de la calidad de los datos se ha tratado históricamente como una ocurrencia tardía. Los equipos de TI suelen despreciar los datos que se supone que deben almacenar los sistemas que crean. Probablemente fue un programador quien primero observó 'basura adentro, basura afuera' - y quien sin duda quiso dejarlo así. Pero las personas que quieren utilizar los datos no pueden permitirse el lujo de despreciar la calidad. Por lo general, asumen que los datos son confiables y dignos de confianza, hasta que tienen una razón para dudar de estas cosas. Una vez que pierden la confianza, es difícil recuperarla. La mayoría de los usos de los datos implican aprender de ellos para aplicar ese aprendizaje y crear valor. Los ejemplos incluyen comprender los hábitos de los clientes para mejorar un producto o servicio y evaluar el desempeño organizacional o las tendencias del mercado para desarrollar una mejor estrategia comercial, etc. Los datos de mala calidad tendrán un impacto negativo en estas decisiones. Igual de importante, los datos de mala calidad son simplemente costosos para cualquier organización. Las estimaciones difieren, pero los expertos creen que las organizaciones gastan entre el 10 y el 30% de los ingresos en el manejo de problemas de calidad de datos. IBM calculó el costo de los datos de mala calidad en el 6 Para obtener estudios de casos y ejemplos, consulte Aiken y Billings, Monetización de la gestión de datos ( 2014). Orden 13967 de Ramón Arroyo de 13 de marzo de 2018
  • 35. GESTIÓN DE DATOS • 31 Estados Unidos en 2016 fue de $ 3,1 billones. 7 Muchos de los costos de los datos de mala calidad están ocultos, son indirectos y, por lo tanto, difíciles de medir. Otros, como las multas, son directos y fáciles de calcular. Los costos provienen de: • • Desecho y reelaboración Soluciones provisionales y procesos de corrección ocultos • • • • • • • Ineficiencias organizativas o baja productividad Conflicto organizativo Baja satisfacción laboral Insatisfacción del cliente Costos de oportunidad, incluida la incapacidad de innovar Costos de cumplimiento o multas Costos de reputación Los beneficios correspondientes de los datos de alta calidad incluyen: • • • • • • Experiencia de cliente mejorada Mayor productividad Riesgo reducido Capacidad para actuar sobre las oportunidades Aumento de los ingresos Ventaja competitiva obtenida a partir de conocimientos sobre clientes, productos, procesos y oportunidades. Como implican estos costos y beneficios, la gestión de la calidad de los datos no es un trabajo de una sola vez. La producción de datos de alta calidad requiere planificación, compromiso y una mentalidad que incorpore la calidad a los procesos y sistemas. Todas las funciones de gestión de datos pueden influir en la calidad de los datos, para bien o para mal, por lo que todas deben tenerlo en cuenta a medida que ejecutan su trabajo. (Ver Capítulo 13). 2.5.4 Planificación para obtener mejores datos Como se indicó en la introducción del capítulo, la obtención de valor a partir de los datos no ocurre por accidente. Requiere planificación de muchas formas. Comienza con el reconocimiento de que las organizaciones pueden controlar cómo obtienen y crean datos. Si ven los datos como un producto que crean, tomarán mejores decisiones al respecto a lo largo de su ciclo de vida. Estas decisiones requieren un pensamiento sistémico porque involucran: • • • • Las formas en que los datos conectan los procesos comerciales que de otro modo podrían verse como separados La relación entre los procesos comerciales y la tecnología que los respalda El diseño y la arquitectura de los sistemas y los datos que producen y almacenan Las formas en que los datos podrían usarse para promover la estrategia organizacional 7 Reportado en Redman, Thomas. "Los datos incorrectos cuestan 3 billones de dólares al año". Harvard Business Review. 22 de septiembre de 2016. https://hbr.org/2016/09/bad-data-costs-the-us-3-trillion-per-year. Orden 13967 de Ramón Arroyo de 13 de marzo de 2018