El documento describe la situación actual de la gestión de datos en las organizaciones, la cual se caracteriza por la dispersión de la información en silos desconectados. Se propone la implementación de un repositorio único de datos que permita integrar toda la información de la organización y facilitar el análisis de datos. Como ejemplo, se presenta el caso del Instituto Nacional Electoral de México, donde se logró integrar 43 fuentes de datos históricas en un solo repositorio, generando 578 indicadores y permitiendo realizar análisis en tiempo récord.
8. Problemática actual
No acumulamos datos de
los sistemas productivos y
no podemos compararlos
con los históricos
2) Desconectados del
pasado y presente
Las decisiones se
toman basado en las
personas y no en los
datos
3) Decisiones basadas en
supuestos no en hechos
Nuestras decisiones se
quedan en tableros o
reportes pero no
modifican la operación
4) Incapacidad en
analítica operacional
Cada área maneja su
propia información y
analíticos sin vínculo
con otras áreas
1) Información
dispersa en silos
10. A
B
C
D
C
B
A
Alrededor del 80% del tiempo de
un proyecto se ocupa en recopilar y
preparar los datos.
¿Por qué?
La mayor parte del tiempo y
esfuerzo en proyectos de ciencia de
datos se dedica a crear, limpiar y
actualizar los registros analíticos.
Los Datos están en el centro de todos
los proyectos de ciencia de datos.
E
Lograr la gobernabilidad de los
datos integrando gestores de
procesos de negocio y tecnología
demanda un gran esfuerzo
11. ¿Qué hacer?
1) Estrategia
2) Implementación
2) Diagnóstico
4) Operación
• Diseñar una estrategia y visión del
proyecto.
• Generar un diagnóstico actual de la
organización: fuentes, infraestructura,
personal.
• Ejecutar la implementación de un
repositorio único, componentes
analíticos y herramientas de visualización
• Iniciar la integración de las fuentes de
datos a partir de la extracción,
transformación y carga
13. ¿Cómo integrar la información?
Análisis de
requerimientos: se
identifican preguntas,
indicadores,
perspectivas y se
genera un modelo
conceptual.
Se elige el modelo
lógico, se crean las
tablas de
dimensiones y
hechos y uniones.
Una vez cargada
información en el
repositorio se pueden
conectar herramientas
de visualización
Orientación al
negocio
Modelo Lógico VisualizacionesAnálisis de
Procesamiento de
Transacciones
Se conforman
indicadores, se
establecen
correspondencias,
nivel de granularidad
y se amplia el
modelo conceptual.
Integración de
datos
Se realizan las
cargas iniciales de
datos y se
configuran las
políticas de
actualización
14. Pasos a seguir
Equipo de trabajo
Infraestructura
Marco de referencia
Identificación
14
Identificar las
herramientas idóneas a
tu empresa, sea open
source o comercial que
facilite su
implementación acorde
a tu presupuesto.
Diseñar e implementar
una infraestructura
acorde a las
capacidades y
necesidades de la
organización.
Acompañarse de
metodologías y marcos
de referencia que
permitan evaluar el
grado de madurez
analítica que se va
implantando en la
organización.
Integrar un equipo de
trabajo que dé
continuidad al proyecto
para su gestión,
implementación y
operación.
17. Información cargada
Para el Instituto Nacional Electoral fueron cargadas en un repositorio único fuentes de datos de
diferentes silos y bases de datos históricas desde 2012 a 2018: Credencialización, Organización
Electoral, Transmisión de Spots en Radio y Televisión, Capacitación Electoral, Resultados
Electorales, Demografía y Población, Cartografía, Coberturas de Radio y Televisión e INEGI
Se integraron 43 fuentes
incluyendo históricos de
2012 a la fecha
Se concentraron más
de 700 millones de
registros integrados
Se fusionaron 11 silos Se generaron 578
indicadores
18. Gestión de analíticos
Hoy en día tiene
capacidad analítica para
realizar analíticos en
tiempos record, incluso en
menos de una semana.
Hoy tienen más
de 1,000 análisis
implementados
19. Consultar información de periodos
prolongados (2011 a 2019).
Consulta histórica
01
•Tableros de control
•Gráficas y mapas
•Predicciones
Análisis estadístico
02
Información inmediata de respuestas
críticas en analíticos como servicio
Respuesta inmediata
03
Generación de reportes antes
imposibles de generar
Reportes complejos
04
Una persona pueden generar
informes y gráficos de manera
sencilla.
Reducción de esfuerzo
05
Es posible vincular diferentes variables:
tiempo, actores, etapas de proceso,
geografía electoral cobertura
Cruce de información
06
Mejoras obtenidas
20. El éxito en el uso de analíticos va más allá de hacer
uso de ellos, fomentar el uso de repositorios otorga
un beneficio y valor aún mayor a la organización.