SlideShare una empresa de Scribd logo
Calidad de datos:
conceptos y métodos
David Moner
damoca@veratech.es
Calidad de datos
• Un uso (o reúso) adecuado de los datos de salud pasa por asegurar la
calidad de dichos datos.
• ¿En qué consiste?
• Los datos representan correctamente la realidad a la que se refieren
• Los datos son los adecuados para el uso esperado
• El uso de datos de baja calidad puede tener consecuencias directas sobre
el proceso de atención de los pacientes, las investigaciones clínicas o la
gestión sanitaria.
Calidad de datos: conceptos y métodos - VeraTech for Health 2
Calidad de datos
• Tradicionalmente se evalúa la calidad de los datos según diferentes dimensiones. Proponemos siete:
• Unicidad: ¿Existen datos replicados?
• Completitud: ¿Faltan datos?
• Consistencia: ¿Los datos cumplen con las reglas estrablecidas (tipos, rangos, ocurrencias, etc.)?
• Corrección: ¿Existen datos anómalos?
• Estabilidad Temporal: ¿Existe variabilidad en los datos a lo largo del tiempo?
• Estabilidad Multifuente: ¿Existe variabilidad en los datos en función de su origen o fuente (hospitales,
departamentos, profesionales, etc.)?
• Valor Predictivo: ¿Puedo utilizar alguna variable de mis datos para construir un sistema de ayuda a la decisión?
Calidad de datos: conceptos y métodos - VeraTech for Health 3
¿Cómo podemos definir un patrón de
calidad de datos?
1. Definiendo completamente el modelo de información sanitaria
• It’s the archetypes, stupid!
• Generamos Schematron a partir de los arquetipos para evaluar las reglas de calidad
• Completitud, consistencia
2. Aplicando métodos estadísticos
• Por ejemplo, en una métrica estabilidad multifuente se mide disimilaridad de una fuente
de datos con una tendencia central global del conjunto de todas las fuentes
• Corrección, estabilidad temporal, estabilidad multifuente, valor predictivo
Calidad de datos: conceptos y métodos - VeraTech for Health 4
qualize
• VeraTech ha desarrollado qualize como nuestro marco de referencia para
la evaluación de la calidad de datos
Calidad de datos: conceptos y métodos - VeraTech for Health 5
www.qualize.net
qualize – Dimensión de completitud
• Comprobamos la existencia o no de cada atributo de los datos
• Es un problema complejo cuando tratamos con estructuras de datos anidadas y
multivaluadas.
Calidad de datos: conceptos y métodos - VeraTech for Health 6
qualize – Dimensión de consistencia
• Evaluamos todas las restricciones del arquetipo, incluyendo tipos de
datos, rangos, ocurrencias, cardinalidad, subconjuntos terminológicos…
Calidad de datos: conceptos y métodos - VeraTech for Health 7
qualize – Dimensión de consistencia
Calidad de datos: conceptos y métodos - VeraTech for Health 8
• Para la evaluación de valores codificados, podemos comprobar la
pertenencia de un código de los datos dentro de un subconjunto
• Definido utilizando SNOMED CT Expression Language
• Evaluado utilizando los servicios de VeraTech SNQuery
• También podemos definir reglas complejas de consistencia
• En el futuro se incorporarán reglas de consistencia propias del dominio
sanitario.
• Ej. comprobar la correspondencia entre un texto natural y su codificación.
qualize – Dimensión de estabilidad
multifuente
• Ejemplo de implantación de la dimension de variabilidad multifuente
Calidad de datos: conceptos y métodos - VeraTech for Health 9
No se indican campos
identificadores
No se indica variable
multifuente
No se indica variable
a predecir
No se indica variable
temporal
No se indica ningún
tipo
Fig.1: Sin ninguna configuración Fig.2: Configuración completa
Con una configuración
más restrictiva: más
reglas, más campos
obligatorios, etc.
Una configuración más
estricta podría empeorar los
resultados, pero serían de
más calidad asegurada
La importancia de la configuración
Calidad y normalización
• Normalización de datos
• Limpieza de datos
(transformaciones y filtros)
• Evaluación de la calidad de
datos
• Detección de errores
Calidad de datos: conceptos y métodos - VeraTech for Health 11
Preguntas / Debate
Calidad de datos: conceptos y métodos - VeraTech for Health 12
David Moner
damoca@veratech.es

Más contenido relacionado

Similar a Calidad de datos: conceptos y métodos

Introducción a openEHR en español
Introducción a openEHR en españolIntroducción a openEHR en español
Introducción a openEHR en español
Pablo Pazos
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
John Bulla
 
Reglas de integridad
Reglas de integridadReglas de integridad
Reglas de integridad
Memo Wars
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
renfer64
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
AnonymousEoGAaTF
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
jorgehernandez928
 
Revista de metodologia cuantitativa
Revista de metodologia cuantitativaRevista de metodologia cuantitativa
Revista de metodologia cuantitativa
AntonellaMarchn1
 
Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...
Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...
Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...
Jesús Bucarito
 
Pruebas de Selección para Cargos de Data Scientist
Pruebas de Selección para Cargos de Data ScientistPruebas de Selección para Cargos de Data Scientist
Pruebas de Selección para Cargos de Data Scientist
Inteligencia Artificial Chile
 
Datalogía - Módulo 3 - Convertir los Datos en Variables
Datalogía - Módulo 3 - Convertir los Datos en VariablesDatalogía - Módulo 3 - Convertir los Datos en Variables
Datalogía - Módulo 3 - Convertir los Datos en Variables
Centro Regional Productividad del Tolima .
 
Insight2011 (1).pptx
Insight2011 (1).pptxInsight2011 (1).pptx
Insight2011 (1).pptx
ElenitaLombana
 
Integridad de datos
Integridad de datosIntegridad de datos
Integridad de datosestudiante
 
sistemas de informacion
sistemas de informacionsistemas de informacion
sistemas de informacion
albeto palmezano
 
Módulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptx
Módulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptxMódulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptx
Módulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptx
uribefernando485
 
PRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptx
PRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptxPRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptx
PRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptx
Carlos Yañez Serrano
 
MSA Clase (3).pptx
MSA Clase (3).pptxMSA Clase (3).pptx
MSA Clase (3).pptx
KevinFlores74022
 
Material de Referencia Certificado
Material de Referencia CertificadoMaterial de Referencia Certificado
Material de Referencia Certificado
José Miguel Barrionuevo
 
openEHR: aspectos de interoperabilidad y mantenibilidad
openEHR: aspectos de interoperabilidad y mantenibilidadopenEHR: aspectos de interoperabilidad y mantenibilidad
openEHR: aspectos de interoperabilidad y mantenibilidad
Pablo Pazos
 

Similar a Calidad de datos: conceptos y métodos (20)

Introducción a openEHR en español
Introducción a openEHR en españolIntroducción a openEHR en español
Introducción a openEHR en español
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
Reglas de integridad
Reglas de integridadReglas de integridad
Reglas de integridad
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
 
Revista de metodologia cuantitativa
Revista de metodologia cuantitativaRevista de metodologia cuantitativa
Revista de metodologia cuantitativa
 
Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...
Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...
Sistemas de la calidad con base en las técnicas o herramientas estadísticas j...
 
Pruebas de Selección para Cargos de Data Scientist
Pruebas de Selección para Cargos de Data ScientistPruebas de Selección para Cargos de Data Scientist
Pruebas de Selección para Cargos de Data Scientist
 
María pinto
María pintoMaría pinto
María pinto
 
Datalogía - Módulo 3 - Convertir los Datos en Variables
Datalogía - Módulo 3 - Convertir los Datos en VariablesDatalogía - Módulo 3 - Convertir los Datos en Variables
Datalogía - Módulo 3 - Convertir los Datos en Variables
 
Insight2011 (1).pptx
Insight2011 (1).pptxInsight2011 (1).pptx
Insight2011 (1).pptx
 
Integridad de datos
Integridad de datosIntegridad de datos
Integridad de datos
 
sistemas de informacion
sistemas de informacionsistemas de informacion
sistemas de informacion
 
Módulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptx
Módulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptxMódulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptx
Módulo I_Curso diseño e implementación de las evaluaciones_26.09.2022.pptx
 
PRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptx
PRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptxPRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptx
PRUEBAS Y TEST ESTANDARIZADOS Y NO ESTANDARIZADOS.pptx
 
Encuentro 2
Encuentro 2Encuentro 2
Encuentro 2
 
MSA Clase (3).pptx
MSA Clase (3).pptxMSA Clase (3).pptx
MSA Clase (3).pptx
 
Material de Referencia Certificado
Material de Referencia CertificadoMaterial de Referencia Certificado
Material de Referencia Certificado
 
openEHR: aspectos de interoperabilidad y mantenibilidad
openEHR: aspectos de interoperabilidad y mantenibilidadopenEHR: aspectos de interoperabilidad y mantenibilidad
openEHR: aspectos de interoperabilidad y mantenibilidad
 

Más de David Moner Cano

Archetype Modeling Methodology
Archetype Modeling MethodologyArchetype Modeling Methodology
Archetype Modeling Methodology
David Moner Cano
 
Data reuse and quality evaluation in archetype-based environments
Data reuse and quality evaluation in archetype-based environmentsData reuse and quality evaluation in archetype-based environments
Data reuse and quality evaluation in archetype-based environments
David Moner Cano
 
Ehr models, standards and semantic interoperability
Ehr models, standards and semantic interoperabilityEhr models, standards and semantic interoperability
Ehr models, standards and semantic interoperability
David Moner Cano
 
Evolución de la norma UNE-EN 13606
Evolución de la norma UNE-EN 13606Evolución de la norma UNE-EN 13606
Evolución de la norma UNE-EN 13606
David Moner Cano
 
Archetype-based data transformation with LinkEHR
Archetype-based data transformation with LinkEHRArchetype-based data transformation with LinkEHR
Archetype-based data transformation with LinkEHR
David Moner Cano
 
Standardised and Flexible Health Data Management with an Archetype Driven EHR...
Standardised and Flexible Health Data Management with an Archetype Driven EHR...Standardised and Flexible Health Data Management with an Archetype Driven EHR...
Standardised and Flexible Health Data Management with an Archetype Driven EHR...
David Moner Cano
 
CEN EN13606 Normalisation Framework
CEN EN13606 Normalisation FrameworkCEN EN13606 Normalisation Framework
CEN EN13606 Normalisation Framework
David Moner Cano
 
Implementation of a CEN/ISO 13606 Platform for Medicines Reconciliation
Implementation of a CEN/ISO 13606 Platform for Medicines ReconciliationImplementation of a CEN/ISO 13606 Platform for Medicines Reconciliation
Implementation of a CEN/ISO 13606 Platform for Medicines Reconciliation
David Moner Cano
 

Más de David Moner Cano (8)

Archetype Modeling Methodology
Archetype Modeling MethodologyArchetype Modeling Methodology
Archetype Modeling Methodology
 
Data reuse and quality evaluation in archetype-based environments
Data reuse and quality evaluation in archetype-based environmentsData reuse and quality evaluation in archetype-based environments
Data reuse and quality evaluation in archetype-based environments
 
Ehr models, standards and semantic interoperability
Ehr models, standards and semantic interoperabilityEhr models, standards and semantic interoperability
Ehr models, standards and semantic interoperability
 
Evolución de la norma UNE-EN 13606
Evolución de la norma UNE-EN 13606Evolución de la norma UNE-EN 13606
Evolución de la norma UNE-EN 13606
 
Archetype-based data transformation with LinkEHR
Archetype-based data transformation with LinkEHRArchetype-based data transformation with LinkEHR
Archetype-based data transformation with LinkEHR
 
Standardised and Flexible Health Data Management with an Archetype Driven EHR...
Standardised and Flexible Health Data Management with an Archetype Driven EHR...Standardised and Flexible Health Data Management with an Archetype Driven EHR...
Standardised and Flexible Health Data Management with an Archetype Driven EHR...
 
CEN EN13606 Normalisation Framework
CEN EN13606 Normalisation FrameworkCEN EN13606 Normalisation Framework
CEN EN13606 Normalisation Framework
 
Implementation of a CEN/ISO 13606 Platform for Medicines Reconciliation
Implementation of a CEN/ISO 13606 Platform for Medicines ReconciliationImplementation of a CEN/ISO 13606 Platform for Medicines Reconciliation
Implementation of a CEN/ISO 13606 Platform for Medicines Reconciliation
 

Último

EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
PABLOCESARGARZONBENI
 
Diagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestreDiagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestre
DiegoCampos433849
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
DanielErazoMedina
 
Robótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptxRobótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptx
44652726
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
JulyMuoz18
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
CrystalRomero18
 
Conceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. TecnologíaConceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. Tecnología
coloradxmaria
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
SamuelRamirez83524
 
Alan Turing Vida o biografía resumida como presentación
Alan Turing Vida o biografía resumida como presentaciónAlan Turing Vida o biografía resumida como presentación
Alan Turing Vida o biografía resumida como presentación
JuanPrez962115
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
AlejandraCasallas7
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
ItsSofi
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
cj3806354
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
cdraco
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
jjfch3110
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
rafaelsalazar0615
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
Emilio Casbas
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
cofferub
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
cristianrb0324
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
zoecaicedosalazar
 

Último (20)

EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
 
Diagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestreDiagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestre
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
 
Robótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptxRobótica educativa para la eduacion primaria .pptx
Robótica educativa para la eduacion primaria .pptx
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
 
Conceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. TecnologíaConceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. Tecnología
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
 
Alan Turing Vida o biografía resumida como presentación
Alan Turing Vida o biografía resumida como presentaciónAlan Turing Vida o biografía resumida como presentación
Alan Turing Vida o biografía resumida como presentación
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
 

Calidad de datos: conceptos y métodos

  • 1. Calidad de datos: conceptos y métodos David Moner damoca@veratech.es
  • 2. Calidad de datos • Un uso (o reúso) adecuado de los datos de salud pasa por asegurar la calidad de dichos datos. • ¿En qué consiste? • Los datos representan correctamente la realidad a la que se refieren • Los datos son los adecuados para el uso esperado • El uso de datos de baja calidad puede tener consecuencias directas sobre el proceso de atención de los pacientes, las investigaciones clínicas o la gestión sanitaria. Calidad de datos: conceptos y métodos - VeraTech for Health 2
  • 3. Calidad de datos • Tradicionalmente se evalúa la calidad de los datos según diferentes dimensiones. Proponemos siete: • Unicidad: ¿Existen datos replicados? • Completitud: ¿Faltan datos? • Consistencia: ¿Los datos cumplen con las reglas estrablecidas (tipos, rangos, ocurrencias, etc.)? • Corrección: ¿Existen datos anómalos? • Estabilidad Temporal: ¿Existe variabilidad en los datos a lo largo del tiempo? • Estabilidad Multifuente: ¿Existe variabilidad en los datos en función de su origen o fuente (hospitales, departamentos, profesionales, etc.)? • Valor Predictivo: ¿Puedo utilizar alguna variable de mis datos para construir un sistema de ayuda a la decisión? Calidad de datos: conceptos y métodos - VeraTech for Health 3
  • 4. ¿Cómo podemos definir un patrón de calidad de datos? 1. Definiendo completamente el modelo de información sanitaria • It’s the archetypes, stupid! • Generamos Schematron a partir de los arquetipos para evaluar las reglas de calidad • Completitud, consistencia 2. Aplicando métodos estadísticos • Por ejemplo, en una métrica estabilidad multifuente se mide disimilaridad de una fuente de datos con una tendencia central global del conjunto de todas las fuentes • Corrección, estabilidad temporal, estabilidad multifuente, valor predictivo Calidad de datos: conceptos y métodos - VeraTech for Health 4
  • 5. qualize • VeraTech ha desarrollado qualize como nuestro marco de referencia para la evaluación de la calidad de datos Calidad de datos: conceptos y métodos - VeraTech for Health 5 www.qualize.net
  • 6. qualize – Dimensión de completitud • Comprobamos la existencia o no de cada atributo de los datos • Es un problema complejo cuando tratamos con estructuras de datos anidadas y multivaluadas. Calidad de datos: conceptos y métodos - VeraTech for Health 6
  • 7. qualize – Dimensión de consistencia • Evaluamos todas las restricciones del arquetipo, incluyendo tipos de datos, rangos, ocurrencias, cardinalidad, subconjuntos terminológicos… Calidad de datos: conceptos y métodos - VeraTech for Health 7
  • 8. qualize – Dimensión de consistencia Calidad de datos: conceptos y métodos - VeraTech for Health 8 • Para la evaluación de valores codificados, podemos comprobar la pertenencia de un código de los datos dentro de un subconjunto • Definido utilizando SNOMED CT Expression Language • Evaluado utilizando los servicios de VeraTech SNQuery • También podemos definir reglas complejas de consistencia • En el futuro se incorporarán reglas de consistencia propias del dominio sanitario. • Ej. comprobar la correspondencia entre un texto natural y su codificación.
  • 9. qualize – Dimensión de estabilidad multifuente • Ejemplo de implantación de la dimension de variabilidad multifuente Calidad de datos: conceptos y métodos - VeraTech for Health 9
  • 10. No se indican campos identificadores No se indica variable multifuente No se indica variable a predecir No se indica variable temporal No se indica ningún tipo Fig.1: Sin ninguna configuración Fig.2: Configuración completa Con una configuración más restrictiva: más reglas, más campos obligatorios, etc. Una configuración más estricta podría empeorar los resultados, pero serían de más calidad asegurada La importancia de la configuración
  • 11. Calidad y normalización • Normalización de datos • Limpieza de datos (transformaciones y filtros) • Evaluación de la calidad de datos • Detección de errores Calidad de datos: conceptos y métodos - VeraTech for Health 11
  • 12. Preguntas / Debate Calidad de datos: conceptos y métodos - VeraTech for Health 12 David Moner damoca@veratech.es