Daedalus desarrolla tecnología para extraer significado de contenidos no estructurados. En el sector de e-Salud (e-Sanidad), la tecnología semántica permite explotar automáticamente la información de la Historia Clínica Electrónica (HCE).
Esta presentación cubre la experiencia de Daedalus en:
• Monitorización de contenidos online sobre salud
• Enriquecimiento semántico (etiquetado) de historia clínica
• Anonimización de historias clínicas
• Búsqueda multimedia en historias clínicas
• Detección de interacciones entre medicamentos
• Analítica de texto y de datos en el sector de salud
2. Tecnología de Daedalus en el sector de la Sanidad
DAEDALUS en Sanidad
Daedalus desarrolla tecnología para extraer el significado y
estructurar todo tipo de contenido multimedia.
Nuestros clientes pueden así rentabilizar sus contenidos
automatizando sus procesos.
2
3. Tecnología de Daedalus en el sector de la Sanidad
DAEDALUS en Sanidad
Operaciones
• ¿Cuántos datos estructurados se
procesan de la Historia Clínica
Electrónica? ¿Y con los no
estructurados, qué se hace?
• Aplicaciones:
• Soporte a la codificación ICD9/10,
SNOMED CT, CIMA, …
• Sistemas de ayuda a operadores
humanos: procesos de
codificación (p.ej.: diagnósticos
en partes de alta en urgencias)
No Estructurados Estructurados
3
4. Tecnología de Daedalus en el sector de la Sanidad
DAEDALUS en Sanidad
Monitorización
! En EEUU
4
75%
Internet
Información sobre salud
Redes Sociales
Información sobre salud
42%
5. Tecnología de Daedalus en el sector de la Sanidad
DAEDALUS en Sanidad
Monitorización
! En España
5
6. Tecnología de Daedalus en el sector de la Sanidad
DAEDALUS en Sanidad
Monitorización
! ¿Qué monitorizar?
6
Fármacos
Enfermedades
Reacciones a
medicamentos
7. Tecnología de Daedalus en el sector de la Sanidad
DAEDALUS en Sanidad
Monitorización
! ¿A quién interesa?
7
Farmacéuticas
Centros de Salud
(hospitales, clínicas
privadas)
Administradores de
blogs, foros, …
11. Tecnología de Daedalus en el sector de la Sanidad
AUTOMATIZACIÓN DE
PROCESOS SOBRE HISTORIAS
CLÍNICAS
12. Tecnología de Daedalus en el sector de la Sanidad
! Objetivo: Interoperabilidad semántica
! Elementos:
• Vocabularios: UMLS " SNOMED CT, ICD-9, ICD-10, CIE-9, CIE-10, LOINC
• Arquetipos: modelos clínicos reutilizables, openEHR
• Plantillas: vistas sobre los arquetipos, HL7
• Modelos de Referencia: especificación para la definición de arquetipo, ISO13606
! El tratamiento lingüístico automático ayuda a estructurar la Historia Clínica:
• Etiquetado automático según vocabularios
• Relación de informes clínicos con plantillas
• Tratamiento multiligüe basado en tecnología Daedalus
12
Automatización de procesos sobre HC
13. Tecnología de Daedalus en el sector de la Sanidad
Caso de uso: clasificación automática de informes
médicos
! Ejemplo de aplicación: asignar automáticamente códigos ICD a informes
radiológicos.
• ICD (International Statistical Classification of Diseases and Related Health
Problems), estándar de la Organización Mundial de la Salud
! Objetivo:
• Análisis de la justificación de pruebas médicas para empresas aseguradoras
! Datos del caso:
• Datos de informes de urología de pacientes
• Periodo de 1 año
• 978 documentos y 45 etiquetas ICD-9-CM con 94 combinaciones
• Proporcionado por el Departamento de Radiología del Hospital para Niños de
Cincinnati
13
Automatización de procesos sobre HC
15. Tecnología de Daedalus en el sector de la Sanidad
! Objetivo: Facilitar el análisis y explotación de la información contenida en las
Historias Clínicas.
! Tecnología de procesamiento lingüístico para detección de nombres de personas,
direcciones, teléfonos con el fin de ocultar la identidad de los pacientes en
transacciones médicas.
15
Anonimización de Historias Clínicas
16. Tecnología de Daedalus en el sector de la Sanidad
BÚSQUEDA MULTIMEDIA SOBRE
HISTORIAS CLÍNICAS
17. Tecnología de Daedalus en el sector de la Sanidad
Búsqueda Multimedia sobre Historias Clínicas
Búsqueda de información por voz
! Acceso a la información mediante voz:
• Reconocimiento de voz aplicado a sistemas de búsqueda de datos en historiales
y documentación médica en general.
17
Transcripción
Archivo
Búsqueda
18. Tecnología de Daedalus en el sector de la Sanidad
Búsqueda sobre contenidos en audio o vídeo
! Ejemplo de aplicación:
! DALI, Digital Audio Library Indexing
18
Búsqueda Multimedia sobre Historias Clínicas
19. Tecnología de Daedalus en el sector de la Sanidad
Búsqueda en Historias Clínicas a partir de texto
! Localización de información:
• Ofrece alternativas de búsqueda en situaciones en las que no se obtienen
resultados.
• Construcción de posibles alternativas que corrijan errores ortográficos comunes,
calculando la similitud entre los términos de búsqueda y los términos de indización
y ofreciendo posibilidades de selección al usuario (del tipo “usted quiso decir…”)
• Búsqueda semántica mediante ontologías de dominio como SNOMED.
19
Búsqueda Multimedia sobre Historias Clínicas
20. Tecnología de Daedalus en el sector de la Sanidad
Caso de uso: Búsqueda sobre historias e imágenes
médicas
! Búsquedas sobre una colección de casos médicos compuestos por:
• imágenes (50.000 aprox.)
• descripciones textuales de los casos (en inglés y francés)
! Para buscar se emplean sólo imágenes (radiografías, escáneres …) y, en ocasiones,
texto
! Contexto del trabajo: experimentos en el foro europeo CLEF (Cross Language
Evaluation Forum) de búsqueda de información
20
Búsqueda Multimedia sobre Historias Clínicas
21. Tecnología de Daedalus en el sector de la Sanidad
Caso de uso: Búsqueda sobre historias e imágenes
médicas
! Experimentos en ImageCLEFMed (foro europeo CLEF)
21
Búsqueda Multimedia sobre Historias Clínicas
22. Tecnología de Daedalus en el sector de la Sanidad
Búsqueda Multimedia sobre Historias Clínicas
Caso de uso: Búsqueda sobre historias e imágenes
médicas
22
! Ejemplos de búsqueda multilingüe de información en experimentos ImageCLEFMed
(foro europeo CLEF)
23. Tecnología de Daedalus en el sector de la Sanidad
EXPERIENCIA PILOTO SOBRE
ETIQUETADO DE INFORMES
24. Tecnología de Daedalus en el sector de la Sanidad
Experiencia piloto sobre Etiquetado de Informes
¿Qué hemos hecho?
! Obtener recursos necesarios en el formato adecuado para la infraestructura de
Textalytics. Basado en UMLS.
! Construir un etiquetador, capaz de analizar el texto de entrada, extraer sintagmas
nominales y obtener el código que les corresponde atendiendo a su similitud con las
entradas de los recursos.
! A partir de los informes reales proporcionados por un Hospital, se han transcrito
combinando técnicas OCR con proceso manual, se ha tomado nota de los códigos y
éstos se han empleado para evaluar el prototipo de etiquetador que se muestra a
continuación.
24
25. Tecnología de Daedalus en el sector de la Sanidad
Experiencia piloto sobre Etiquetado de Informes
Recursos lingüísticos
UMLS
Dicc.
ICD9 ES
• Términos en español
• Combinación de SNOMED Inglés – ICD9
inglés y SNOMED español
• Explotación de relaciones semánticas
(same_as) referidas a conceptos
25
26. Tecnología de Daedalus en el sector de la Sanidad
Experiencia piloto sobre Etiquetado de Informes
Recursos lingüísticos
! Filtrado de UMLS para obtener términos en español y el código ICD9 que les
corresponde.
! Filtrado del thesauro resultante, formado por más de 45.000 términos.
! De esos términos y expresiones, muchos son palabras comunes, polisémicas,
que conducen a un sobre-etiquetado. Se filtran apoyándose en los diccionarios
de K-Site Core, quedando en alrededor de 25.000 términos.
! Se emplean datos de frecuencia de aparición de palabras en el thesauro para
filtrar palabras con escaso contenido semántico.
! Se prevé incluir un diccionario adicional con acrónimos y abreviaturas en el
dominio médico.
26
27. Tecnología de Daedalus en el sector de la Sanidad
Arquitectura prototipo
STILUS
Fuzzy
Dicc.
ICD9 ES
STILUS
Core
Preproceso
Texto Entrada Resultado
27
Experiencia piloto sobre Etiquetado de Informes
28. Tecnología de Daedalus en el sector de la Sanidad
Arquitectura solución
STILUS
Fuzzy
Dicc.
ICD9 ES
STILUS
Core
Preproceso
Resultado
Texto Entrada
Reglas y
Patrones
28
Experiencia piloto sobre Etiquetado de Informes
29. Tecnología de Daedalus en el sector de la Sanidad
Arquitectura Solución
! Algunos elementos:
1. Preprocesado:
Análisis lingüístico del texto de entrada mediante Stilus Core para identificar
sintagmas nominales.
2. Reglas
Inferencia para identificar códigos ICD9 mediante caracterizaciones.
Ej.: Si la frase contiene estructuras “número”+”unidad de medida”, al menos
un medicamento y la palabra ‘tratamiento’ entonces le corresponde el código
V58.69
29
Experiencia piloto sobre Etiquetado de Informes
30. Tecnología de Daedalus en el sector de la Sanidad
Experiencia piloto sobre Etiquetado de Informes
Conclusiones
Estudiar necesidades
(¿posibilidad de acotar?
¿secciones del informe? ...)
Aún queda camino por recorrer Obtener reglas según metodología
de etiquetado
Especificar la intervención manual
Precisión inicial en entorno desatendido superior al 60%
30
32. Tecnología de Daedalus en el sector de la Sanidad
Quiénes Somos
! Desde 1998 ofrecemos soluciones, productos y servicios para la sociedad de la
información
! Sociedad anónima de capital nacional privado
! Nuestra principal línea de actividad se centra en la extracción de significado a partir de
contenidos multimedia con el objetivo de rentabilizar al máximo los contenidos
gestionados por nuestros clientes.
! Clientes: grandes empresas en todos los sectores: medios, defensa, telecomunicación,
energía, administración pública…
! Vocación: innovación, con participación activa en proyectos de I+D nacionales y
europeos
32
33. Tecnología de Daedalus en el sector de la Sanidad
DAEDALUS, S.A.
Oficina Central:
López de Hoyos 15
28006 Madrid
Depto. Técnico:
Edificio Vallausa II
Albufera 321
28031 Madrid
Tel: +34 913.32.43.01
info@daedalus.es
http://www.daedalus.es
33