1. 1
Uso de técnicas estadísticas y de inteligencia artificial
para análisis de datos de pacientes de COVID-19
Paul Sebastián Patacho Mungarrieta
Escuela de Ingeniería Industrial Vigo, 25 de Noviembre de 2022
2. 2
AGENDA
• Seguimiento del trabajo realizado
• Definición de Inteligencia Artificial (IA)
• Base de datos de pacientes de COVID-19
• Contexto y preparación
• Algoritmos de IA utilizados
• Resultados
• Conclusiones y discusión
5. La base de
datos
Preparación
Contexto
5
División en cohortes:
Entrenamiento y
evaluación.
Discretización de variables
Origen – Acceso – Temporalidad
Características:
Tamaño muestral
Tipos de variables
Criterios de aceptación
6. Selección de las variables
6
Estudio teórico
de las variables
Estudio
estadístico
Contexto de la
base
de datos
Variables
utilizadas
Variables Predictoras:
1.Edad
2.EPOC
3.Diabetes
4.Temperatura -ºC
5.Saturación de oxígeno (%)
6.Presión arterial media -mmHg
7.Glóbulos blancos por mm3
8.Linfocitos por mm3
9.Plaquetas por mm3
10.AST -U/L
11.ALT -U/L
12.Ferritina -μg/L
13.INR
14.Dímero D -mg/mL
15.Creatinina -mg/dL
16.Nitrógeno Ureico -mg/dL
17.Glucosa -mg/dL
18.Sodio -mmol/L
19.Interleucina-6 -pg/mL
20.Proteína C reactiva -mg/L
21.Troponina -ng/mL
22.Procalcitonina -ng/mL
Sociales: 6
Comorbilidades: 16
Biomarcadores: 19
2
1
16
19
Variable Diana:
Mortalidad
19
5 2
19
1
P<0.05
8. 8
Fortalezas
Interpretabilidad
“La posibilidad de presentar la base subyacente para
la toma de decisiones de una manera comprensible
para seres humanos” -W. James Murdoch
Debilidades
• Compensación sesgo varianza
• Sobreajuste
• Mínimos Locales
10. Gráfico de barras de la importancia de los coeficientes de
la regresión logística
Sensibilidad
1 - Especificidad
Curva ROC
Distribución de la regresión
Punto de corte Índice de Youden
Variables estadísticamente significativas
10
P<0.05
Regresión Logística
PC 0.22
12. Distribución de la regresión
Punto de corte Índice de Youden
Variables estadísticamente significativas
12
P<0.05
Coeficientes:
Regresión Logística
Sensibilidad
1 - Especificidad
PC 0.22
Fallecidos
Probabilidad estimada de muerte
Frecuencia
absoluta
Sobrevivientes
Probabilidad estimada de muerte
Frecuencia
absoluta
13. 13
Histograma de la predicción para los fallecidos
Probabilidad estimada de muerte
Frecuencia
absoluta
Histograma de la predicción para sobrevivientes
Probabilidad estimada de muerte
Frecuencia
absoluta
Originales
Puede consumer mucho tiempo, si no se explica todo lo que se realiza entonces whats the point?
Comentar que esto se divide en mas eestudios y pasos?
N = 4711
Coh Ent: 2357, Coh Ev: 2354
Se realiza una revisión estadística de las cohortes para comprobar que ambas son representaciones no sesgadas de la población.
Las variables se discretizan para representar valores normales y anormales.
Social: Duración de estancia hospitalaria, edad y raza (género)
explain neural network in one minute - Buscar con Google
Se le llama aprendizaje automático al algoritmo detrás de estos modelos que realiza tareas de optimización de una función de coste. Entrenando el modelo
Las debilidades las resolví usando un algoritmo iterativo, que reentrenaba los modelos probando distintos estados iniciales y parámetros. De esta manera se pudo obtener el resultado mas adecuado