Este documento proporciona una introducción a la regresión logística múltiple. Explica conceptos clave como variables dependientes e independientes y cómo se usa un modelo de regresión logística para predecir la probabilidad de un evento basado en múltiples factores de riesgo. También cubre cómo interpretar los resultados y evaluar el ajuste del modelo. La regresión logística múltiple permite analizar la asociación entre una variable dicotómica y múltiples predictores.
1. Regresión Logistica
Dr. Juan de Dios Díaz Rosales
Cirugía General y Endoscopia Gastrointestinal
Universidad Autónoma de Ciudad Juárez
2. Glosario
• Variable dependiente: es la variable que refleja la ocurrencia o no del
suceso. Esta influenciada en función de otras variables, las llamadas
variables explicativas. Pueden ser cuantitativas o cualitativas. También
reciben el nombre de «variables de resultado».
• Variable independiente: es la variable que pretende explicar la
variable dependiente. También reciben el nombre de «variables
predictoras», «variables explicativas» o «covariables». Al igual que las
variables dependientes pueden ser cuantitativas o cuantitativas.
3. Glosario
• Variable dummy: son variables artificiales o ficticias, creadas a partir
de la información de una variable independiente, para poder realizar
operaciones matemáticas con ellas. De la variable original se pueden
crear múltiples variables dummy.
• Proporción: es un cociente cuyo numerador está incluido en el
denominador. Carece de unidades y sus valores oscilan entre O y 1.
Pueden expresarse en tantos por uno, porcentajes, tantos por mil,
etc.
4. Glosario
• Razón, Ratio: es un cociente cuyo numerador no está incluido en el
denominador. Tengamos en cuenta que no existen restricciones en el
rango de sus valores.
• Odds: se trata de una razón en la que el numerador es la probabilidad
(p) de que ocurra un suceso y en el denominador es la probabilidad
de que tal suceso no ocurra (1-p). Es un caso particular de una razón.
También recibe el nombre de «ventaja» o «razón de complementos».
5. Glosario
• Odds Ratio (OR): es el cociente o razón entre dos odds y carece de unidades de
medida. El OR no tiene interpretación absoluta, siempre es relativa. Para poder
interpretar una OR, es necesario siempre tener en cuenta cuál es el factor o
variable predictora que se estudia y cuál es el resultado o desenlace. El valor nulo
para la OR es el 1, esto implica que las dos categorías comparadas son iguales.
También recibe el nombre de «razón de odds» o «razón de ventajas».
• Riesgo relativo (RR): es la relación entre la incidencia dentro del grupo expuesto
y la incidencia dentro del grupo no expuesto. El riesgo relativo es pues la medida
del papel etiológico del factor de riesgo. La denominación riesgo relativo se debe
a que es la relación entre dos riesgos (expuestos y no expuestos). Si el RR es 1, el
factor estudiado no tiene papel causal. Para su cálculo es preciso conocer la
incidencia, ya que ésta mide los casos nuevos en una población durante cierto
período.
6. Glosario
• Intervalo de Confianza (IC) Confidence Interval (CI): es el intervalo
dentro del que se encuentra la verdadera magnitud del efecto, nunca
conocida exactamente, con un grado prefijado de seguridad. A
menudo se habla de «intervalo de confianza al 95%» o «límites de
confianza al 95%». Quiere decir que dentro de ese intervalo se
encontraría el verdadero valor en el 95% de los casos.
7. Introducción
• Predecir o explicar un evento en el que se tomen en cuenta diferentes
factores de riesgo o pronóstico.
• Predecir el desarrollo de infección de sitio quirúrgico a partir de
múltiples variables: DM2, EPOC, edad, etc.
• Cada variable se aporta un valor en un modelo matemático de
predicción: regresión logística múltiple.
8. Introducción
• Variable dependiente o resultado
• Presencia (Infección de Sitio Quirúrgico)
• Ausencia (Sin Infección)
• Variables independientes o predictoras
• Edad
• EPOC
• DM2
• HTA
• Etc.
9. Regresión Logística Múltiple
• Puede incluir variables continuas, ordinales o categóricas
• Las X son variables son posibles predictoras de Y
• La relación de las variables (X) debe ser clara y permitir que se
establezcan los factores de riesgo que puedan producir una
enfermedad (Y)
• Estas variables no solo actuan como factores de riesgo, tambien
pueden funcionar como factores de protección
10. Regresión Logística Múltiple
• Variable dependiente o Y
• Dicotómica
• Mutuamente excluyente
• Se codifica con 0 (ausencia) y 1
(presencia)
• Ej., ISQ tiene o no tiene
• Variable independiente o X
• No dependen de la presencia de Y
• Ej., la presencia de ISQ no es un
factor de riesgo para DM2 o EPOC
11. Número de Evento por Variable
• Se incluyen 10 a 20 casos/individuos por grupo por variable
• Ej., variable dependiente ISQ con 47 eventos en 121 pacientes,
deberíamos incluir en el modelo de regresión no más de cuatro
variables (47/10 = 4.7)
• Esta estrategia se utiliza para estabilizar los datos
• En caso de incluir más variables, los datos se podran volver inestables
y podemos obtener resultados estadísticamente significativos , sin
que en realidad lo sean
12. Como interpretar la RL
• Resultado del 0 al infinito
• Resultado del 0 al 1 = factor protector
• Resultado del 1 0 mayor = factor de riesgo
• OR = 0.6 = 1 – 0.6 = 0.4 x 100 = 40% de protección
• OR = 3.6 = 3.6 veces más de riesgo de padecer el fenomeno estudiado
13. Como interpretar la RL
• Como se interpretan los
resultados
• RM = 9.05 (IC 95%, 2.44 – 23.76)
• Los pacientes con diabetes tiene
9.05 veces más riesgo de
complicarse con sepsis si durante
una colonoscopia se perfora el
colon.
• Una vez realizado el modelo
multivariado, se pueden eliminar
aquella variables que no tiene
significancia o que tengan el
valor de p más elevado, con esto
se mejora el % de efectividad en
un 70%
• Se recomienda no eliminar las
variables con “lógica biológica”…
14.
15. Prueba de Hosmer-Lemeshow
• Es una prueba de bondad de ajuste
• Esta prueba analiza la presencua del evento contra la frecuencia
esperada (probabilidad de ISQ <10%, <20%, y hasta el 10%)
• Ambas distribuciones, la esperada y la observada, se contrastan con
la prueba de X2
Dados los resultados se puede inferir que no existe
estadísticamente significatica entre la distribucion esperada
y la que predice nuestro modelo, po lo que se puede
considerar como adecuado para establecer el riesgo de
ocurrencia del evento
16. Recomendaciones
• Realizar un análisis bivariante entre la variable dependiente (Y) y cada
una de las varaibles independientes (X), de “una en una”
• Aquellas variables independeintes (X) que muestren una asoociación
estadísticamente significativa con la varaible dependiente (Y) deberán
ser incluidas en el modelo multivariante
17. Conclusiones
• En la clínica no existe un modelo unicausal, sino que siempre hay
mútliples causas y estas tiene distinto peso
• Variable dependiente siempre debera ser dicotómica y excluyente
• Varaibles independeintes puedes ser de cualquier tipo: cualitativas o
cuantitativas