19. Regresión logística
INVESTIGACIÓN CLÍNICA
UNIVERSIDAD AUTÓNOMA DE CIUDAD JUÁREZ
Regresión Logística
 La variable dependiente (Y) tiene
2 valores (dicotómica)
 Ausencia / presencia
 Mutuamente excluyente
 Las variables independientes (X) o
predictoras son:
 Continuas (edad)
 Ordinales (estadios)
 Dicotómicas (si/no)
 Este modelo busca explicar o predecir la
probabilidad de que ocurra o no un
evento
 Modelo multivariado
Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
Regresión Logística
Condiciones
 Las variables no aleatorias X (fijas) son
posibles predictoras de Y
 La relación de las variables debe ser
clara y permitir que se establezcan los
factores de riesgo
 Es importante que no se deben utilizar
variables en los casos en los que no se
conoce su relación con la
enfermedad
 Los valores de X (variables fijas) son
independientes
 A La variable dependiente (Y) se le
codifica como 0 o 1
 Odds Ratio . Razón de Momios
 Es el logaritmo de la probabilidad de
que el evento suceda entre la
probabilidad de que no suceda
Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
Condiciones
 Se puede hacer inicialmente
un análisis BIVARIADO para
observar las relaciones
significativas
 El modelo final puede incluir
todas las variables que
demostraron relación con el
resultado (Y)
 Es deseable que cada variable
en el modelo cuente con un
mínimo de 10-20 casos por
cada evento
 Ej., Si tenemos 47 casos de
neumonía en 121 pacientes, no
deberíamos incluir en nuestro
modelo más de 4 variables
(47/10 = 4.7)
Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
Condiciones
 Lo anterior se llama eventos por variable
 Sirve para estabilizar los datos
 En caso de incluir más variables, los datos pueden
volverse inestables y dar resultados falsos
Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
Pasos
 1er paso – hacer una análisis
bivariado con cada una de las
posibles variables involucradas
 Las variables dicotómicas se
contrastan con Chi cuadrada
 Las variables continuas se
contrastan con t de Student
 La medida de asociación es
OR (Exp[β])
 IC 95% (valor mínimo y
máximo)
 Una vez identificadas las
variables que se asocian,
haremos el modelo
multivariado (preselección)
 Eliminando las variables sin
relación
 Eliminando las variables con
mayor p-valor
 Se recomienda no eliminar
variables que tengan lógica
biológica (ej., edad) con el fin
de ajustar el modelo
Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
19. Regresión Logística
19. Regresión Logística

19. Regresión Logística

  • 1.
    19. Regresión logística INVESTIGACIÓNCLÍNICA UNIVERSIDAD AUTÓNOMA DE CIUDAD JUÁREZ
  • 2.
    Regresión Logística  Lavariable dependiente (Y) tiene 2 valores (dicotómica)  Ausencia / presencia  Mutuamente excluyente  Las variables independientes (X) o predictoras son:  Continuas (edad)  Ordinales (estadios)  Dicotómicas (si/no)  Este modelo busca explicar o predecir la probabilidad de que ocurra o no un evento  Modelo multivariado Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
  • 3.
  • 4.
    Condiciones  Las variablesno aleatorias X (fijas) son posibles predictoras de Y  La relación de las variables debe ser clara y permitir que se establezcan los factores de riesgo  Es importante que no se deben utilizar variables en los casos en los que no se conoce su relación con la enfermedad  Los valores de X (variables fijas) son independientes  A La variable dependiente (Y) se le codifica como 0 o 1  Odds Ratio . Razón de Momios  Es el logaritmo de la probabilidad de que el evento suceda entre la probabilidad de que no suceda Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
  • 5.
    Condiciones  Se puedehacer inicialmente un análisis BIVARIADO para observar las relaciones significativas  El modelo final puede incluir todas las variables que demostraron relación con el resultado (Y)  Es deseable que cada variable en el modelo cuente con un mínimo de 10-20 casos por cada evento  Ej., Si tenemos 47 casos de neumonía en 121 pacientes, no deberíamos incluir en nuestro modelo más de 4 variables (47/10 = 4.7) Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
  • 6.
    Condiciones  Lo anteriorse llama eventos por variable  Sirve para estabilizar los datos  En caso de incluir más variables, los datos pueden volverse inestables y dar resultados falsos Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
  • 7.
    Pasos  1er paso– hacer una análisis bivariado con cada una de las posibles variables involucradas  Las variables dicotómicas se contrastan con Chi cuadrada  Las variables continuas se contrastan con t de Student  La medida de asociación es OR (Exp[β])  IC 95% (valor mínimo y máximo)  Una vez identificadas las variables que se asocian, haremos el modelo multivariado (preselección)  Eliminando las variables sin relación  Eliminando las variables con mayor p-valor  Se recomienda no eliminar variables que tengan lógica biológica (ej., edad) con el fin de ajustar el modelo Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7
  • 8.
    Berea-Baltierra et al.,Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7