La regresión logísticaEl objetivo primordial que resuelvela regresión logística es modelarcómo influye en la probabilidad ...
La regresión logísticaLos modelos de regresión logística sonmodelos de regresión que permiten estudiar siuna variable bino...
La regresión logística                  Nota Metodológica 1Se dice que un proceso es binomial cuando sólotiene dos posible...
La regresión logísticaEl odds asociado a un suceso es el cociente entre laprobabilidad de que ocurra frente a la probabili...
La regresión logísticaSi utilizamos cómo variable dependiente laprobabilidad p de que ocurra un determinado suceso yconstr...
La regresión logística                     Nota Metodológica 2Si clasificamos el valor de la variable respuesta como 0cuan...
Función logísticaEl modelo de regresión logística modeliza laprobabilidad de un proceso binomial como lafunción logística ...
La regresión logísticaHay otras formas equivalentes de poner el modelo,que para ciertas aplicaciones son más cómodas deusa...
Análisis de regresión logística La regresión logística es un caso particular deregresión en donde la variable dependiente...
Análisis de regresión logística Permite generar y evaluar un MODELOEXPLICATIVO a partir de una o varias variablesindepend...
Análisis de regresión logística              REQUISITOS Y ETAPAS Recodificación de las variables independientes  categóri...
Análisis de regresión logísticaLa interacción y la confusión son dos conceptosimportantes cuando se usa la técnica de regr...
Análisis de regresión logísticaEl modelo más sencillo que hace explícita lainteracción entre dos variables X1 y X2 es:    ...
Análisis de regresión logísticaContrastar la existencia de confusión requierecomparar los coeficientes de regresión obteni...
Modelos de Regresión Logística             ANÁLISIS DE UN EJEMPLO   “La participación en el mercado de trabajo    está co...
Modelos de Regresión Logística             ANÁLISIS DE UN EJEMPLO   Total number of cases:      16814 (Unweighted)   Num...
Modelos de Regresión Logística               ANÁLISIS DE UN EJEMPLODependent Variable Encoding:  Original       Internal...
Modelos de Regresión Logística             ANÁLISIS DE UN EJEMPLODependent Variable..   XCDEA Condición de ActividadBeginn...
Modelos de Regresión Logística               ANÁLISIS DE UN EJEMPLO: INACTIVOS              Classification Table for XCDE...
Modelos de Regresión Logística               ANÁLISIS DE UN EJEMPLO: ACTIVOS              Classification Table for XCDEA ...
Modelos de Regresión Logística           ANÁLISIS DE UN EJEMPLO: INACTIVOSBeginning Block Number 2. Method: Enter•Variable...
Modelos de Regresión Logística             ANÁLISIS DE UN EJEMPLO: ACTIVOSBeginning Block Number 2. Method: Enter•Variable...
Modelos de Regresión Logística               ANÁLISIS DE UN EJEMPLOBeginning Block Number 3. Method: EnterVariable(s) Ente...
Modelos de Regresión Logística            ANÁLISIS DE UN EJEMPLO: INACTIVOS                                              P...
Modelos de Regresión Logística                  ANÁLISIS DE UN EJEMPLO: ACTIVOS                                           ...
Analisis regresión logistica
Próxima SlideShare
Cargando en…5
×

Analisis regresión logistica

7.024 visualizaciones

Publicado el

1 comentario
2 recomendaciones
Estadísticas
Notas
Sin descargas
Visualizaciones
Visualizaciones totales
7.024
En SlideShare
0
De insertados
0
Número de insertados
93
Acciones
Compartido
0
Descargas
129
Comentarios
1
Recomendaciones
2
Insertados 0
No insertados

No hay notas en la diapositiva.

Analisis regresión logistica

  1. 1. La regresión logísticaEl objetivo primordial que resuelvela regresión logística es modelarcómo influye en la probabilidad deaparición de un suceso, por logeneral dicotómico, la presencia ono de diversos factores y el valor onivel de los mismos.
  2. 2. La regresión logísticaLos modelos de regresión logística sonmodelos de regresión que permiten estudiar siuna variable binomial depende, o no, de otra uotras variables (no necesariamentebinomiales): Si una variable binomial deparámetro p es independiente de otra variableX, se cumple p=p|X, por consiguiente, unmodelo de regresión es una función de p en Xque a través del coeficiente de X permiteinvestigar la relación anterior.
  3. 3. La regresión logística Nota Metodológica 1Se dice que un proceso es binomial cuando sólotiene dos posibles resultados: "éxito" y "fracaso“.Un proceso binomial está caracterizado por laprobabilidad de éxito, representada por p, laprobabilidad de fracaso se representa por q y,evidentemente, ambas probabilidades estánrelacionadas por p+q=1. En ocasiones, se usa elcociente p/q, denominado "odds“ (RIESGORELATIVO) y que indica cuánto más probable esel éxito que el fracaso, como parámetrocaracterístico de la distribución binomial.
  4. 4. La regresión logísticaEl odds asociado a un suceso es el cociente entre laprobabilidad de que ocurra frente a la probabilidadde que no ocurra:Una de las características que hace tan interesantela regresión logística es la relación que este modeloguarda con un parámetro de cuantificación deriesgo conocido como "odds ratio" (razón demomios).
  5. 5. La regresión logísticaSi utilizamos cómo variable dependiente laprobabilidad p de que ocurra un determinado suceso yconstruimos la siguiente función:tenemos una variable que puede tomar cualquiervalor a través de una ecuación bajo la forma:donde ln significa logaritmo neperiano, a0 y a1 sonconstantes y X es una variable que puede ser aleatoriao no, continua o discreta.
  6. 6. La regresión logística Nota Metodológica 2Si clasificamos el valor de la variable respuesta como 0cuando no se presenta un suceso y con 1 cuando sí estápresente, y buscamos cuantificar la posible relación entreese suceso y alguna variable independiente, podríamoscaer en error de utilizar una regresión lineal: y = a + bx, yestimar, a partir de nuestros datos y por el procedimientode mínimos cuadrados, los coeficientes a y b de laecuación. Sin embargo, y aunque esto es posiblematemáticamente, nos conduce a la obtención deresultados absurdos, ya que cuando se calcule la funciónobtenida para diferentes valores de la variable X seobtendrá resultados que, en general, serán diferentes de 0y 1, ya que esa restricción no se impone en la regresiónlineal, en la que la respuesta puede tomar cualquier valor.
  7. 7. Función logísticaEl modelo de regresión logística modeliza laprobabilidad de un proceso binomial como lafunción logística de una combinación linealde la(s) variable(s) independiente(s).
  8. 8. La regresión logísticaHay otras formas equivalentes de poner el modelo,que para ciertas aplicaciones son más cómodas deusar:Estas dos últimas expresiones permiten calculardirectamente la probabilidad del proceso binomialpara los distintos valores de la variable X.
  9. 9. Análisis de regresión logística La regresión logística es un caso particular deregresión en donde la variable dependiente escategórica. La técnica no impone restricciones tanfuertes sobre la distribución de los errores. La estimación de los coeficientes de regresión sehace a partir de los datos, pero no se aplica el métodode mínimos cuadrados sino de máxima verosimilitud. A igual que la regresión lineal, la regresión logísticaa) Evalúa Modelos Explicativos; b) Estima fuerza ysentido de factores; y c) Predice probabilidades deque un determinado evento ocurra.
  10. 10. Análisis de regresión logística Permite generar y evaluar un MODELOEXPLICATIVO a partir de una o varias variablesindependientes y una variable dicotómica ocategórica ordinal o no ordinal con más de doscategorías. Ejemplos: En qué medida ciertas característicassocio-demográficas influyen en que una poblaciónvote a determinado partido, o venda su fuerza detrabajo en el mercado, o no sienta depresiónpsicológica?
  11. 11. Análisis de regresión logística REQUISITOS Y ETAPAS Recodificación de las variables independientes categóricas u ordinales en variables “dummy” y de la variable dependientes en 0 y 1. Evaluar efectos de confusión y de interacción del modelo explicativo. Evaluación de la bondad de ajuste de los modelos a través de los Seudo R2 y la tabla de clasificación de casos. Análisis de la fuerza, sentido y significancia de los coeficientes, sus exponenciales y estadísticos de prueba (Wald).
  12. 12. Análisis de regresión logísticaLa interacción y la confusión son dos conceptosimportantes cuando se usa la técnica de regresióncon el objetivo de generar modelos explicativos,que tienen que ver con la interferencia que una ovarias variables pueden realizar en la asociaciónentre otras.Existe confusión cuando la asociación entre dosvariables difiere significativamente según que seconsidere, o no, otra variable. Existe interaccióncuando la asociación entre dos variables varíasegún los diferentes niveles de otra u otrasvariables.
  13. 13. Análisis de regresión logísticaEl modelo más sencillo que hace explícita lainteracción entre dos variables X1 y X2 es: ln(p/q) = a0 + a1 X1 + a2 X2 + a3 X1 X2Contrastar la existencia de interacción entre X1 yX2 es contrastar si el coeficiente a3 es cero (nohay interacción), o distinto de cero (existeinteracción). Nótese que para poder interpretarasí este contraste es necesario que en el modelofiguren las variables X1, X2 y X1X2.
  14. 14. Análisis de regresión logísticaContrastar la existencia de confusión requierecomparar los coeficientes de regresión obtenidosen dos modelos diferentes y si hay diferencia,existe la confusión. Para dicha comparación no seprecisa realizar un contraste de hipótesisestadístico ya que aunque la diferencia encontradasea debida al azar, representa una distorsión que laestimación ajustada corrige. Será el investigadorquién establezca el criterio para decidir cuando haydiferencia. Lo habitual es considerar que existeconfusión cuando la exponencial del coeficiente(Exp (B)) cambia en más del 10%.
  15. 15. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO “La participación en el mercado de trabajo está condicionada por diversos factores económicos, sociales y culturales. […] La definición de los roles masculinos y femeninos ubica a los varones como principales responsables del sostén económico de los hogares y […] directamente asociados al mundo laboral […] Las mujeres […] como principales responsables de las tareas de reproducción social en el ámbito doméstico”.
  16. 16. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO Total number of cases: 16814 (Unweighted) Number of selected cases: 16814 Number of unselected cases: 0 Number of selected cases: 16814 Number rejected because of missing data: 1467 Number of cases included in the analysis: 15347
  17. 17. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLODependent Variable Encoding: Original Internal Value Value 0,00 0 (ACTIVOS) 1,00 1 (INACTIVOS) Parameter Value Freq Coding (1) H13  Varón 1 7232 ,000  Mujer 2 8115 1,000 XMEN5  Sin menores de 5 años ,00 9487 ,000  al menos un menor 1,00 5860 1,000 Interactions: INT_1 H13(1) by XMEN5(1)
  18. 18. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLODependent Variable.. XCDEA Condición de ActividadBeginning Block Number 0. Initial Log Likelihood Function-2 Log Likelihood 16339,972Beginning Block Number 1. Method: EnterVariable(s) Entered on Step Number1. XMEN5 Presencia de menores de 5 años o menos H13 SexoEstimation terminated at iteration number 4 becauseLog Likelihood decreased by less than ,01 percent. -2 Log Likelihood 14057,404 Goodness of Fit 15645,491 Cox & Snell - R^2 ,138 Nagelkerke - R^2 ,211
  19. 19. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO: INACTIVOS  Classification Table for XCDEA  The Cut Value is ,78 PredictedObserved Activo Inactivo Percent A I CorrectActivo A 6.774 5.130 56,91%Inactivo I 458 2.985 86,70% Overall 63,59%Variable B S.E. Wald Df Sig R Exp(B)H13(1) 2,1547 ,0535 1620,21 1 ,0000 ,3147 8,6251XMEN5(1 ,2425 ,0424 32,7129 1 ,0000 ,0434 1,2744Constant -2,7914 ,0516 2926,26 1 ,0000
  20. 20. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO: ACTIVOS  Classification Table for XCDEA  The Cut Value is ,78 PredictedObserved Inactivo Activo Percent I A CorrectInactivo I 2.985 458 86,70%Activo A 5.130 6.774 56,91% Overall 63,59%Variable B S.E. Wald Df Sig R Exp(B)H13(1) -2,1547 ,0535 1620,21 1 ,0000 -,3147 ,1159XMEN5(1 -,2425 ,0424 32,7129 1 ,0000 -,0434 ,7847Constant 2,7914 ,0516 2926,26 1 ,0000
  21. 21. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO: INACTIVOSBeginning Block Number 2. Method: Enter•Variable(s) Entered on Step Number•1.. H13 * XMEN5Variable B S.E. Wald Df Sig R Exp(B)H13(1) 1,7112 ,0626 746,165 1 ,0000 ,2301 5,5357XMEN5 -,8638 ,1170 54,4647 1 ,0000 -,0611 ,4216 111,185INT_1 1,3302 ,1262 1 ,0000 ,0881 3,7818Constant -2,4388 ,0549 1974,89 1 ,0000
  22. 22. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO: ACTIVOSBeginning Block Number 2. Method: Enter•Variable(s) Entered on Step Number•1.. H13 * XMEN5Variable B S.E. Wald Df Sig R Exp(B)H13(1) -1,7112 ,0626 746,165 1 ,0000 -,2301 ,1806XMEN5 ,8638 ,1170 54,4647 1 ,0000 ,0611 2,3722 111,185INT_1 -1,3302 ,1262 1 ,0000 -,0881 ,2644Constant 2,4388 ,0549 1974,89 1 ,0000
  23. 23. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLOBeginning Block Number 3. Method: EnterVariable(s) Entered on Step Number1.. XQUINTIL Quintiles de ingreso familair per cápita XH12 Edad XEDAD2 Edad AL CUADRADOEstimation terminated at iteration number 5 becauseLog Likelihood decreased by less than ,01 percent. -2 Log Likelihood 13507,734 (14057,404) Goodness of Fit 15080,288 (15645,491) Cox & Snell - R^2 ,169 (,138) Nagelkerke - R^2 ,257 (,211)
  24. 24. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO: INACTIVOS Predicted Observed Activo Inactivo Percent A I Correct Activo A 7.557 4.347 63,48% Inactivo I 620 2.823 81,99% Overall 67,64%Variable B S.E. Wald Df Sig R Exp(B)H13(1) -1,7161 ,0634 732,350 1 ,0000 -,2290 ,1798XMEN5 1,0891 ,1182 84,8889 1 ,0000 ,0771 2,9716INT_1 -1,3462 ,1270 112,346 1 ,0000 -,0890 ,2602XQUINTI ,3088 ,0168 339,416 1 ,0000 ,1556 1,3618XH12 ,2411 ,0451 28,5608 1 ,0000 ,0437 1,2726XEDAD2 -,0031 ,0006 23,1655 1 ,0000 -,0390 ,9969Constant -2,8649 ,7656 14,0034 1 ,0002
  25. 25. Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO: ACTIVOS PredictedObserved Inactivo Activo Percent I A CorrectInactivo I 2.823 620 81,99%Activo A 4.347 7.557 63,48% Overall 67,64%Variable B S.E. Wald Df Sig R Exp(B)H13(1) 1,7161 ,0634 732,350 1 ,0000 ,2290 5,5626XMEN5 -1,0891 ,1182 84,8889 1 ,0000 -,0771 ,3365INT_1 1,3462 ,1270 112,346 1 ,0000 ,0890 3,8428XQUINTI -,3088 ,0168 339,416 1 ,0000 -,1556 ,7343XH12 -,2411 ,0451 28,5608 1 ,0000 -,0437 ,7858XEDAD2 ,0031 ,0006 23,1655 1 ,0000 ,0390 1,0031Constant 2,8649 ,7656 14,0034 1 ,0002

×