Modelos Logit y Probit con Stata

Modelos Logit y Probit con
Stata
Autor(es): Mg. Luis Fernando Aguas Bucheli
+593 984015184
@Aguaszoft
Aguaszoft@Outlook.es

 Tener éxito no es cuestión de suerte, es
el resultado del esfuerzo más arduo
 (Anónimo)
Ciencias de la Ingeniería
Carrera de Sistemas de Información
Plataformas de Desarrollo 1

Contenidos
II. Concepto
III. Objetivos y preguntas de investigación
IV. Modelo Logit: Especificación del modelo e interpretación de
coeficientes.
V. Modelo Logit: Estimación del modelo
VI. Modelo Logit: Supuestos
VII. Modelo Logit:Ajuste del modelo
VIII. Modelo Logit: Interpretación de resultados
I. INTRODUCCIÓN

Contenidos
IX. Modelo Logit en STATA
X. Modelo Probit: Especificación del modelo.
XI. Modelo Probit: Estimación del modelo
XII. Modelo Probit: Supuestos
XIII. Modelo Probit: Ajuste del modelo
XIV. Modelo Probit: Interpretación de resultados
XV. Modelo Probit en STATA
XVI. Probit vs Logit
XVII. Causalidad en modelos probit y logit
I. INTRODUCCIÓN

Modelos Logit y Probit
Técnicas de análisis estadístico utilizadas para
estimar los efectos de ciertas variables
(independientes /predictores) en una variable
dummy (dependiente/ predicha/ respuesta).
II. CONCEPTOY PREGUNTAS DE INVESTIGACIÓN
Variable
independiente
Variable
independiente
Variable
independiente
Variable
independiente
Variable
Dependiente

Técnicas de análisis estadístico utilizadas para
predecir la probabilidad de tener el valor 1 en una
variable dummy (dependiente) a partir de otras
variables (independientes).
Variable
independiente
Variable
independiente
Variable
independiente
Variable
independiente
Variable
Dependiente

Pasos para hacer un modelo Logit y
Probit
 Especificar el modelo
 Verificar el cumplimiento de supuestos
 Estimar el modelo
• Verificar la capacidad explicativa del
modelo
• Interpretar los resultados

Objetivos de investigación
 Determinar cómo incide (y con qué intensidad lo hacen)A, B y C en
D /Estimar el efecto de A, B y C en D
 Predecir la probabilidad de D, a partir de A, B y C
 Determinar él efecto de A en B, C y D

IV. ESPECIFICACIÓN DEL MODELO…

IV. ESPECIFICACIÓN DEL MODELO
10 15 20 25

P[Y=1|X]=F(X)
•Logit: F es una función de probabilidad logística
•Probit: F es una función de probabilidad normal
acumulada

Logit o Regresión Logística

Modelos Logit (Regresión Logística)
Odd
Probabilidad
Logit
=

VARIABLE
DICOTÓMICA
(DUMMY)
VARIABLES
CUANTITATIVAS O
DICOTÓMICA
(DUMMY)

Ajustar la curva: Estimación de
Máxima Verosimilitud
V. ESTMACIÓN DEL MODELO
Verosimilitud: Probabilidad de obtener
los datos, dados los coeficientes a y b.
Estimación mediante máxima
verosimilitud: estimar los coeficientes
que maximizan la verosimilitud.

Supuestos de la Regresión logística
VI. SUPUESTOS
1. Función de Probabilidad Logística
2. Ausencia de Multicolinealidad
3. Observaciones independientes
4. Muestras grandes

1. Función de Probabilidad logística
VI. SUPUESTOS
Función de Probabilidad Logística:
P[Y=1]=F(X) con F logística
Consecuencia del no cumplimiento del supuesto: Disminución del ajuste
del modelo.

1. Función de Probabilidad logística
VI. SUPUESTOS
 Diagnóstico del cumplimiento del supuesto:
Gráfico de dispersión de X eY
0
0.2
0.4
0.6
0.8
1
1.2
0 50 100 150 200

VI. SUPUESTOS
 Variables predictoras independientes entre sí.
 Consecuencia del no cumplimiento del supuesto: grandes
errores estándar (intervalos de confianza) y problemas de
identificación.
 Diagnóstico del cumplimiento del supuesto: correlaciones
entre variables
 Solución: Elegir variable o construir índices.

VI. SUPUESTOS
 Los datos de los distintos individuos deben ser independientes entre sí
 Consecuencia del no cumplimiento del supuesto:
Inadecuada estimación de los coeficientes del modelo.

4. Muestra grandes
VI. SUPUESTOS
 La Muestra es grande (30 casos por cada predictor)
 Consecuencia del no cumplimiento del supuesto:
Estimación inadecuada de los coefientes del modelo.

Porcentaje de casos bien clasificados
VII. AJUSTE DEL MODELO
1
0

Porcentaje de casos bien clasificados (Ej.)
X
(edad)
Y (consume
alcohol)
Y Predicción
1 12 0 85,3% 1
2 18 1 91,4% 1
3 25 1 95,5% 1

Se basan en la comparación de la log-Verosimilitud
del Modelo estimado y un Modelo Nulo
Dado que la verosimilitud(L) se encuentra entre 0 y
1; la log-verosimilitud(LL) es siempre menor o igual a
0.
•Mejor Modelo: L=1 y LL=0
•Peor Modelo: L=0 y LL<0
Pseudo R cuadrado

•McFadden
•McFadden Ajustado
Pseudo R cuadrado
1 Ajuste Perfecto
0 Mal Ajuste
(equivalente al modelo
nulo)
<=0 Mal Ajuste
nulo)

•Cox & Snell
•Nalgelkerke
Pseudo R cuadrado
1-L(M nulo)2/N (<1)
Ajuste Perfecto
0 Mal Ajuste
nulo)
0 Mal Ajuste
nulo)

Test de Hosmer y Lemeshow
Clasifica a los casos en grupos de valores predichos similares y
compara si las frecuencias observadas de dichos grupos coinciden
con las esperadas bajo una distribución logística.
 H0: Clasificaciones observadas son iguales a las esperadas
Si P>0,05, con 95% de confianza NO se rechaza H0, indicando un
buen ajuste

Análisis de Perfiles
VIII. INTERPRETACIÓN DE RESULTADOS
 Y=Tener pareja
 Perfiles:
 Ocupado de 40 años
 Desocupado de 40 años

Test de hipótesis de los coeficientes
del modelo
TEST DE RAZÓN DE VEROSIMILITUD: Compara la verosimilitud
del modelo (k predictores) con un modelo reducido (q
predictores).
 H0:bk=0 k no incluido en el modelo reducido.
 Estadístico:
SiValor P<0.05, con 95% se rechaza H0

del modelo
TEST DEWALD:
 H0: bk=0
 Estadístico:
 SiValor P<0.05, con 95% se rechaza H0

Coeficientes del modelo
INTERPRETACIONES POSIBLES:
 Interpretar b
 Interpretar eb
 Interpretar efectos marginales promedio

Probabilidad
El b puede ser interpretado,
realizando una
aproximación lineal a la
curva en el punto de interés.
Dicha recta tendrá
pendiente p(p-1) b

Si alguien gana 600 mil, si
aumenta 100 mil su sueldo,
la probabilidad de votar por
Piñera aumenta en
=0.4*0.6*0.5=0,012 (1,2%)
Ingresos (100 mil)
Probabilidad de votar
por Piñera
𝒍𝒐𝒈
𝝅
𝟏−𝝅
= 𝟏 + 𝑿𝟑00.5

 Interpretar b
 b >0
 Al aumentar en 1 la variable
independiente, logit aumenta en b
 Al Aumentar en 1 la variable
independiente aumenta en p(p-1)b
 b <0
 Al aumentar en 1 la variable
independiente, logit disminuye en b
 Al Aumentar en 1 la variable
independiente disminuye en p(p-1)b

Si alguien aumenta su
sueldo en 100 mil, los odds
aumenta en 64%
Ingresos (100 mil)
por Piñera
𝒍𝒐𝒈
𝝅
𝟏−𝝅
= 𝟏 + 𝑿𝟑00.5

Si alguien aumenta su
sueldo en 100 mil, los odds
disminuyen en 40%
Ingresos (100 mil)
por Piñera
𝒍𝒐𝒈
𝝅
𝟏−𝝅
= 𝟏 + 𝑿𝟑00.5-

 Interpretar eb
 eb >1: Al aumentar en 1 la variable independiente los odds
aumentan en 100(eb -1)%
 eb <1: Al aumentar en 1 la variable independiente los odds
disminuyen en 100(1- eb)%
 Al aumentar en 1 la variable independiente los odds aumentan en
eb veces.

 Interpretar efectos marginales promedio (EMP)
 EFP>0: En promedio, cuando la variable independiente aumenta
en 1, la variable dependiente aumenta en EMP
 EFP<0: En promedio, cuando la variable independiente aumenta
en 1, la variable dependiente disminuye en EMP

Ejemplo
_cons -1.807127 .0150622 -119.98 0.000 -1.836649 -1.777606
ocupa1 .7317526 .0103442 70.74 0.000 .7114784 .7520269
edad .0338646 .000284 119.24 0.000 .033308 .0344212
pareja2 Coef. Std. Err. z P>|z| [95% Conf. Interval]
_cons .1641249 .0024721 -119.98 0.000 .1593506 .1690423
ocupa1 2.078721 .0215027 70.74 0.000 2.037001 2.121295
edad 1.034445 .0002938 119.24 0.000 1.033869 1.03502
pareja2 Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
ocupa1 .1630431 .0021776 74.87 0.000 .1587752 .1673111
edad .0075454 .0000527 143.24 0.000 .0074422 .0076487
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
Delta-method
dy/dx w.r.t. : edad ocupa1

Preguntas
I. ¿Para qué se usan los modelos probit y logit?
II. ¿En qué consiste la estimación por máxima verosimilitud?
En un modelo logit…
I. ¿Cómo se interpretan –de forma general- los pseudo- R cuadrado?
II. ¿Cómo se interpreta el test de Hosmer y Lemeshow?
III. ¿Cómo se interpreta b, eb y los EMP?
REPASO

Probit
X. ESPECIFICACIÓN DEL MODELO

10 15 20 25

P[Y=1|X]=F(X)
•Logit: F es una función de probabilidad logística
•Probit: F es una función de probabilidad normal
acumulada

Probit
•Función de probabilidad normal acumulada
Frecuenci
a
Frecuencia
acumulada
0 1 1
10 2.5 3.5
20 5 8.5
30 8 16.5
40 12 28.5
50 14 42.5
60 12 54.5
70 8 62.5
80 5 67.5
90 2.5 70
10 1 71
0
2
4
6
8
10
12
14
16
1 2 3 4 5 6 7 8 9 10 11
0
10
20
30
40
50
60
70
1 2 3 4 5 6 7 8 9 10 11

Probit
VARIABLE
DICOTÓMICA
(DUMMY)
VARIABLES
CUANTITATIVAS O
DICOTÓMICA
(DUMMY)

Ajustar la curva: Estimación de
Máxima Verosimilitud
XI. ESTIMACIÓN DEL MODELO
Verosimilitud: Probabilidad de obtener
los datos, dados los coeficientes a y b.
Estimación mediante máxima
verosimilitud: estimar los coeficientes
que maximizan la verosimilitud.

Supuestos de Probit
XII. SUPUESTOS
1. Función de Probabilidad normal acumulada
4. Muestras grandes

1. Función de Probabilidad normal
acumulada P[Y=1]=F(X) con F normal acumulada
Consecuencia del no cumplimiento del supuesto: Disminución del ajuste del
modelo.
XII. SUPUESTOS

1. Función de Probabilidad normal
acumulada
 Diagnóstico del cumplimiento del supuesto:
Gráfico de dispersión de X eY
0
0.2
0.4
0.6
0.8
1
1.2
0 50 100 150 200
XII. SUPUESTOS

Porcentaje de casos bien clasificados
XIII. AJUSTE DEL MODELO
Test de Hosmer y Lemeshow
H0: Clasificaciones observadas son iguales a las esperadas
Si P>0,05, con 95% de confianza NO se rechaza H0, indicando un buen ajuste
1
0

Pseudo R cuadrado
XIII. AJUSTE DEL MODELO
•McFadden
•McFadden Ajustado
1 Ajuste
Perfecto
0 Mal Ajuste
(equivalente al
modelo nulo)
1 Ajuste
Perfecto
0 Mal Ajuste
(equivalente al
modelo nulo)
•Cox & Snell
•Nalgelkerke
1-L(M nulo)2/N
(<1) Ajuste
Perfecto
0 Mal Ajuste
(equivalente al
modelo nulo)
1 Ajuste
Perfecto
0 Mal Ajuste
(equivalente al
modelo nulo)

XIV. INTERPRETACIÓN DE RESULTADOS
 Y=Tener pareja, X=Edad y Ocupado
 Perfiles:

del modelo
TEST DE RAZÓN DEVEROSIMILITUD:
 H0:bk=0 k no incluido en el modelo reducido.
TEST DEWALD:
 H0: bk=0

 Interpretar b
 b >0
 Al aumentar la variable independiente, la
probabilidad deY=1 aumenta
 b <0
 Al aumentar la variable independiente, la
probabilidad deY=1 disminuye

 EFP>0: En promedio, cuando la variable independiente aumenta en 1, la
variable dependiente aumenta en EMP
 EFP<0: En promedio, cuando la variable independiente aumenta en 1, la
variable dependiente disminuye en EMP

Ejemplo
_cons -1.12406 .0091259 -123.17 0.000 -1.141947 -1.106174
ocupa1 .4620657 .0063266 73.04 0.000 .4496658 .4744656
edad .0208241 .0001692 123.07 0.000 .0204925 .0211557
pareja2 Coef. Std. Err. z P>|z| [95% Conf. Interval]
>
ocupa1 .1679902 .0021858 76.86 0.000 .1637061 .1722743
edad .0075709 .0000529 143.23 0.000 .0074673 .0076745
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
Delta-method

Probit vs Logit
XVI. PROBIT VS LOGIT
 La estimación de los EMP suelen ser similares.
 El modelo logit tiene una ecuación más sencilla y la magnitud de los
coeficientes tienen una interpretación directa.
 Se puede optar por uno u otro, en función de cual modelo ajuste mejor a
los datos, aun cuando el ajuste suele ser similar.

Causalidad en
Modelos
Probit y Logit
 La existencia de relación estadística de la variable dependienteY
con las variables independientes X no implica causalidad.
 La causalidad puede ser de X aY o deY a X Recomendable incluir
predictores X de un periodo previo
 La causalidad puede deberse a otras variables Recomendable
controlar
 Aún siguiendo las recomendaciones no hay garantía de
causalidad.
XVII. CAUSALIDAD

Modelos Logit y Probit con Stata

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Modelos Logit y Probit con Stata

Similar a Modelos Logit y Probit con Stata (20)

Más de Luis Fernando Aguas Bucheli

Más de Luis Fernando Aguas Bucheli (20)

Último

Último (20)

Modelos Logit y Probit con Stata