SlideShare una empresa de Scribd logo
1 de 44
Modelos de Variable
Dependiente Binaria
-Logit y Probit-
Econometría Aplicada
Daniel Lema
Introducción
• Modelos de regresión donde la variable
dependiente es binaria o dummy
• El desarrollo moderno de los modelos de
elección binaria se encuentra en las
aplicaciones biológicas.
• Ej: experimentos en los que se administra
una dosis ui de una droga a grupos de
insectos y se pretende analizar su
probabilidad de supervivencia.
Introducción
• Sea ci la tolerancia de un insecto en particular a
esa droga: el insecto i muere (yi = 1) si ui > ci y
sobrevive (yi = 0) si ui < ci.
• Por lo tanto, la probabilidad de fallecer es:
• Pr (yi = 1) = Pr (ui > ci) .
• En aplicaciones a las Ciencias Sociales, u y c
suelen ser inobservables, de manera que la
derivación del modelo binario gira en torno a la
existencia de unas variables latentes que
determinan el comportamiento del individuo.
• Por ejemplo:
• Un modelo que trata de explicar los factores
determinantes de que una familia sea adquiera una
casa.
• Podemos pensar que u podría ser la utilidad y c un
umbral o valor critico.
• En este caso lo que observaríamos es el resultado
de una decisión maximizadora de la utilidad por
parte de un individuo racional (preferencias
reveladas) y el objetivo del análisis sería
“revelar”información sobre las variables latentes
que gobiernan esa decisión (empleando ciertas
restricciones estructurales).
• Alternativamente, u puede interpretarse como una
variable indicador (denotada habitualmente como
y*) que determina la decisión tomada por cada
individuo.
• Si el valor que toma el indicador es superior
(inferior) a un determinado valor critico ci – en
general, desconocido – entonces el individuo
toma la decisión representada por yi = 1 (yi = 0).
• Por lo tanto, el indicador refleja el sentimiento del
decisor frente a la opción que representa yi = 1: si
su predisposición es lo suficientemente grande
(mayor que ci) entonces elegirá dicha opción; en
caso contrario, optará por la opción alternativa, yi
= 0.
• Este tipo de planteamiento es usual, por ejemplo,
en estudios sobre participación en el mercado
laboral (salario de mercado y salario de reserva)
o sobre migración (beneficios y costos).
• En particular, si suponemos que el indicador
depende aditivamente de las características
personales del individuo y de una componente
aleatoria yi* = x´iβ + εi,
• entonces la probabilidad de que el individuo
i−ésimo elija la acción yi = 1 vendrá dada por:
• Pr (yi = 1) = Pr (yi > ci) = F (x´iβ ) ,
• Donde F (.) es la función de distribución
acumulada de yi .
• El objetivo es analizar como estimar el vector
de parámetros β
• Por ejemplo, se selecciona una muestra
de hogares y se registra el ingreso y si la
familia es propietaria o no de una casa. El
modelo puede expresarse
• Yi=a + b Xi + ei
• Donde Yi = 1 si el hogar es propietario de su
casa y cero en caso contrario.
• Xi es el ingreso del hogar i
• Se puede aplicar MCO a este problema
• Este es el modelo lineal de probabilidad lineal
(MLP)
• El MLP pertenece a la clase de modelos de
decisión asociada a la existencia de variables
latentes.
• En concreto, el MLP representa el caso
particular en el que la función F (.) corresponde
a una distribución uniforme en el intervalo [0,
1].
• No obstante, los modelos lineales tienen una
serie de características que ponen en duda la
aplicabilidad de este tipo de aproximación para
observaciones individuales.
• Los test de hipótesis se basan en la
normalidad del término de error. No son
aplicables.
• Para un valor dado de Xi el término de error
sólo puede tomar uno de los siguientes dos
valores
 ei = 1 – a – bXi cuando Yi = 1
 ei = – a – bXi cuando Yi = 0
• En consecuencia los errores no se distribuyen
como una normal (de hecho lo hacen como
una binomial)
• Los errores son Heteroscedasticos.
• El estimador MCO es ineficiente (no
tienen varianza mínima)
• Predicción: El valor x´i b no será, en
general, 0 o 1.
• De hecho, no existen garantías de que la
predicción efectivamente satisfaga la
restricción 0 ≤ Pr (yi = 1|xi) ≤ 1
• Estos problemas no impiden
absolutamente la aplicación de MCO
• Se puede ajustar por heteroscedasticidad
• Los errores no normales son menos
problemáticos en muestras grandes
• Predicciones negativas o mayores a uno
no son un problema serio (pueden
ignorarse, por ej.)
• Sin embargo, algunos supuestos del modelo son
restrictivos
• Por ejemplo la constancia del efecto marginal de
un cambio en el ingreso sobre la probabilidad de
ser propietario (b)
• Supongamos, que los parámetros estimados por
MCO (para una muestra dada) son:
• yi = 0.012 + 0.1021xi.
• El valor de la constante (0.012) corresponde a la
probabilidad de que una familia sin ingresos, xi =
0, posea una vivienda.
• El valor de la pendiente es el aumento en la
probabilidad de poseer una vivienda provocado
por un incremento unitario en el nivel de
ingresos.
• En el MLP ese aumento se produce con
independencia del nivel de ingreso del que se
parte
• Económicamente uno esperaría que el aumento
de la probabilidad fuera no lineal: para niveles
bajos de renta la probabilidad de poseer una
vivienda sería baja,
• Mientras que para niveles elevados este hecho
sería mucho más probable.
• Esto implicaría una relación de este tipo entre
probabilidad de ser propietario e ingreso
0
0.2
0.4
0.6
0.8
1
X
p
• La relación es no lineal
• La variable dependiente está restringida entre cero y
uno
• Por sus características, las funciones de distribución
de variables aleatorias son candidatas potenciales,
puesto que de esta forma resolvemos de forma
sencilla el problema que tenía el MLP respecto al
rango de valores que podía tomar la predicción de la
variable endógena.
• Dos modelos producen una relación de este tipo
• Un modelo basado en la función logística
• Un modelo derivado de una función de distribución
normal acumulada
Modelo Logit
• Expresando el modelo explícitamente en
términos de probabilidades tenemos
• Pi = a + b Xi
• Donde Pi es la probabilidad de que el
hogar i sea propietario de una casa
• Una relación que genera un gráfico como
el anterior es:
)
(
1
1
i
X
i
e
P b
a +

+
=
• Definimos la razón de probabilidades
(odds ratio) como:
i
i
P
P

1
En el caso de la propiedad de casas representa
la razón de la probabilidad de que una familia
posea una casa respecto de la probabilidad de
que no la posea.
Por ejemplo, si Pi = 0.8 significa que las
probabiliades son 4 a 1 a favor de que la familia
posea una casa (0.8/0.2)
• Si tomamos el logaritmo natural de la razón
de probabilidades obtenemos
i
i
i
i
i X
Z
P
P
L b
a +
=
=









=
1
ln
• Entonces, el Li resulta lineal en X y también
en los parámetros
• L es llamado modelo Logit
• La interpretación del modelo es la
siguiente:
 b es la pendiente y mide el cambio en L
ocasionado por un cambio unitario en X,
es decir, dice cómo el logaritmo de las
probabilidades a favor de tener una casa
cambian a mediada que el ingreso cambia
en una unidad.
 a es el valor de L si el ingreso es cero
• Dado un nivel de ingreso X* si se desea
estimar la probabilidad de tener una casa
(y no las probabilidades a favor de tener
una casa) se puede calcular a partir de la
definición de Pi una vez estimados los
parámetros (efectos marginales).
• El método de estimación es por Máxima
Verosimilitud (MV)
El Modelo Probit
• La aproximación al problema es similar al
Logit pero se supone una relación no
lineal distinta (aunque muy similar) entre
Xi y Pi
• Se basa en la distribución normal
acumulada
• Se supone que la decisión de poseer o no
una casa depende de un índice I
(conocido como variable latente)
• El índice I está determinado por una o varias
variables explicativas. Por ej ingreso
• Cuanto mayor sea el índice mayor la
probabilidad de tener una casa
• Ii = a + b Xi
• Se supone un umbral crítico I* a partir del cuál,
si I supera a I* entonces una familia posee una
casa.
• El umbral I*, al igual que I, no es observable
• Si se supone que está distribuido normalmente
con la misma media y varianza es posible
estimar los parámetros del índice y también
alguna información sobre el I*.
•
• Pi = P (Y=1|X) = P(I*i ≤ Ii)
= P(Zi ≤ a + b Xi) = F(a + b Xi)
Donde
Z es una variable estándar normal, Z ~
N(0, s2)
F es la función de distribución normal
acumulada
• Explícitamente
 








=
Ii
Z
i dz
e
I
F 2
/
2
2
1
)
(


+









=
Xi
Z
dz
e
b
a

2
/
2
2
1
0
0.2
0.4
0.6
0.8
1
X
p
0 - ∞
+ ∞
Pi
Ii = a + b Xi
Pr (I*i≤ Ii)
Pi = F(Ii)
Estimación
• La estimación se realiza por MV
• Dado que para cada individuo i la función de
verosimilitud será la probabilidad de que haya
elegido 1 o 0, la función de verosimilitud
muestral será:
• Tomando logaritmos:
• Las derivadas parciales en caso Logit:
• Donde
• En el caso Probit:
•
• Donde
• La solución a estos sistema de
ecuaciones se realiza por algoritmos
(Ej.Newton-Raphson)
• Es necesario obtener la matriz de
varianzas y covarianzas asintótica
invirtiendo el Hessiano (o su esperanza)
también llamado Matriz de Información
• En el Logit:
• En el Probit
• Los algoritmos funcionan generalmente bien en los
Logit y Probit (convergencia en 3–5 iteraciones).
• Sin embargo, a veces no se alcanza esa
convergencia (por ejemplo, porque no se puede
invertir el Hessiano debido a que lnL no presenta la
suficiente concavidad) o se alcanza en un máximo
local.
• Muchos de estos casos tienen su origen en errores en
las variables
• El tamaño de la muestra también puede jugar un
papel importante: la convergencia se alcanza más
rápidamente cuanto mayor es el ratio entre el número
de observaciones y el número de variables
• Recomendación: aprox. 100 observaciones como
mínimo y 10 observaciones por parámetro.
• Otro aspecto a tener en cuenta es que los
coeficientes de los modelos logit y probit no son
comparables directamente entre si (y mucho
menos respecto a los del MLP).
• No obstante, se puede demostrar que existen
ciertas relaciones de proporcionalidad entre
ellos:
• En general, las estimaciones del modelo Logit
serán entre 1.6 y 1.8 veces las del Probit.
Interpretación de los Coeficientes
• Una diferencia fundamental respecto a los
modelos lineales es que la influencia que
tienen las variables explicativas sobre la
probabilidad de elegir la opción dada por yi
= 1 (la derivada parcial, dyi/dxi = βk en los
modelos lineales) no es independiente del
vector de características xi.
• Una primera aproximación a la relación
entre las variables explicativas y la
probabilidad resultante es calcular los
efectos marginales sobre la variable latente
(y*) .
• Si el efecto marginal expresa el
cambio de la variable dependiente
provocado por un cambio unitario en
una de las independientes
manteniendo el resto constante, los
parámetros estimados del Logit y el
Probit reflejan el efecto marginal de
las xik en yi de la misma forma que en
el MLP, puesto qe E (y*|x) = x´β.
• Por ejemplo, consideremos el siguiente modelo con
una variable explicativa continua
• (xi) y una discreta (di):
• Y* = β0 + β1xi + β2di + εi.
• Para las variables continuas el efecto marginal viene
dado por dy*i/dxi= β 1.
• Por su parte, para las ficticias el efecto marginal es
• E (y*|di = 1)−E (y*|di = 0) = β 2.
• El principal problema que enfrenta este tipo de
interpretación es que no tiene un reflejo muestral (la
variable latente no es observada).
• Por lo tanto, sólo es adecuada cuando lo que se
busca es analizar las preferencias o utilidades
subyacentes en el modelo.
• Los efectos marginales pueden construirse
sobre la probabilidad y, de hecho, este es el
tipo de presentación más frecuente.
• El efecto de la k−ésima variable explicativa,
manteniendo el resto constante, puede ser
calculado como:
• siendo F (.) la función de distribución y f (.) la
función de densidad.
• Por lo tanto, en un modelo binario la
influencia que tienen las explicativas sobre
la probabilidad de elegir la opción dada
por yi = 1 no depende simplemente del
valor los coeficientes, sino también del
valor que toman las variables explicativas.
• Por ej: El efecto marginal máximo ocurrirá
cuando Pr (y = 1) = 0.5
• Esto significa que, a diferencia de lo que
ocurre en el MLP, el efecto de una
variable sobre la probabilidad varía con el
valor de esa variable (es decir, no es
independiente del vector de
características xi).
• En Logit
• En Probit
• Los resultados previos suponen que si bien los
coeficientes de estos modelos no son directamente
interpretables, sus valores relativos si lo son.
• Por ej. el cociente βj/ βk mide la importancia relativa de
los efectos marginales de las variables xj y xk.
• Dado que los efectos marginales varian con x resulta
conveniente calcularlos para valores concretos de la
variable.
• Los “efectos marginales medios”, obtenidos a partir de la
media muestral de la variable, son una de las formas
más comunes de presentación de losresultados (por
ejemplo, en Stata).
• También se puede calcular, por ejemplo,
el efecto medio respecto al conjunto de las
• observaciones:
Inferencia
• La inferencia no presenta diferencias
sustanciales respecto al Modelo Lineal
Gaussiano, por lo que para llevar a cabo
hipótesis sobre el valor de un coeficiente puede
emplearse un estadístico de la t−Student
tradicional (aunque, siendo rigurosos, la
distribución apropiada sería la Normal).(ratio z)
• Por su parte, para contrastar la validez de un
conjunto de restricciones como las que definen
la significación global del modelo puede el test
de razón de verosimilitud (LR)
• LR
• Por ultimo, una forma de evaluación del modelo
es la que se deriva de la bondad del ajuste.
• Evidentemente, al tratarse de modelos no
lineales carece de sentido plantear la bondad
del ajuste en los términos que definen el
coeficiente de determinación (R2).
• Existen criterios alternativos que, en cierto
modo, siguen la misma idea.
• Todas estas medidas deben interpretarse con
cierta cautela
• Su validez como criterios de selección del
modelo es ciertamente limitada.
• Una medida es el pseudo R2 de Mc Fadden:
• En este caso, si los coeficientes son poco
significativos la capacidad explicativa del
modelo será muy reducida y el Loglikelihood
sin restricciones será muy similar al L0; por el
contrario, cuanto mayor sea la capacidad
explicativa del modelo, más proximo estará R2
a uno.

Más contenido relacionado

Similar a Notas_Probit_Logit.ppt

Grupo 4 - Distribución de probabilidad continua - Paralelo D.pptx
Grupo 4 - Distribución de probabilidad continua  - Paralelo D.pptxGrupo 4 - Distribución de probabilidad continua  - Paralelo D.pptx
Grupo 4 - Distribución de probabilidad continua - Paralelo D.pptxKristhianNParedesAvi
 
Variables dependientes limitadas
Variables dependientes limitadasVariables dependientes limitadas
Variables dependientes limitadasEric Burgos
 
que econometra
que econometra que econometra
que econometra rblanca
 
Otras cuestiones sobre el modelo de regresión
Otras cuestiones sobre el modelo de regresiónOtras cuestiones sobre el modelo de regresión
Otras cuestiones sobre el modelo de regresiónMiguel Jerez
 
Distribuciones probabilisticas
Distribuciones probabilisticasDistribuciones probabilisticas
Distribuciones probabilisticasIsaac Gomez
 
14 prueba chi cuadrado
14 prueba chi cuadrado14 prueba chi cuadrado
14 prueba chi cuadradoYerko Bravo
 
Prueba de hipotesis(1)
Prueba de hipotesis(1)Prueba de hipotesis(1)
Prueba de hipotesis(1)amy Lopez
 
Cap3. violacion modelo-regresión multiple-2011
Cap3. violacion modelo-regresión multiple-2011Cap3. violacion modelo-regresión multiple-2011
Cap3. violacion modelo-regresión multiple-2011Noemi Zapata
 
Clase 8, modelos_no_lineales_de_regresión
Clase 8, modelos_no_lineales_de_regresiónClase 8, modelos_no_lineales_de_regresión
Clase 8, modelos_no_lineales_de_regresiónHugo Maul
 
Trabajo final de econometria upc
Trabajo final de econometria upcTrabajo final de econometria upc
Trabajo final de econometria upcJose Matos
 
Modelos probabilidad
Modelos probabilidadModelos probabilidad
Modelos probabilidadYerko Bravo
 
Binonmial Poisson normal1.pdf
Binonmial  Poisson  normal1.pdfBinonmial  Poisson  normal1.pdf
Binonmial Poisson normal1.pdfdefa9294
 
Sesion 2 analisis de decision valor esperado imformacion perfecta
Sesion 2 analisis de decision valor esperado imformacion perfectaSesion 2 analisis de decision valor esperado imformacion perfecta
Sesion 2 analisis de decision valor esperado imformacion perfectaDIrector del INNOVAE
 
Sesión 9, errores comunes en las estimaciones
Sesión 9, errores comunes en las estimacionesSesión 9, errores comunes en las estimaciones
Sesión 9, errores comunes en las estimacionesHugo Maul
 
Clase13 Modelos de variables dependientes limitadas
Clase13 Modelos de variables dependientes limitadasClase13 Modelos de variables dependientes limitadas
Clase13 Modelos de variables dependientes limitadasNerys Ramírez Mordán
 

Similar a Notas_Probit_Logit.ppt (20)

Grupo 4 - Distribución de probabilidad continua - Paralelo D.pptx
Grupo 4 - Distribución de probabilidad continua  - Paralelo D.pptxGrupo 4 - Distribución de probabilidad continua  - Paralelo D.pptx
Grupo 4 - Distribución de probabilidad continua - Paralelo D.pptx
 
Variables dependientes limitadas
Variables dependientes limitadasVariables dependientes limitadas
Variables dependientes limitadas
 
que econometra
que econometra que econometra
que econometra
 
Otras cuestiones sobre el modelo de regresión
Otras cuestiones sobre el modelo de regresiónOtras cuestiones sobre el modelo de regresión
Otras cuestiones sobre el modelo de regresión
 
Distribuciones probabilisticas
Distribuciones probabilisticasDistribuciones probabilisticas
Distribuciones probabilisticas
 
Distribuciones de probabilidad.
Distribuciones de probabilidad.Distribuciones de probabilidad.
Distribuciones de probabilidad.
 
14 prueba chi cuadrado
14 prueba chi cuadrado14 prueba chi cuadrado
14 prueba chi cuadrado
 
Prueba de hipotesis(1)
Prueba de hipotesis(1)Prueba de hipotesis(1)
Prueba de hipotesis(1)
 
Cap3. violacion modelo-regresión multiple-2011
Cap3. violacion modelo-regresión multiple-2011Cap3. violacion modelo-regresión multiple-2011
Cap3. violacion modelo-regresión multiple-2011
 
Tarea 7 mate
Tarea 7 mateTarea 7 mate
Tarea 7 mate
 
Clase 8, modelos_no_lineales_de_regresión
Clase 8, modelos_no_lineales_de_regresiónClase 8, modelos_no_lineales_de_regresión
Clase 8, modelos_no_lineales_de_regresión
 
Trabajo final de econometria upc
Trabajo final de econometria upcTrabajo final de econometria upc
Trabajo final de econometria upc
 
Modelos probabilidad
Modelos probabilidadModelos probabilidad
Modelos probabilidad
 
Binonmial Poisson normal1.pdf
Binonmial  Poisson  normal1.pdfBinonmial  Poisson  normal1.pdf
Binonmial Poisson normal1.pdf
 
Unidad IV(Econometrics).pptx
Unidad IV(Econometrics).pptxUnidad IV(Econometrics).pptx
Unidad IV(Econometrics).pptx
 
Sesion 2 analisis de decision valor esperado imformacion perfecta
Sesion 2 analisis de decision valor esperado imformacion perfectaSesion 2 analisis de decision valor esperado imformacion perfecta
Sesion 2 analisis de decision valor esperado imformacion perfecta
 
Estadistica ii
Estadistica iiEstadistica ii
Estadistica ii
 
Sesión 9, errores comunes en las estimaciones
Sesión 9, errores comunes en las estimacionesSesión 9, errores comunes en las estimaciones
Sesión 9, errores comunes en las estimaciones
 
Clase13 Modelos de variables dependientes limitadas
Clase13 Modelos de variables dependientes limitadasClase13 Modelos de variables dependientes limitadas
Clase13 Modelos de variables dependientes limitadas
 
Chi cuadrado
Chi cuadradoChi cuadrado
Chi cuadrado
 

Último

ejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulosejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulosguillencuevaadrianal
 
titulo valor prate principal y accesoria...................
titulo valor prate principal y accesoria...................titulo valor prate principal y accesoria...................
titulo valor prate principal y accesoria...................LEYDIJACKELINECHARAP
 
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...VicenteAguirre15
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptxNathaliTAndradeS
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfGegdielJose1
 
SIRE-RCE. REGISTRO DE COMPRAS.. Y VENTAS
SIRE-RCE. REGISTRO DE COMPRAS.. Y VENTASSIRE-RCE. REGISTRO DE COMPRAS.. Y VENTAS
SIRE-RCE. REGISTRO DE COMPRAS.. Y VENTASccastrocal
 
PLANEACION-Y-CONTROL-DE-UTILIDADES-.pptx
PLANEACION-Y-CONTROL-DE-UTILIDADES-.pptxPLANEACION-Y-CONTROL-DE-UTILIDADES-.pptx
PLANEACION-Y-CONTROL-DE-UTILIDADES-.pptxMiguelLoaiza5
 
Venezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptxVenezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptxJulioFernandez261824
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICOlupismdo
 
EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.
EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.
EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.ManfredNolte
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.ManfredNolte
 
Tema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español ITema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español IBorjaFernndez28
 
Situación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.pptSituación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.pptrubengpa
 
Compañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power pointCompañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power pointAbiReyes18
 

Último (16)

ejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulosejemplo de tesis para contabilidad- capitulos
ejemplo de tesis para contabilidad- capitulos
 
titulo valor prate principal y accesoria...................
titulo valor prate principal y accesoria...................titulo valor prate principal y accesoria...................
titulo valor prate principal y accesoria...................
 
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
Revista Estudiantil de la Carrera de Contaduría Pública de la Universidad May...
 
el problema metodológico en la contabilidad.pdf
el problema metodológico en la contabilidad.pdfel problema metodológico en la contabilidad.pdf
el problema metodológico en la contabilidad.pdf
 
Mercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdfMercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdf
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptx
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
 
SIRE-RCE. REGISTRO DE COMPRAS.. Y VENTAS
SIRE-RCE. REGISTRO DE COMPRAS.. Y VENTASSIRE-RCE. REGISTRO DE COMPRAS.. Y VENTAS
SIRE-RCE. REGISTRO DE COMPRAS.. Y VENTAS
 
PLANEACION-Y-CONTROL-DE-UTILIDADES-.pptx
PLANEACION-Y-CONTROL-DE-UTILIDADES-.pptxPLANEACION-Y-CONTROL-DE-UTILIDADES-.pptx
PLANEACION-Y-CONTROL-DE-UTILIDADES-.pptx
 
Venezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptxVenezuela Entorno Social y Económico.pptx
Venezuela Entorno Social y Económico.pptx
 
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
 
EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.
EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.
EL HALVING DEL BITCOIN: REDUCIR A LA MITAD EL MINADO DE LOS MINEROS.
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
 
Tema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español ITema 1 de la asignatura Sistema Fiscal Español I
Tema 1 de la asignatura Sistema Fiscal Español I
 
Situación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.pptSituación Mercado Laboral y Desempleo.ppt
Situación Mercado Laboral y Desempleo.ppt
 
Compañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power pointCompañías aseguradoras presentacion power point
Compañías aseguradoras presentacion power point
 

Notas_Probit_Logit.ppt

  • 1. Modelos de Variable Dependiente Binaria -Logit y Probit- Econometría Aplicada Daniel Lema
  • 2. Introducción • Modelos de regresión donde la variable dependiente es binaria o dummy • El desarrollo moderno de los modelos de elección binaria se encuentra en las aplicaciones biológicas. • Ej: experimentos en los que se administra una dosis ui de una droga a grupos de insectos y se pretende analizar su probabilidad de supervivencia.
  • 3. Introducción • Sea ci la tolerancia de un insecto en particular a esa droga: el insecto i muere (yi = 1) si ui > ci y sobrevive (yi = 0) si ui < ci. • Por lo tanto, la probabilidad de fallecer es: • Pr (yi = 1) = Pr (ui > ci) . • En aplicaciones a las Ciencias Sociales, u y c suelen ser inobservables, de manera que la derivación del modelo binario gira en torno a la existencia de unas variables latentes que determinan el comportamiento del individuo.
  • 4. • Por ejemplo: • Un modelo que trata de explicar los factores determinantes de que una familia sea adquiera una casa. • Podemos pensar que u podría ser la utilidad y c un umbral o valor critico. • En este caso lo que observaríamos es el resultado de una decisión maximizadora de la utilidad por parte de un individuo racional (preferencias reveladas) y el objetivo del análisis sería “revelar”información sobre las variables latentes que gobiernan esa decisión (empleando ciertas restricciones estructurales). • Alternativamente, u puede interpretarse como una variable indicador (denotada habitualmente como y*) que determina la decisión tomada por cada individuo.
  • 5. • Si el valor que toma el indicador es superior (inferior) a un determinado valor critico ci – en general, desconocido – entonces el individuo toma la decisión representada por yi = 1 (yi = 0). • Por lo tanto, el indicador refleja el sentimiento del decisor frente a la opción que representa yi = 1: si su predisposición es lo suficientemente grande (mayor que ci) entonces elegirá dicha opción; en caso contrario, optará por la opción alternativa, yi = 0. • Este tipo de planteamiento es usual, por ejemplo, en estudios sobre participación en el mercado laboral (salario de mercado y salario de reserva) o sobre migración (beneficios y costos).
  • 6. • En particular, si suponemos que el indicador depende aditivamente de las características personales del individuo y de una componente aleatoria yi* = x´iβ + εi, • entonces la probabilidad de que el individuo i−ésimo elija la acción yi = 1 vendrá dada por: • Pr (yi = 1) = Pr (yi > ci) = F (x´iβ ) , • Donde F (.) es la función de distribución acumulada de yi . • El objetivo es analizar como estimar el vector de parámetros β
  • 7. • Por ejemplo, se selecciona una muestra de hogares y se registra el ingreso y si la familia es propietaria o no de una casa. El modelo puede expresarse • Yi=a + b Xi + ei • Donde Yi = 1 si el hogar es propietario de su casa y cero en caso contrario. • Xi es el ingreso del hogar i
  • 8. • Se puede aplicar MCO a este problema • Este es el modelo lineal de probabilidad lineal (MLP) • El MLP pertenece a la clase de modelos de decisión asociada a la existencia de variables latentes. • En concreto, el MLP representa el caso particular en el que la función F (.) corresponde a una distribución uniforme en el intervalo [0, 1]. • No obstante, los modelos lineales tienen una serie de características que ponen en duda la aplicabilidad de este tipo de aproximación para observaciones individuales.
  • 9. • Los test de hipótesis se basan en la normalidad del término de error. No son aplicables. • Para un valor dado de Xi el término de error sólo puede tomar uno de los siguientes dos valores  ei = 1 – a – bXi cuando Yi = 1  ei = – a – bXi cuando Yi = 0 • En consecuencia los errores no se distribuyen como una normal (de hecho lo hacen como una binomial)
  • 10. • Los errores son Heteroscedasticos. • El estimador MCO es ineficiente (no tienen varianza mínima) • Predicción: El valor x´i b no será, en general, 0 o 1. • De hecho, no existen garantías de que la predicción efectivamente satisfaga la restricción 0 ≤ Pr (yi = 1|xi) ≤ 1
  • 11. • Estos problemas no impiden absolutamente la aplicación de MCO • Se puede ajustar por heteroscedasticidad • Los errores no normales son menos problemáticos en muestras grandes • Predicciones negativas o mayores a uno no son un problema serio (pueden ignorarse, por ej.)
  • 12. • Sin embargo, algunos supuestos del modelo son restrictivos • Por ejemplo la constancia del efecto marginal de un cambio en el ingreso sobre la probabilidad de ser propietario (b) • Supongamos, que los parámetros estimados por MCO (para una muestra dada) son: • yi = 0.012 + 0.1021xi. • El valor de la constante (0.012) corresponde a la probabilidad de que una familia sin ingresos, xi = 0, posea una vivienda. • El valor de la pendiente es el aumento en la probabilidad de poseer una vivienda provocado por un incremento unitario en el nivel de ingresos.
  • 13. • En el MLP ese aumento se produce con independencia del nivel de ingreso del que se parte • Económicamente uno esperaría que el aumento de la probabilidad fuera no lineal: para niveles bajos de renta la probabilidad de poseer una vivienda sería baja, • Mientras que para niveles elevados este hecho sería mucho más probable. • Esto implicaría una relación de este tipo entre probabilidad de ser propietario e ingreso
  • 15. • La relación es no lineal • La variable dependiente está restringida entre cero y uno • Por sus características, las funciones de distribución de variables aleatorias son candidatas potenciales, puesto que de esta forma resolvemos de forma sencilla el problema que tenía el MLP respecto al rango de valores que podía tomar la predicción de la variable endógena. • Dos modelos producen una relación de este tipo • Un modelo basado en la función logística • Un modelo derivado de una función de distribución normal acumulada
  • 16. Modelo Logit • Expresando el modelo explícitamente en términos de probabilidades tenemos • Pi = a + b Xi • Donde Pi es la probabilidad de que el hogar i sea propietario de una casa • Una relación que genera un gráfico como el anterior es: ) ( 1 1 i X i e P b a +  + =
  • 17. • Definimos la razón de probabilidades (odds ratio) como: i i P P  1 En el caso de la propiedad de casas representa la razón de la probabilidad de que una familia posea una casa respecto de la probabilidad de que no la posea. Por ejemplo, si Pi = 0.8 significa que las probabiliades son 4 a 1 a favor de que la familia posea una casa (0.8/0.2)
  • 18. • Si tomamos el logaritmo natural de la razón de probabilidades obtenemos i i i i i X Z P P L b a + = =          = 1 ln • Entonces, el Li resulta lineal en X y también en los parámetros • L es llamado modelo Logit
  • 19. • La interpretación del modelo es la siguiente:  b es la pendiente y mide el cambio en L ocasionado por un cambio unitario en X, es decir, dice cómo el logaritmo de las probabilidades a favor de tener una casa cambian a mediada que el ingreso cambia en una unidad.  a es el valor de L si el ingreso es cero
  • 20. • Dado un nivel de ingreso X* si se desea estimar la probabilidad de tener una casa (y no las probabilidades a favor de tener una casa) se puede calcular a partir de la definición de Pi una vez estimados los parámetros (efectos marginales). • El método de estimación es por Máxima Verosimilitud (MV)
  • 21. El Modelo Probit • La aproximación al problema es similar al Logit pero se supone una relación no lineal distinta (aunque muy similar) entre Xi y Pi • Se basa en la distribución normal acumulada • Se supone que la decisión de poseer o no una casa depende de un índice I (conocido como variable latente)
  • 22. • El índice I está determinado por una o varias variables explicativas. Por ej ingreso • Cuanto mayor sea el índice mayor la probabilidad de tener una casa • Ii = a + b Xi • Se supone un umbral crítico I* a partir del cuál, si I supera a I* entonces una familia posee una casa. • El umbral I*, al igual que I, no es observable • Si se supone que está distribuido normalmente con la misma media y varianza es posible estimar los parámetros del índice y también alguna información sobre el I*. •
  • 23. • Pi = P (Y=1|X) = P(I*i ≤ Ii) = P(Zi ≤ a + b Xi) = F(a + b Xi) Donde Z es una variable estándar normal, Z ~ N(0, s2) F es la función de distribución normal acumulada
  • 24. • Explícitamente           = Ii Z i dz e I F 2 / 2 2 1 ) (   +          = Xi Z dz e b a  2 / 2 2 1
  • 25. 0 0.2 0.4 0.6 0.8 1 X p 0 - ∞ + ∞ Pi Ii = a + b Xi Pr (I*i≤ Ii) Pi = F(Ii)
  • 26. Estimación • La estimación se realiza por MV • Dado que para cada individuo i la función de verosimilitud será la probabilidad de que haya elegido 1 o 0, la función de verosimilitud muestral será: • Tomando logaritmos:
  • 27. • Las derivadas parciales en caso Logit: • Donde • En el caso Probit: • • Donde
  • 28. • La solución a estos sistema de ecuaciones se realiza por algoritmos (Ej.Newton-Raphson) • Es necesario obtener la matriz de varianzas y covarianzas asintótica invirtiendo el Hessiano (o su esperanza) también llamado Matriz de Información
  • 29. • En el Logit: • En el Probit
  • 30. • Los algoritmos funcionan generalmente bien en los Logit y Probit (convergencia en 3–5 iteraciones). • Sin embargo, a veces no se alcanza esa convergencia (por ejemplo, porque no se puede invertir el Hessiano debido a que lnL no presenta la suficiente concavidad) o se alcanza en un máximo local. • Muchos de estos casos tienen su origen en errores en las variables • El tamaño de la muestra también puede jugar un papel importante: la convergencia se alcanza más rápidamente cuanto mayor es el ratio entre el número de observaciones y el número de variables • Recomendación: aprox. 100 observaciones como mínimo y 10 observaciones por parámetro.
  • 31. • Otro aspecto a tener en cuenta es que los coeficientes de los modelos logit y probit no son comparables directamente entre si (y mucho menos respecto a los del MLP). • No obstante, se puede demostrar que existen ciertas relaciones de proporcionalidad entre ellos: • En general, las estimaciones del modelo Logit serán entre 1.6 y 1.8 veces las del Probit.
  • 32. Interpretación de los Coeficientes • Una diferencia fundamental respecto a los modelos lineales es que la influencia que tienen las variables explicativas sobre la probabilidad de elegir la opción dada por yi = 1 (la derivada parcial, dyi/dxi = βk en los modelos lineales) no es independiente del vector de características xi. • Una primera aproximación a la relación entre las variables explicativas y la probabilidad resultante es calcular los efectos marginales sobre la variable latente (y*) .
  • 33. • Si el efecto marginal expresa el cambio de la variable dependiente provocado por un cambio unitario en una de las independientes manteniendo el resto constante, los parámetros estimados del Logit y el Probit reflejan el efecto marginal de las xik en yi de la misma forma que en el MLP, puesto qe E (y*|x) = x´β.
  • 34. • Por ejemplo, consideremos el siguiente modelo con una variable explicativa continua • (xi) y una discreta (di): • Y* = β0 + β1xi + β2di + εi. • Para las variables continuas el efecto marginal viene dado por dy*i/dxi= β 1. • Por su parte, para las ficticias el efecto marginal es • E (y*|di = 1)−E (y*|di = 0) = β 2. • El principal problema que enfrenta este tipo de interpretación es que no tiene un reflejo muestral (la variable latente no es observada). • Por lo tanto, sólo es adecuada cuando lo que se busca es analizar las preferencias o utilidades subyacentes en el modelo.
  • 35. • Los efectos marginales pueden construirse sobre la probabilidad y, de hecho, este es el tipo de presentación más frecuente. • El efecto de la k−ésima variable explicativa, manteniendo el resto constante, puede ser calculado como: • siendo F (.) la función de distribución y f (.) la función de densidad.
  • 36. • Por lo tanto, en un modelo binario la influencia que tienen las explicativas sobre la probabilidad de elegir la opción dada por yi = 1 no depende simplemente del valor los coeficientes, sino también del valor que toman las variables explicativas. • Por ej: El efecto marginal máximo ocurrirá cuando Pr (y = 1) = 0.5
  • 37. • Esto significa que, a diferencia de lo que ocurre en el MLP, el efecto de una variable sobre la probabilidad varía con el valor de esa variable (es decir, no es independiente del vector de características xi).
  • 38. • En Logit • En Probit
  • 39. • Los resultados previos suponen que si bien los coeficientes de estos modelos no son directamente interpretables, sus valores relativos si lo son. • Por ej. el cociente βj/ βk mide la importancia relativa de los efectos marginales de las variables xj y xk. • Dado que los efectos marginales varian con x resulta conveniente calcularlos para valores concretos de la variable. • Los “efectos marginales medios”, obtenidos a partir de la media muestral de la variable, son una de las formas más comunes de presentación de losresultados (por ejemplo, en Stata).
  • 40. • También se puede calcular, por ejemplo, el efecto medio respecto al conjunto de las • observaciones:
  • 41. Inferencia • La inferencia no presenta diferencias sustanciales respecto al Modelo Lineal Gaussiano, por lo que para llevar a cabo hipótesis sobre el valor de un coeficiente puede emplearse un estadístico de la t−Student tradicional (aunque, siendo rigurosos, la distribución apropiada sería la Normal).(ratio z) • Por su parte, para contrastar la validez de un conjunto de restricciones como las que definen la significación global del modelo puede el test de razón de verosimilitud (LR)
  • 43. • Por ultimo, una forma de evaluación del modelo es la que se deriva de la bondad del ajuste. • Evidentemente, al tratarse de modelos no lineales carece de sentido plantear la bondad del ajuste en los términos que definen el coeficiente de determinación (R2). • Existen criterios alternativos que, en cierto modo, siguen la misma idea. • Todas estas medidas deben interpretarse con cierta cautela • Su validez como criterios de selección del modelo es ciertamente limitada.
  • 44. • Una medida es el pseudo R2 de Mc Fadden: • En este caso, si los coeficientes son poco significativos la capacidad explicativa del modelo será muy reducida y el Loglikelihood sin restricciones será muy similar al L0; por el contrario, cuanto mayor sea la capacidad explicativa del modelo, más proximo estará R2 a uno.