Este documento analiza factores que afectan la probabilidad de que una persona participe en el mercado laboral en Arequipa, Perú en 2016. Los resultados muestran que ser mujer, tener más hijos menores de 5 años, ser mayor o tener mayores ingresos disminuyen la probabilidad, mientras que ser casado, tener más educación o ser jefe de hogar la incrementan. El documento describe los datos y métodos econométricos utilizados como modelos de probabilidad lineal y no lineal para determinar el efecto de estas variables.
Mercado de trabajo de las personas con discapacidad..pdfJosé María
Similar a Modelos econometricos de probabilidad no lineal aplicados a la participacion en el mercado laboral de la poblacion en la region arequipa (20)
Modelos econometricos de probabilidad no lineal aplicados a la participacion en el mercado laboral de la poblacion en la region arequipa
1. Página | 1
Modelos econométricos de probabilidad no lineal
aplicados a la participación en el mercado laboral
de la población en la región Arequipa
Wilson Cañapatana Castillo
Agosto del 2017
Resumen
Este pequeño articulo analiza algunos de los factores que afectan las probabilidades de que una persona
participe en el mercado laboral ya sea trabajando u en su defecto buscando un trabajo en la región Arequipa
para el año 2016. Los resultados muestran que el hecho de ser mujer, tener una mayor cantidad de hijos
menores de 5 años, tener más años de edad o contar con mayores ingresos disminuye la probabilidad de
participar en el mercado laboral. También se ha encontrado en el análisis de la base de datos que tanto el
hecho de ser casados, tener más años de educación o ser jefes de hogar incrementan la probabilidad de
participar en el mercado laboral. Para este análisis se ha hecho el uso de modelos econométricos de
probabilidad los cuales ayudan a contrastar estos resultados.
INTRODUCCIÓN
Muchos trabajos de investigación se concentran en el estudio de la Población Económicamente Activa,
específicamente en la población que conforma la Población Económicamente Activa Ocupada que
constituye parte de la fuerza de trabajo que tiene gran trascendencia en el crecimiento de la economía
(Leasaski & Crispín, 2010).
Se tiene una gran cantidad de estudios de la Población Económicamente Activa Ocupada y de la Población
Económicamente Activa Desocupada, sin embargo, en la bibliografía existe poca referencia acerca de qué
variables influyen en hacer que la población participe en el mercado laboral como Población
Económicamente Activa Ocupada y Desocupada, dejando de ser parte de la Población Económicamente
Inactiva1. Esas variables influyen en las decisiones de las personas en querer formar parte del mercado
laboral y dejar de mantenerse como personas inactivas.
1 La Población en Edad de Trabajar comprende la Población Económicamente Activa y la Población Económicamente Inactiva. La
población Económicamente activa a su vez comprende la Población Ocupada y la Población Desocupada, en tanto la Población
Económicamente Inactiva comprende personas que no buscan un puesto laboral y tienen otras actividades como los estudios.
2. Página | 2
A nivel nacional y regional es importante conocer cuáles son los principales factores que influyen en la
persona a formar parte del mercado laboral ya sea estando ocupada en algún puesto laboral o buscando un
trabajo, son variables que influyen en una persona a formar parte de la Población Económicamente Activa
(Millones E. A., 2003). La identificación de estos factores toma mayor relevancia cuando las políticas
nacionales y regionales tienen como objetivo disminuir la tasa de desempleo, mucho más cuando se trata
de un país centralizado y que cuenta con regiones de difícil acceso y con población en situación de pobreza
y pobreza extrema. Las políticas del gobierno central y regional que generan empleo posibilita la reducción
de estos indicadores de pobreza. Así mismo resulta importante tomar en cuenta esas variables pues
determinan la oferta de horas de trabajo por parte de la población (Millones E. A., 2003).
La implementación de políticas adecuadas para brindar habilidades y potenciar las destrezas de la
población podrá contribuir a que esta población ocupe puestos de trabajo que sea de calidad2. En el Perú se
cumple una relación indirecta entre el empleo de calidad y la incidencia de la pobreza, donde regiones con
una menor incidencia de pobreza cuentan con un mayor nivel de calidad del empleo (Vera, Gil, Chavez, &
Manayay, 2015).
En este sentido resulta importante estudiar a la población que se encuentra formando parte de la Población
Económicamente Activa y la influencia de los factores que posibilitan su participación en el mercado laboral,
es decir ver qué factores incrementan las posibilidades de un individuo a participar en el mercado laboral, y
determinar la importancia de estos factores en las políticas actuales.
Se pueden señalar varios ejemplos en los cuales la determinación de estos factores puede ayudar al diseño
de políticas públicas. Por ejemplo, tener una idea de los factores que impulsan a un menor de edad a formar
parte del mercado laboral ayudarían a erradicar el trabajo infantil el cual es uno de los males que aqueja a
nuestra sociedad. En la población joven la determinación de esos factores puede ayudar a diseñar políticas
que prevengan las altas tasas de desempleo que se dan por falta de capacitación adecuada, falta de
experiencia y por las posibles obligaciones familiares que se tengan.
Entender las razones por las que un individuo menor de edad, joven estudiante o adulto jubilado, decide
formar parte del mercado laboral permite implementar y mejorar políticas para el bienestar de la población.
Dependiendo de las características de cada individuo se esperaría que el efecto de las variables que
influyen en las probabilidades de acceder al mercado laboral de un individuo sea heterogéneo y difieran en
relevancia.
2 Según la Organización Internacional del Trabajo el empleo de calidad implica al salario, acceso a un seguro de salud y un
sistema pensionario, la certidumbre del empleo (existencia de un contrato y la jornada de trabajo establecida.
3. Página | 3
DESCRIPCIÓN DE LOS DATOS
En el presente trabajo se empleará la información proveniente del Instituto Nacional de Estadística e
Informática y del Ministerio de Trabajo, para lo cual se emplea la Encuesta Nacional de Hogares del año
2016. Así mismo se usa los criterios establecidos por el ministerio de trabajo para la determinación de
algunas variables.
Los datos requeridos son el sexo de la persona debido a que existen ciertos mercados en los cuales en el
presente aún existe cierta predominancia por parte de los hombres y en otras de las mujeres. Las personas
que están casadas tienen mayor incentivo a formar parte del mercado laboral, más si esta persona es el jefe
de hogar o si cuenta con hijos menores de edad que requieren de los servicios básicos.
La edad de la persona también es una variable que influye en las probabilidades de una persona a formar
parte del mercado laboral, tanto en personas mayores de edad con rendimientos marginales decrecientes
pero que cuentan con mayor experiencia como en los jóvenes que cuentan con mayor vitalidad y mayor
disposición a laborar, pero con poco o ninguna experiencia. Esta situación difiere aún más cuando se trata
de los años de educación con las que cuenta una persona que mejora las condiciones de encontrar un
trabajo.
Existen también aquellos individuos en cuyo hogar los bajos ingresos hacen que requieran formar parte del
mercado laboral debido a que en la mayoría de los casos existen necesidades básicas que cubrir.
Como se ha podido observar existe una infinidad de variables que afectan la participación de un individuo en
el mercado laboral. En este trabajo se espera determinar algunas de las variables que contribuyen
incrementando las posibilidades de participación de un individuo en el mercado laboral y otras que reducen
dichas posibilidades de participación.
METODOLOGÍA
Dentro de la literatura económica existen una variedad de métodos a aplicar para determinar el efecto de
una variable en otra, en este caso se trata de la probabilidad de formar parte de la Población
Económicamente Activa, es decir participar en el mercado laboral. Dentro de esta clase de modelos de
variable dependiente binaria podemos encontrar los modelos de probabilidad lineal, modelos de regresión
Tobit, modelos de regresión Logít y modelos de regresión Probit, los cuales son modelos de probabilidad no
lineal.
En algunas ocasiones se tienen como dificultades en el modelo de probabilidad lineal que este no se
encontraría acotado entre 0 y 1, lo que llevaría a tener probabilidades negativas y mayores al 100%, en el
caso de los modelos Logit y Probit sin embargo las diferencias se dan principalmente en la función de
distribución acumulada que emplea cada una de ellas (Stock & Watson, 2012).
4. Página | 4
En este sentido se hará un comparativo entre el modelo de probabilidad lineal que se halla mediante el
método de mínimos cuadrados ordinarios y los modelos de probabilidad no lineal Logit y probit que se
calculan mediante el método de máxima verosimilitud.
El Modelo de Probabilidad lineal se utiliza para modelos de regresión múltiple cuando la variable
dependiente es binaria en vez de continua. Debido a que la variable dependiente Y es binaria, la función de
regresión poblacional corresponde a la probabilidad de que la variable dependiente sea igual a 1, dado X. El
coeficiente poblacional β de un regresor X es la variación en la probabilidad de que Y=1 asociada con una
variación unitaria en X. Del mismo modo, el valor de predicción MCO, Ŷi, calculado mediante la función de
regresión estimada, es la probabilidad estimada de que la variable dependiente sea igual a 1, y el estimador
MCO β1 estima la variación de la probabilidad de que Y=1 asociada a un cambio unitario en X.
Así tenemos la expresión lineal del modelo de probabilidad lineal donde Yi representa la variable
dependiente binaria en función de las variables independientes X1, X2, … Xk .
0 1 1 2 2 ...i i i k ki iY X X X u
E(Yi|X1, X2, …, Xk) = Pr(Y=1|X1, X2, …, Xk)
Pr(Y=1|X1, X2, …, Xk) = β0 + β1 X1 + β2 X2 + … + βk Xk
De igual manera este modelo se puede expresar en forma matricial de la siguiente manera.
1
2
n
Y
Y
y
Y
,
11 1
12 2
1
1
1
1
k
k
n kn
X X
X X
X
X X
,
0
1
k
,
1
2
n
u
u
u
u
1
2
n
Y
Y
Y
=
11 1
12 2
1
1
1
1
k
k
n kn
X X
X X
X X
0
1
k
+
1
2
n
u
u
u
y X u
i i iy X u
1 si el individuo i Participa
0 si el individuo i No Participa
yi =
5. Página | 5
Además, se tiene que:
X1 : sexo (sexo), 1 para Mujer y 0 para Hombre.
X2 : casado (casado), 1 si es casado y 0 si no es casado
X3 : Jefe de hogar (jefeh), 1 si es jefe de hogar y 0 si no los es
X4 : Número de hijos menores de 5 años (numh5)
X5 : edad del individuo i expresada en años (edad)
X6 : educación expresada en años (educación)
X7 : Ingresos del hogar expresado en tasas (ingresh).
Nuestro modelo que representa la participación en el mercado laboral en función de las variables antes
descritas queda representado en forma matricial de la siguiente manera:
1
2
n
Y
Y
Y
=
11 21 31 41 51 61 71
12 22 32 42 52 62 72
1 2 3 4 5 6 7
1
1
1 n n n n n n n
X X X X X X X
X X X X X X X
X X X X X X X
0
1
2
3
4
5
6
7
+
1
2
n
u
u
u
i i iy X u
Donde finalmente el modelo de probabilidad lineal que representa la probabilidad de participación en el
mercado laboral viene expresado de la siguiente manera en forma matricial:
Pr( 1 )i i iy X X
6. Página | 6
Modelo de regresión Probit es un modelo de regresión no lineal que se basa en la función de distribución
de probabilidad acumulada normal estándar, cuyas probabilidades condicionales toman siempre valores
entre 0 y 1.
La expresión lineal del modelo de probabilidad probit viene expresada de la siguiente manera:
Pr(Y=1|X1, X2, …, Xk) = Ф(β0 + β1 X1 + β2 X2 + … + βk Xk )
Donde se tiene que Yi sigue representando a la variable dependiente binaria y X1, X2,… Xk , representan a
las variable independientes que explican el modelo, así mismo Ф es la función de distribución normal
estándar acumulada que es una función de β0 + β1 X1 + β2 X2 + … + βk Xk que representa el valor z para
hallar la probabilidad de participación en el mercado laboral.
En forma matricial el modelo probit puede ser representado de la siguiente manera:
Pr( 1 ) ( )i i iy X X
Donde y viene a representar el vector de la variable dependiente, X representa la matriz de la variables
independientes o explicativas, y β representa el vector de los parámetros.
2
1
( ) exp
22
iX
i
z
X dz
2
1
Pr( 1 ) exp
22
iX
i i
z
y X dz
En este sentido usando la transformación normal estándar ( ) se restringe la probabilidad de participación
en el mercado laboral entre 0 y 1.
lim ( ) 1
z
z
y lim ( ) 0
z
z
El Modelo Logit en cambio utiliza la función de distribución acumulada logística estándar y su aplicación es
similar que el modelo de regresión Probit.
La forma lineal del modelo de regresión logit se puede expresar así:
Pr(Y=1|X1, X2, …, Xk) = F(β0 + β1 X1 + β2 X2 + … + βk Xk )
Pr(Y=1|X1, X2, …, Xk) = 1
1 + e-(β
0
+ β
1
X
1
+ β
2
X
2
+ … + β
k
X
k
)
7. Página | 7
En la forma matricial el modelo logit es expresado de la siguiente manera
Pr( 1 ) ( )i i iy X X
exp( )
( )
1 exp( )
i
i
i
X
X
X
exp( )
Pr( 1 )
1 exp( )
i
i i
i
X
y X
X
Como se pudo señalar anteriormente, el modelo de probabilidad lineal se resuelve aplicando el método de
mínimos cuadrados ordinarios, método de estimación ya conocido. Sin embargo en lo que se refiere al
modelo Logit y el modelo Probit se aplicara el método de estimación de máxima verosimilitud.
En el caso del Modelo Logit se puede proceder de la siguiente manera para obtener la función de máxima
verosimilitud.
Sea la probabilidad ( ζ ) de nuestra muestra el producto de las probabilidades de cada una de las
observaciones con las que se cuenta:
1 2 1 2Pr( 0) Pr( 0) Pr( 0) Pr( 1) Pr( 1) Pr( 1)m m m m ny y y y y y
Siendo para este caso Pr( 1) ( )i iy X y Pr( 0) 1 ( )i iy X
Así obtenemos la función de máxima verosimilitud para este modelo logit el cual se representa de la
siguiente manera:
1 1
1 ( ) ( )
m n
i i
i i m
X X
(1 )
1
( ) 1 ( ) ii
n
yy
i i
i
X X
Aplicamos el logaritmo natural a la función de máxima verosimilitud del modelo logit y obtenemos la
siguiente expresión:
(1 )
1
ln ln ( ) 1 ( ) ii
n
yy
i i
i
X X
1
ln ( ) (1 ) ln 1 ( )
n
i i i i
i
y X y X
8. Página | 8
En el caso del Modelo Probit primeramente definimos la variable latente y* la cual es:
*
i i iy X u
Nosotros no observamos y* sino más bien y la cual toma valores de 0 o 1 de acuerdo a la siguiente regla:
1 si y*>0
0 en otro caso
Se asume que 2
(0, )iu N , así mismo en el modelo probit *
iy se encuentra distribuido normalmente.
*
Pr( 1) Pr( 0)i iy y
Pr( 1) Pr( 0)i i iy X u
Pr( 1) Pr( )i i iy u X
Pr( 1) Pr i
i i
u
y X
Pr( 1)i iy X
Pr( 0) 1i iy X
A continuación se obtiene la función de máxima verosimilitud del modelo probit que tiene la siguiente forma:
1 1
1
m n
i i
i i m
X X
(1 )
1
1
ii
yyn
i i
i
X X
Se realiza una transformación obteniendo el logaritmo natural de la función de máxima verosimilitud del
modelo probit.
(1 )
1
ln ln 1
ii
yyn
i i
i
X X
1
ln (1 ) ln 1
n
i i i i
i
y X y X
yi =
9. Página | 9
LOS RESULTADOS
Se puede ver que de acuerdo a la condición de actividad en la Encuesta Nacional de Hogares para la región
Arequipa el 68.3% se encuentra participando en el mercado laboral mediante la condición de Activo3, por el
otro lado la población Inactiva viene siendo representada por el 31.7% del resto de la Población en Edad de
Trabajar.
En lo que se refiere a la participación en el mercado laboral por sexo, podemos ver que el 54.5% está
compuesto por hombres, mientras que el restante 45.5% está conformado por mujeres. En el caso de la
población que participa en el mercado laboral aproximadamente el 59.1% de esta se encuentra en situación
de casado, mientras el restante 40.9% posee otra condición de estado civil. Así mismo del total de la
población que participa en el mercado laboral se tiene que el 56.6% es jefe de hogar y el restante 43.4% no
cumple con este papel.
3 Para el cálculo de esta cifra no se están aplicando los factores de expansión poblacional por estarse analizando la información
disponible en la Encuesta Nacional de Hogares.
40,0
45,0
50,0
55,0
60,0
Hombre Mujer
0,0
15,0
30,0
45,0
60,0
75,0
No Casado Casado
0,0
10,0
20,0
30,0
40,0
50,0
60,0
No Jefe de hogar Jefe de hogar
10. Página | 10
En lo que respecta a la población que participa en el mercado laboral y que cuenta con hijos menores de 5
años de edad, se puede observar que las familias que participan en el mercado laboral tienen un máximo de
3 hijos menores de 5 años. En lo que respecta a la población que participa en el mercado laboral y su edad,
se puede observar que a partir de los 90 años de edad el número de participantes en el mercado laboral
disminuye.
0
1
0 1 2 3
Numh5
Participación
0
1
10 20 30 40 50 60 70 80 90 100
Edad
Participación
0
1
0 4 8 12 16 20
Educación
Participación
0
1
0 2 4 6 8 10 12
Ingresh
Participación
11. Página | 11
Ahora procederemos a analizar los resultados de la estimación de los modelos de regresión descritos
anteriormente y como las variables señaladas impactan en la probabilidad de participación en el mercado
laboral de la población de la región Arequipa.
En lo que se refiere a la aplicación del modelo de regresión lineal, que como ya mencionamos no se
encuentra acotado entre 0 y 1, se obtienen los siguientes coeficientes.
Participación = β0 + β1*Sexo + β2*Casado + β3*Jefeh + β4*Numh5 + β5*Edad + β6*Educación
+ β7*Ingresh + u
Pr(Participación=1) = β0 + β1*Sexo + β2*Casado + β3*Jefeh + β4*Numh5 + β5*Edad +
β6*Educación + β7*Ingresh
Dependent Variable: Y
Method: Least Squares
Date: 08/03/17 Time: 11:21
Sample: 1 4586
Included observations: 4586
Variable Coefficient Std. Error t-Statistic Prob.
SEXO -0.067979 0.014105 -4.819560 0.0000
CASADO 0.223148 0.014892 14.98485 0.0000
JEFEH 0.201765 0.016064 12.55988 0.0000
NUMH5 -0.080957 0.014417 -5.615425 0.0000
EDAD -0.003486 0.000466 -7.482578 0.0000
EDUCACION 0.012013 0.001579 7.606986 0.0000
INGRESH -0.012284 0.002194 -5.598219 0.0000
C 0.617474 0.033106 18.65156 0.0000
R-squared 0.122505 Mean dependent var 0.683166
Adjusted R-squared 0.121163 S.D. dependent var 0.465293
S.E. of regression 0.436195 Akaike info criterion 1.180287
Sum squared resid 871.0368 Schwarz criterion 1.191505
Log likelihood -2698.397 Hannan-Quinn criter. 1.184236
F-statistic 91.30357 Durbin-Watson stat 1.877970
Prob(F-statistic) 0.000000
En el caso de una mujer casada que es jefe de hogar, que tiene 1 hijo menor de 5 años y cuya edad es
digamos de unos 35 años, además de que cuenta con unos 10 años de educación y cuyos ingresos de
hogar son de S/. 1500 aproximadamente, la probabilidad de esta persona de participar en el mercado
laboral es de 80.2%.
12. Página | 12
Pr( 1 )i i iy X X
Pr( 1 )i iy X = 0.61-0.07*1+0.22*1+0.20*1-0.08*1-0.003*35+0.01*10-0.01*7.3
Pr( 1 )i iy X = 0.802
Así mismo se puede observar en el siguiente grafico las observaciones proyectadas para cada individuo de
la muestra, considerando las variables correspondientes. En dicho grafico se puede visualizar que en el
modelo de probabilidad lineal existen varios casos cuyas probabilidades no se encuentran acotadas,
pudiéndose observar probabilidades que superan la unidad4.
Ahora en el caso del modelo de probabilidad logit, cuyas probabilidades se encuentran acotadas entre 0 y
1, se tienen estimados los coeficientes del modelo ya descrito con anterioridad.
Participación = F(β0 + β1*Sexo + β2*Casado + β3*Jefeh + β4*Numh5 + β5*Edad +
β6*Educación + β7*Ingresh + u )
Pr(Participación=1) = F(β0 + β1*Sexo + β2*Casado + β3*Jefeh + β4*Numh5 + β5*Edad +
β6*Educación + β7*Ingresh)
4 Anteriormente ya se mencionó que el modelo de probabilidad lineal tiene como defecto el que no se encuentra acotado entre 0 y
1, lo que posibilita probabilidades negativas y probabilidades mayores al 100%.
0.2
0.4
0.6
0.8
1.0
1.2
500 1000 1500 2000 2500 3000 3500 4000 4500
Probabilidad
13. Página | 13
Dependent Variable: Y
Method: ML - Binary Logit (Newton-Raphson / Marquardt steps)
Date: 08/03/17 Time: 14:03
Sample: 1 4586
Included observations: 4586
Convergence achieved after 3 iterations
Coefficient covariance computed using observed Hessian
Variable Coefficient Std. Error z-Statistic Prob.
SEXO -0.416240 0.072759 -5.720797 0.0000
CASADO 1.263144 0.083349 15.15482 0.0000
JEFEH 1.145100 0.088572 12.92846 0.0000
NUMH5 -0.440083 0.077984 -5.643255 0.0000
EDAD -0.019861 0.002486 -7.987488 0.0000
EDUCACION 0.061960 0.008280 7.482800 0.0000
INGRESH -0.069055 0.012512 -5.519050 0.0000
C 0.627093 0.174217 3.599492 0.0003
McFadden R-squared 0.109207 Mean dependent var 0.683166
S.D. dependent var 0.465293 S.E. of regression 0.434968
Akaike info criterion 1.116018 Sum squared resid 866.1430
Schwarz criterion 1.127236 Log likelihood -2551.029
Hannan-Quinn criter. 1.119967 Deviance 5102.058
Restr. Deviance 5727.545 Restr. log likelihood -2863.773
LR statistic 625.4873 Avg. log likelihood -0.556265
Prob(LR statistic) 0.000000
Obs with Dep=0 1453 Total obs 4586
Obs with Dep=1 3133
En este sentido, si consideramos el ejemplo anterior en el que se tenía a una mujer casada que es jefe de
hogar, que tiene 1 hijo menor de 5 años y cuya edad es digamos de unos 35 años, además de que cuenta
con unos 10 años de educación y cuyos ingresos de hogar son de S/. 1500 aproximadamente la
probabilidad de esta persona de participar en el mercado laboral es de 82.6%.
Pr( 1 ) ( )i i iy X X
exp(0.63 0.42*1 1.26*1 1.15*1 0.44*1 0.02*35 0.06*10 0.07*7.31)
Pr( 1 )
1 exp(0.63 0.42*1 1.26*1 1.15*1 0.44*1 0.02*35 0.06*10 0.07*7.31)
i iy X
Pr( 1 ) 0.8262i iy X
14. Página | 14
De igual manera se puede observar las diferentes probabilidades estimadas para cada observación de la
muestra que se ha utilizado en la estimación del modelo logit. En el siguiente grafico se observa que en la
muestra todas las probabilidades de participación en el mercado laboral se encuentran entre 0 y 1.
Ahora si consideramos el modelo probit para el mismo caso descrito anteriormente veremos que nos da un
valor z=1.07 lo que corresponde a una probabilidad de participación del 85.8%
Participación = Φ(β0 + β1*Sexo + β2*Casado + β3*Jefeh + β4*Numh5 + β5*Edad +
β6*Educación + β7*Ingresh + u )
Pr(Participación=1) = Φ (β0 + β1*Sexo + β2*Casado + β3*Jefeh + β4*Numh5 + β5*Edad +
β6*Educación + β7*Ingresh)
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
500 1000 1500 2000 2500 3000 3500 4000 4500
Probabilidad Logit
15. Página | 15
Dependent Variable: Y
Method: ML - Binary Probit (Newton-Raphson / Marquardt steps)
Date: 10/05/17 Time: 21:49
Sample: 1 4586
Included observations: 4586
Convergence achieved after 4 iterations
Coefficient covariance computed using observed Hessian
Variable Coefficient Std. Error z-Statistic Prob.
SEXO -0.250379 0.043404 -5.768613 0.0000
CASADO 0.740507 0.048704 15.20437 0.0000
JEFEH 0.664631 0.051180 12.98603 0.0000
NUMH5 -0.252827 0.046705 -5.413224 0.0000
EDAD -0.012012 0.001456 -8.250428 0.0000
EDUCACION 0.036040 0.004923 7.321071 0.0000
INGRESH -0.041848 0.007284 -5.745249 0.0000
C 0.408280 0.103735 3.935798 0.0001
McFadden R-squared 0.109103 Mean dependent var 0.683166
S.D. dependent var 0.465293 S.E. of regression 0.435160
Akaike info criterion 1.116148 Sum squared resid 866.9085
Schwarz criterion 1.127366 Log likelihood -2551.327
Hannan-Quinn criter. 1.120097 Deviance 5102.655
Restr. Deviance 5727.545 Restr. log likelihood -2863.773
LR statistic 624.8910 Avg. log likelihood -0.556330
Prob(LR statistic) 0.000000
Obs with Dep=0 1453 Total obs 4586
Obs with Dep=1 3133
Ahora aplicamos los coeficientes calculados al mismo ejemplo que ya se trató anteriormente de la mujer
casada que es jefe de hogar, que tiene 1 hijo menor de 5 años y cuya edad es digamos de unos 35 años,
además de que cuenta con unos 10 años de educación y cuyos ingresos de hogar son de S/. 1500. En este
ejemplo de acuerdo al modelo probit, se encuentra un valor z de 1.07, y si buscamos en una tabla de la
función de distribución normal estándar dicho valor z, encontraremos una probabilidad de 85.8%
aproximadamente. Entonces podemos decir que la probabilidad de participación de esta persona en el
mercado laboral es de 85.8%.
Pr( 1 ) (0.41 0.25*1 0.74*1 0.66*1 0.25*1 0.01*35 0.04*10 0.04*7.3)i iy X
Pr( 1 ) (1.07)i iy X
Pr( 1 ) 0.8577i iy X
16. Página | 16
A continuación, en el siguiente grafico donde se pueden observar las probabilidades estimadas del modelo
probit se puede corroborar que estas se encuentran acotadas entre 0 y 1.
Conclusiones
Pese a que el modelo lineal de probabilidad no se encuentre acotado entre 0 y 1, podemos observar que
comparte algunas características similares con el modelo Logit y Probit. En este sentido al observar los tres
modelos podemos concluir que la participación laboral de la población en la región Arequipa viene siendo
afectada principalmente por la condición de casado de las personas y por el hecho de ser jefe de hogar.
Ambas variables tienen un efecto positivo en la probabilidad de participación en el mercado laboral.
En segundo lugar se tiene que el hecho de ser mujer tiene un efecto negativo en la participación laboral de
la población. Este efecto negativo se mantiene en los tres modelos de probabilidad, no significando esto que
sean necesariamente los mismos. Es decir, según los tres modelos de probabilidad el ser mujer reduce la
probabilidad de participar en el mercado laboral.
En tercer lugar también se puede observar en los tres modelos un efecto negativo del número de hijos
menores de 5 años en la participación laboral de la población de la región Arequipa. Las magnitudes de
dichos efectos son diferentes en cada uno de los modelos de probabilidad.
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
500 1000 1500 2000 2500 3000 3500 4000 4500
Probabilidad Probit
17. Página | 17
De acuerdo a los tres modelos se tiene que la edad presenta un efecto negativo en la probabilidad de
participar en el mercado laboral. En este caso el análisis sugiere que a mayor edad existe un menor interés
de la población en participar en el mercado laboral.
Los años de educación tienen un efecto positivo en la probabilidad de participación en el mercado laboral
para la población de la región Arequipa. En este caso se puede decir que individuos con más años de
educación son más propensos a participar del mercado laboral en busca de mayores beneficios.
Por último, se tiene el ingreso del hogar, el cual también tiene un efecto negativo en la probabilidad de
participar del mercado laboral. Esto se explicaría porque al tener una buena situación económica en el
hogar, no existe la necesidad de participar en el mercado laboral. Esta situación se manifiesta en los tres
modelos de probabilidad.
18. Página | 18
Bibliografía
Ayala, A. (2014). Indicadores sociales y de desigualdad en base a la ENAHO con Stata. Universidad
Nacional Mayor de San Marcos.
Cameron, C., & Trivedi, P. (s.f.). Microefconometrics Methods and applications. Cambridge University Press.
Hosmer, D., & Lemeshow, S. (s.f.). Applied logistic regression. Library of congress cataloging in publication
data.
Jhonton, J., & Dinardo, J. (s.f.). Econometrics Methods. Mc Grau-Hill.
Larrañaga, P., Inza, I., & Moujahid, A. (s.f.). Regresion Logistica. Universidad del País Vasco.
Leasaski, D. A., & Crispín, Á. R. (2010). La oferta laboral juvenil de la region moquegua. Ministerio de
trabajo.
Millones, E. A. (2003). Modelos Probit y Tobit aplicados al estudio de la oferta. Universidad Nacional de San
Marcos.
Mora, J. J., & Ulloa, M. P. (s.f.). El efecto de la educación sobre la calidad del empleo en Colombia.
Universidad Icesi.
O’Halloran, S. (s.f.). Sustainable Development U9611 Econometrics II.
Stock, J. H., & Watson, M. M. (2012). Introducción a la Econometria.
Vera, N. P., Gil, J. F., Chavez, I. E., & Manayay, D. T. (2015). Informe Anual del Empleo en el Perú.