Estructura y elaboración de un presupuesto financiero
ANÁLISIS DE INGRESOS Y HORAS LABORADAS POR SEXO
1. SEMINARIO EN MODELOS ECONOMÉTRICOS
TAREA # 1
Estudiante: Antonio Rodriguez Esguerra
Fecha de Entrega: Abril 5, 2018. 5:00 pm.
1. Compruebe la hipótesis de que la edad promedio de las personas es de 40 años.
Se realizó el análisis de la información enviada correspondiente a una pequeña sub-muestra de la
GEIH (Gran Encuesta Integrada de Hogares) delDANE de 2016. La información contenida en dicho
archivo se refiere a características socioeconómicas y demográficas de la población urbana en
Colombia en 2016.
Se seleccionaron los datos de la columna p6040, correspondiente a la pregunta: ¿cuántos años
cumplidos tiene...? (si es menor de 1 año, escriba 00), representando la edad de la muestra.
El análisis de la muestra arrojó los siguientes datos de estadística descriptiva:
Estadística descriptiva
Edad
Media 38,728
Error típico 0,79724226
Mediana 36
Moda 31
Desviaciónestándar 17,8268789
Varianzade la muestra 317,797611
Curtosis
-
0,45736244
Coeficiente de asimetría 0,50087082
Rango 81
Mínimo 12
Máximo 93
Suma 19364
Cuenta 500
Se realizó el análisis de la muestra asumiendo una distribución estándar normalizada, utilizando la
desviación estándar de la muestra ya que el sigma poblacional es desconocido. La prueba se aplicó
con un nivel de significancia de 0.05.
2. Distribución normal estándar)
Paso 1: DeterminarHo y H1
Ho
Edad
promedioµ = 40
H1
Edad
promedioµ ≠ 40
Paso 2: determinarel nivel de significancia
nivel de significanciaα 0,05
Paso 3: determinarel nivel de confianza
nivel de confianza 95,00%
límite del intervalode confianzaZ 1,959963985
Paso 4: Calcular estadísticode prueba (z tipificado)
µ 40
x 38,728
desviaciónestándar 17,8268789
tamañomuestra 500
Promediomuestral x 38,728
Desviaciónestándarmuestral s 17,8268789
desviaciónestándarnormalizada 0,797242261
z normalizado (estadísticode prueba)
-
1,595499966
Paso 5: determinarsi el estadísticode pruebacae enla zona de confianza
z tipificado(estadísticode prueba)
-
1,595499966
Z
-
1,959963985
El valordel estadísticode pruebazes -1,595499966 porlo tanto esmayorque el límite del
intervalode confianzaZque es -1,959963985, por lo tanto,el estadísticode pruebacae dentro
de la zona de confianza.
De acuerdoa lo anteriornose cuentacon la evidenciasuficientepararechazar la Ho, esdecir
que con un nivel de significanciadel 0,05 nopuede rechazarse lahipótesisque el promediode
edadde la poblaciónesde 40 años de acuerdocon la muestraanalizada.
3. ENSAYO: ¿LOS DESEMPLEADOS TIENEN LOS MISMOS AÑOS DE
EDUCACIÓN QUE LOS EMPLEADOS?
Antonio RodriguezEsguerra1
El objetivo del presente escrito es evaluar si la evidencia estadística apoya la
hipótesis de que los desempleados tienen los mismos años de educación que los
empleados, para conseguir el objetivo planteado se utilizó una pequeña sub-
muestra de la GEIH (Gran Encuesta Integrada de Hogares) del DANE de 2016. La
información contenida en dicho archivo se refiere a características socioeconómicas
y demográficas de la población urbana en Colombia en 2016.
Se aislaron las columnas esc (años de escolaridad) y unem (dummy para
desempleado), en la cual se representa con 0 la condición de empleado y con 1 la
condición de desempleado, también se aislaron los registros vacíos ya que no es
posible confrontar los años de escolaridad sin conocer la condición de empleo.
Se obtuvieron los siguientes datos de estadística descriptiva para cada una de las
submuestras para cada condición de empleo:
Empleados Desempleados
Media 10,65625 Media 11,7142857
Error típico 0,24325415 Error típico 0,75917169
Mediana 11 Mediana 11
Moda 11 Moda 11
Desviaciónestándar 4,12815975 Desviaciónestándar 4,01715896
Varianza de la muestra 17,041703 Varianza de la muestra 16,1375661
Curtosis
-
0,24062272 Curtosis 0,20401726
Coeficiente de asimetría
-
0,45542486 Coeficiente de asimetría
-
0,43184234
Rango 19 Rango 18
Mínimo 0 Mínimo 2
Máximo 19 Máximo 20
Suma 3069 Suma 328
Cuenta 288 Cuenta 28
Nivel de confianza(95,0%) 0,47878841 Nivel de confianza(95,0%) 1,55769163
1 Doctorando en Modelado en gestión y política pública Universidad de Bogotá Jorge Tadeo
Lozano
4. Se aplicó una Prueba t para dos muestras suponiendo varianzas desiguales y se
obtuvieron los siguientes datos:
Variable 1 Variable 2
Media 10,65625 11,7142857
Varianza 17,041703 16,1375661
Observaciones 288 28
Diferencia hipotética de las
medias 0
Grados de libertad 33
Estadísticot -1,32720402
P(T<=t) una cola 0,09677551
Valor crítico de t (una cola) 1,69236031
P(T<=t) dos colas 0,19355103
Valor crítico de t (dos colas) 2,0345153
Alfa 0,05
El estadístico t obtenido es igual a -1,327204, y el valor crítico de t para dos colas
de 2,034515297, teniendo en cuenta que es una distribución de dos colas, el
estadístico de prueba queda dentro del intervalo de confianza, lo cual indica que
con un nivel de significancia de 0,05 no existe la evidencia suficiente para rechazar
la hipótesis que los empleados y los desempleados poseen los mismos años de
escolaridad basados en la muestra analizada.
De acuerdo con lo anterior es posible afirmar que existe una probabilidad del 95%
que la evidencia estadística arrojada por la submuestra analizada apoye la hipótesis
que de que los desempleados tienen los mismos años de educación que los
empleados, debido a que la prueba de hipótesis estadística no nos permite tener
evidencia para rechazar tal afirmación, así dicho es posible que la condición de
desempleo de la población no encuentre causalidad con la cantidad de educación
recibida ya que la evidencia que tenemos es que este factor no es una determinante
que se encuentre en un nivel de desconfianza, es decir que nos permita afirmar que
la condición de desempleo sea mitigada por contar con mayor cantidad de años en
el sistema educativo.
5. ENSAYO: ¿GANAN IGUAL LOS HOMBRES Y LAS MUJERES EN COLOMBIA?
Antonio RodriguezEsguerra2
El presente escrito pretende analizar si la evidencia estadística apoya la hipótesis
de que los hombres ganan el mismo ingreso mensual que las mujeres, para
conseguir el objetivo planteado se utilizó una pequeña sub-muestra de la GEIH
(Gran Encuesta Integrada de Hogares) del DANE de 2016. La información contenida
en la mencionada muestra se refiere a características socioeconómicas y
demográficas de la población urbana en Colombia en 2016.
Se aislaron las columnas p6020 (sexo) e inglabo (ingresos laborales mensuales),
se procedió a filtrar los ingresos laborales por sexo, discriminando dos submuestras:
ingresos laborales mensuales para hombres e ingresos laborales mensuales para
mujeres, de estas submuestras se obtuvieron los siguientes datos de estadística
descriptiva (Cuadro 1):
Ingresos laborales Hombres Ingresos laborales Mujeres
Media 1056522,99 Media 909911,853
Error típico 77175,4943 Error típico 108818,449
Mediana 800000 Mediana 700000
Moda 800000 Moda 700000
Desviación estándar 932515,046 Desviación estándar 1136097,96
Varianza dela muestra 8,6958E+11 Varianza dela muestra 1,2907E+12
Curtosis 31,6340076 Curtosis 39,1132013
Coeficiente de asimetría 4,57001605 Coeficiente de asimetría 5,41446168
Rango 8700000 Rango 10000000
Mínimo 0 Mínimo 0
Máximo 8700000 Máximo 10000000
Suma 154252357 Suma 99180392
Cuenta 146 Cuenta 109
Cuadro 1: Estadística descriptiva para ingresos laborales de hombres y mujeres
2 Doctorando en Modelado en gestión y política pública Universidad de Bogotá Jorge Tadeo
Lozano
6. Posteriormente se realizó una prueba t con un nivel de significancia de 0,05 para
las dos muestras con varianzas muestrales diferentes, obteniendo un estadístico t
igual a1,09897 y un valor crítico de t para dos colas de 1,9716035, como se muestra
en el cuadro 2:
Variable 1 Variable 2
Media 1056522,99 909911,853
Varianza 8,6958E+11 1,2907E+12
Observaciones 146 109
Diferencia hipotética de las medias 0
Grados de libertad 205
Estadístico t 1,09897377
P(T<=t) una cola 0,13653424
Valor crítico de t (una cola) 1,65232056
P(T<=t) dos colas 0,27306848
Valor crítico de t (dos colas) 1,9716035
Cuadro 2: Prueba t para dos muestras suponiendo varianzas desiguales
Teniendo en cuenta que el estadístico de prueba queda dentro del intervalo de
confianza, puede afirmarse con un nivel de significancia de 0,05 que no se tiene la
evidencia suficiente para rechazar la hipótesis de que los hombres y las mujeres
ganan los mismos ingresos salariales basados en la muestra analizada.
De acuerdo con la evidencia estadística planteada anteriormente, es posible afirmar
que existen otras variables asociadas a las posibles diferencias salariales entre
hombres y mujeres para la población colombiana, y que lo que puede afirmarse es
que las posibles diferencias salariales no pueden analizarse solamente con
información de sexo e ingreso económico.
7. ENSAYO: ¿GANAN IGUAL LOS HOMBRES Y LAS MUJERES EN COLOMBIA?
Antonio RodriguezEsguerra3
El presente escrito pretende analizar si la evidencia estadística apoya la hipótesis
de que los hombres ganan el mismo ingreso mensual que las mujeres, para
conseguir el objetivo planteado se utilizó una pequeña sub-muestra de la GEIH
(Gran Encuesta Integrada de Hogares) del DANE de 2016. La información contenida
en la mencionada muestra se refiere a características socioeconómicas y
demográficas de la población urbana en Colombia en 2016.
Se realizaron dos análisis; primero se aislaron las columnas p6020 (sexo) e inglabo
(ingresos laborales mensuales), se procedió a filtrar los ingresos laborales por sexo,
discriminando dos submuestras: ingresos laborales mensuales para hombres e
ingresos laborales mensuales para mujeres, la estadística descriptiva de ésta
submuestra se registra en el cuadro 1.
Posteriormente se aislaron las columnas p6020 (sexo) y p6800 (¿cuántas horas a
la semana trabaja normalmente ... en ese trabajo?), la cual representa las horas
laboradas semanalmente, se discriminaron dos submuestras: horas laboradas para
hombres y horas laboradas para mujeres, la estadística descriptiva de ésta
submuestra se registra en el cuadro 2:
Ingresos laborales Hombres Ingresos laborales Mujeres
Media 1056522,99 Media 909911,853
Error típico 77175,4943 Error típico 108818,449
Mediana 800000 Mediana 700000
Moda 800000 Moda 700000
Desviación estándar 932515,046 Desviación estándar 1136097,96
Varianza dela muestra 8,6958E+11 Varianza dela muestra 1,2907E+12
Curtosis 31,6340076 Curtosis 39,1132013
Coeficiente de asimetría 4,57001605 Coeficiente de asimetría 5,41446168
Rango 8700000 Rango 10000000
3 Doctorando en Modelado en gestión y política pública Universidad de Bogotá Jorge Tadeo
Lozano
8. Mínimo 0 Mínimo 0
Máximo 8700000 Máximo 10000000
Suma 154252357 Suma 99180392
Cuenta 146 Cuenta 109
Cuadro 1: Estadística descriptiva para ingresos laborales de hombres y mujeres
Horas laboradas hombres Horas laboradas mujeres
Media 50 Media 42,8968254
Error típico 1,05038557 Error típico 1,5858433
Mediana 48 Mediana 48
Moda 48 Moda 48
Desviaciónestándar 13,4104253 Desviaciónestándar 17,8010469
Varianza de la muestra 179,839506 Varianza de la muestra 316,87727
Curtosis 3,26327946 Curtosis 3,59362206
Coeficiente de asimetría 0,64374314 Coeficiente de asimetría 0,80192841
Rango 102 Rango 115
Mínimo 10 Mínimo 5
Máximo 112 Máximo 120
Suma 8150 Suma 5405
Cuenta 163 Cuenta 126
Cuadro 2: Estadística descriptiva para horas laboradas para hombres y mujeres
Posteriormente se realizó una prueba t con un nivel de significancia de 0,05 para
las dos submuestras relacionadas con el ingreso para hombres y mujeres con
varianzas muestrales diferentes, obteniendo un estadístico t igual a1,09897 y un
valor crítico de t para dos colas de 1,9716035, como se muestra en el cuadro 3:
Variable 1 Variable 2
Media 1056522,99 909911,853
Varianza 8,6958E+11 1,2907E+12
Observaciones 146 109
Diferencia hipotética de las medias 0
Grados de libertad 205
Estadístico t 1,09897377
P(T<=t) una cola 0,13653424
Valor crítico de t (una cola) 1,65232056
P(T<=t) dos colas 0,27306848
Valor crítico de t (dos colas) 1,9716035
Cuadro3: Pruebat para dos muestrassuponiendovarianzasdesiguales parael ingresolaboral para
hombres y mujeres.
9. Teniendo en cuenta que el estadístico de prueba queda dentro del intervalo de
confianza, puede afirmarse con un nivel de significancia de 0,05 que no se tiene la
evidencia suficiente para rechazar la hipótesis de que los hombres y las mujeres
ganan los mismos ingresos salariales basados en la muestra analizada.
Ahora bien, si la evidencia estadística planteada anteriormente solo nos permite no
rechazar la hipótesis, es posible afirmar que existen otras variables asociadas a las
posibles diferencias salariales entre hombres y mujeres para la población
colombiana, y que lo que puede afirmarse es que las posibles diferencias salariales
no pueden analizarse solamente con información de sexo e ingreso económico, por
lo tanto se procedió a realizó una prueba t con un nivel de significancia de 0,05 para
las dos submuestras relacionadas con la cantidad de horas laboradas por hombres
y mujeres con varianzas muestrales diferentes como se muestra en el cuadro 4:
Variable 1 Variable 2
Media 50 43,0403226
Varianza 179,839506 317,534946
Observaciones 163 124
Diferencia hipotética de las
medias 0
Grados de libertad 221
Estadístico t 3,63585789
P(T<=t) una cola 0,00017236
Valor crítico de t (una cola) 1,65177768
P(T<=t) dos colas 0,00034471
Valor crítico de t (dos colas) 1,97075627
Cuadro 4: Prueba t para dos muestras suponiendo varianzas desiguales para la cantidad de horas
laboradas por hombres y mujeres.
De la anterior prueba de hipótesis se obtiene un estadístico t igual a 3,635857894 y
un valor crítico de t para una cola de 1,651777679, el estadístico de prueba queda
por fuera del intervalo de confianza, lo cual indica con un nivel de significancia de
0,05 que se tiene la evidencia suficiente para aceptar la hipótesis que las mujeres
trabajan más horas que los hombres basados en la muestra analizada.
10. De la evidencia estadística anterior puede inferirse que aunque no puede
evidenciarse diferencia en los ingresos manifestados por los sujetos pertenecientes
a la muestra y que el análisis estadístico permite lanzar la hipótesis que los ingresos
son iguales para ambos sexos, la prueba de hipótesis para la cantidad de horas
laboradas nos permite afirmar con un 95% de probabilidad que el promedio de las
mujeres colombiana trabajan mas horas que los hombres para completar el mismo
ingreso, lo que supone la existencia de una diferencia salarial entre ambos sexos
apoyada por la evidencia estadística de la muestra analizada.