Este documento presenta una serie de ejercicios para que los estudiantes aprendan a utilizar una base de datos relacional con el programa Stata. Incluye 9 preguntas sobre la ENIGH 2010 con sus respuestas y los pasos necesarios para obtener dichas respuestas utilizando Stata. El objetivo es que los estudiantes aprendan resolviendo las preguntas por sí mismos con la menor ayuda posible.
1. Práctica ENIGH 2010. Introducción
En esta presentación se hacen un
conjunto de ejercicios para que
los estudiantes aprendan a
utilizar una base de datos
relacional con el programa de
STATA.
Francisco Calderón A. 1
2. Práctica ENIGH 2010. Introducción
La metodología consiste en plantear preguntas
para la información de la ENIGH, los estudiantes
intenten responder por ellos mismos la pregunta.
Esto es muy importante ya que el programa de
Stata se aprende en la medida que se les
ocurran las instrucciones necesarias para obtener
la información que requieren.
Si no llegan a la solución se les ira
proporcionando avances del procedimiento
hasta entender cómo se obtuvo el
resultado, pero siempre deben de tratar de
resolver las preguntas con la menor ayuda
posible.
Francisco Calderón A. 2
3. Práctica ENIGH 2010. Estructura
La estructura de la práctica es la siguiente:
1. Se plantea una pregunta
2. Se da la respuesta
3. Se da uno o dos avances para que el
estudiante pueda llegar a la respuesta
4. Se da el procedimiento para obtener la
respuesta.
Francisco Calderón A. 3
4. Práctica ENIGH 2010. Estructura
En algunos procedimientos se utiliza el nombre
de un archivo, en instrucciones del tipo: use, save
o merge, en esos casos deben cambiar el
nombre del archivo y poner el nombre del
archivo que haga referencia a la ubicación de
ese archivo en su computadora.
Francisco Calderón A. 4
5. Práctica ENIGH 2010. Preg. 1
1. ¿Cuántos hogares fueron encuestados en la ENIGH 2010?
R1. 27,655 hogares
Francisco Calderón A. 5
6. Práctica ENIGH 2010. Preg. 1
1. ¿Cuántos hogares fueron encuestados en la ENIGH 2010?
R1. 27,655 hogares
Avance 1. Abrir el archivo Hogares.dta
Francisco Calderón A. 6
7. Práctica ENIGH 2010. Preg. 1
P1. ¿Cuántos hogares fueron encuestados en la ENIGH 2010?
R1. 27,655 hogares
Avance 1. Abrir el archivo Hogares.dta
Procedimiento.
count
Francisco Calderón A. 7
8. Práctica ENIGH 2010. Preg. 2
P2. ¿Qué porcentaje de los hogares tienen piso de tierra?
R2. 4.40% de los hogares
Francisco Calderón A. 8
9. Práctica ENIGH 2010. Preg. 2
P2. ¿Qué porcentaje de los hogares tienen piso de tierra?
R2. 4.40% de los hogares
Avance 1. Revisar el documento “Descripción de la base de datos”
que es un archivo pdf que está en la carpeta “Documentos de
apoyo”, en los archivos generados de la ENIGH 2010.
Francisco Calderón A. 9
10. Práctica ENIGH 2010. Preg. 2
P2. ¿Qué porcentaje de los hogares tienen piso de tierra?
R2. 4.40% de los hogares
Avance 1. Revisar el documento “Descripción de la base de datos”
que es un archivo pdf que está en la carpeta “Documentos de
apoyo”, en los archivos generados de la ENIGH 2010.
Avance 2. Ver las opciones de la variable 6 (pisos) en la página
31 del documento señalado. Instrucción.
Francisco Calderón A. 10
11. Práctica ENIGH 2010. Preg. 2
P2. ¿Qué porcentaje de los hogares tienen piso de tierra?
R2. 4.40% de los hogares
Avance 1. Revisar el documento “Descripción de la base de datos”
que es un archivo pdf que está en la carpeta “Documentos de
apoyo”, en los archivos generados de la ENIGH 2010.
Avance 2. Ver las opciones de la variable 6 (pisos) en la página
31 del documento señalado. Instrucción.
Procedimiento. tab pisos
Francisco Calderón A. 11
12. Práctica ENIGH 2010. Preg. 3
P3. ¿Qué porcentaje de los hogares no recibe agua todos
los días?
R3. 21.12% de los hogares
Francisco Calderón A. 12
13. Práctica ENIGH 2010. Preg. 3
P3. ¿Qué porcentaje de los hogares no recibe agua todos
los días?
R3. 21.12% de los hogares
Avance 1. Revisar el documento “Descripción de la base
de datos”
Francisco Calderón A. 13
14. Práctica ENIGH 2010. Preg. 3
P3. ¿Qué porcentaje de los hogares no recibe agua todos
los días?
R3. 21.12% de los hogares
Avance 1. Revisar el documento “Descripción de la base
de datos”
Avance 2. Consultar la variable 14 (dot_agua) página 32
del documento referido. Instrucción.
Francisco Calderón A. 14
15. Práctica ENIGH 2010. Preg. 3
P3. ¿Qué porcentaje de los hogares no recibe agua todos
los días?
R3. 21.12% de los hogares
Avance 1. Revisar el documento “Descripción de la base
de datos”
Avance 2. Consultar la variable 14 (dot_agua) página 32
del documento referido. Instrucción.
Procedimiento. tab dot_agua
Francisco Calderón A. 15
16. Práctica ENIGH 2010. Preg. 4
P4. ¿El último televisor adquirido por los
hogares, cuántos años tiene de antigüedad?
R4. 5.68 años
Francisco Calderón A. 16
17. Práctica ENIGH 2010. Preg. 4
P4. ¿El último televisor adquirido por los hogares,
cuántos años tiene de antigüedad?
R4. 5.68 años
Avance 1. Consultar la variable eqh4_a en el archivo
hogares, pág. 47.
Francisco Calderón A. 17
18. Práctica ENIGH 2010. Preg. 4
P4. ¿El último televisor adquirido por los
hogares, cuántos años tiene de antigüedad?
R4. 5.68 años
Avance 1. Consultar la variable eqh4_a en el archivo
hogares, pág. 47.
Avance 2. Generar la variable años de antigüedad del
último televisor adquirido.
Francisco Calderón A. 18
19. Práctica ENIGH 2010. Preg. 4
Procedimiento.
gen aniostv = eqh4_a
destring aniostv, replace
gen anti = 10 - aniostv if eqh4_a>="00" & eqh4_a<="10"
replace anti = 100 - aniostv+10 if eqh4_a>="52" & eqh4_a<="99"
sum anti
Francisco Calderón A. 19
20. Práctica ENIGH 2010. gas_tri
Para responder la siguiente
pregunta es importante
señalar que, como los gastos
pueden tener diferente
periodicidad, por lo que para
cada compra la variable
relevante para cuantificar los
gastos del hogar es la variable
gas_tri. Esta variable
representa el monto del gasto
que ese hogar hubiera
hecho, del producto en
cuestión, durante un trimestre.
Francisco Calderón A. 20
21. Práctica ENIGH 2010. Preg. 5
P5. ¿Cuál es el monto de gasto total de los hogares
dedicados a la compra de jitomate?
R5. 4,557,250.94 pesos al trimestre
Francisco Calderón A. 21
22. Práctica ENIGH 2010. Preg. 5
P5. ¿Cuál es el monto de gasto total de los hogares
dedicados a la compra de jitomate?
R5. 4,557,250.94 pesos al trimestre
Avance 1. Abrir al archivo Gastodiario.dta y consultar el
Catálogos de códigos del documento: Descripción de la
base de datos.
Francisco Calderón A. 22
23. Práctica ENIGH 2010. Preg. 5
P5. ¿Cuál es el monto de gasto total de los hogares
dedicados a la compra de jitomate?
R5. 4,557,250.94 pesos al trimestre
Avance 1. Abrir al archivo Gastodiario.dta y consultar el
Catálogos de códigos del documento: Descripción de la
base de datos.
Avance 2. Hacer un sum para el código A124.
Francisco Calderón A. 23
24. Práctica ENIGH 2010. Preg. 5
Procedimiento.
sum gas_tri if clave==“A124”
dis 32907*138.4888
Francisco Calderón A. 24
25. Práctica ENIGH 2010. Preg. 6
P6. ¿Qué porcentaje del gasto total en alimentos se
dedica a verduras, legumbres y frutas frescas?
R6. 10.08%
Francisco Calderón A. 25
26. Práctica ENIGH 2010. Preg. 6
P6. ¿Qué porcentaje del gasto total en alimentos se
dedica a verduras, legumbres y frutas frescas?
R6. 10.08%
Avance 1. Pensar en la instrucción collapse para obtener
el gasto en los alimentos frescos.
Francisco Calderón A. 26
27. Práctica ENIGH 2010. Preg. 6
P6. ¿Qué porcentaje del gasto total en alimentos se
dedica a verduras, legumbres y frutas frescas?
R6. 10.08%
Avance 1. Pensar en la instrucción collapse para obtener
el gasto en los alimentos frescos.
Avance 2. Borrar del archivo los que no son alimentos.
Francisco Calderón A. 27
28. Práctica ENIGH 2010. Preg. 6
Procedimiento.
drop if clave>="B001"
gen frescos=0 if clave>="A001" & clave<="A106"
replace frescos = 0 if clave>="A133" & clave<="A146"
replace frescos = 0 if clave>="A171" & clave<="A231"
replace frescos = 1 if clave>="A107" & clave<="A132"
replace frescos = 1 if clave>="A147" & clave<="A170"
gen gfrescos = frescos*gas_tri
collapse (sum) gfrescos gas_tri,by(folioviv foliohog)
sum gas_tri
sum gfrescos
dis 782.396/7761.106
Francisco Calderón A. 28
29. Práctica ENIGH 2010. Preg. 7
P7. ¿Cuál es el coeficiente de correlación entre los gastos en
alimentación y los gastos en cuidados de la salud?
R7. .1834
Francisco Calderón A. 29
30. Práctica ENIGH 2010. Preg. 7
P7. ¿Cuál es el coeficiente de correlación entre los gastos en
alimentación y los gastos en cuidados de la salud?
R7. .1834
Avance 1. Renombra la variable gas_tri de la pregunta
anterior, guarda el archivo y abre el archivo Gastos.dta.
Francisco Calderón A. 30
31. Práctica ENIGH 2010. Preg. 7
P7. ¿Cuál es el coeficiente de correlación entre los gastos en
alimentación y los gastos en cuidados de la salud?
R7. .1834
Avance 1. Renombra la variable gas_tri de la pregunta
anterior, guarda el archivo y abre el archivo Gastos.dta.
Avance 2. Borra todos los gastos que no tengan clave
que inicie con “J”. Haz un colapse y un merge con el
archivo que guardaste.
Francisco Calderón A. 31
32. Práctica ENIGH 2010. Preg. 7
Procedimiento. A las instrucciones de la pregunta anterior
agrega:
rename gas_tri galimentos
sort folioviv foliohog
save “C:alimentos.dta", replace
use "C:Gastos.dta", clear
keep if clave>="J001" & clave <="J072"
collapse (sum) gas_tri, by(folioviv foliohog)
rename gas_tri gsalud
sort folioviv foliohog
merge 1:1 folioviv foliohog using "C:alimentos.dta"
corr gsalud galimentos
Francisco Calderón A. 32
33. Práctica ENIGH 2010. Preg. 8
P8. Calcula la diferencia entre la edad de cada miembro del
hogar y la persona con mas años en ese hogar ¿Cuál es el
promedio de esas diferencias?
R8. -20.30 años
Francisco Calderón A. 33
34. Práctica ENIGH 2010. Preg. 8
P8. Calcula la diferencia entre la edad de cada miembro del
hogar y la persona con mas años en ese hogar ¿Cuál es el
promedio de esas diferencias?
R8. -20.30 años
Avance 1. Abre el archivo Poblacion.dta.
Francisco Calderón A. 34
35. Práctica ENIGH 2010. Preg. 8
P8. Calcula la diferencia entre la edad de cada miembro del
hogar y la persona con mas años en ese hogar ¿Cuál es el
promedio de esas diferencias?
R8. -20.30 años
Avance 1. Abre el archivo Poblacion.dta.
Avance 2. Repasa la instrucción egen.
Francisco Calderón A. 35
36. Práctica ENIGH 2010. Preg. 8
Procedimiento.
use "C:Poblacion.dta", clear
keep folioviv foliohog edad
egen medad= max(edad), by (folioviv foliohog)
gen difedad = edad-medad
sum difedad
Francisco Calderón A. 36
37. Práctica ENIGH 2010. Preg. 9
P9. ¿Ganan más los hombres o las mujeres? Si se toma en
cuenta sólo los ingresos del archivo de Ingresos.dat, ¿cuánto
gana los hombres y cuánto las mujeres?
R9. Hombres: 5,374 pesos mensuales
Mujeres: 3,277 pesos mensuales
Francisco Calderón A. 37
38. Práctica ENIGH 2010. Preg. 9
P9. ¿Ganan más los hombres o las mujeres? Si se toma en
cuenta sólo los ingresos del archivo de Ingresos.dat, ¿cuánto
gana los hombres y cuánto las mujeres?
R9. Hombres: 5,374 pesos mensuales
Mujeres: 3,277 pesos mensuales
Avance 1. Debes entender cuál es la unidad de
observación del archivo Ingresos.dta
Francisco Calderón A. 38
39. Práctica ENIGH 2010. Preg. 9
P9. ¿Ganan más los hombres o las mujeres? Si se toma en
cuenta sólo los ingresos del archivo de Ingresos.dat, ¿cuánto
gana los hombres y cuánto las mujeres?
R9. Hombres: 5,374 pesos mensuales
Mujeres: 3,277 pesos mensuales
Avance 1. Debes entender cuál es la unidad de
observación del archivo Ingresos.dta
Avance 2. Colapsar el archivo de Ingresos y juntarlos con
Población. Francisco Calderón A. 39
40. Práctica ENIGH 2010. Preg. 9
Procedimiento.
use "D:Poblacion.dta", clear
gen mujer = 0 if sexo =="1"
replace mujer = 1 if sexo == "2"
keep folioviv foliohog numren mujer
sort folioviv foliohog numren
save "D:mujer.dta", replace
use "D:Ingresos.dta", clear
collapse (sum) ing_tri, by (folioviv foliohog numren)
sort folioviv foliohog numren
merge 1:1 folioviv foliohog numren using "D:mujer.dta"
gen ingreso = ing_tri/3
table mujer, c(mean ingreso)
Francisco Calderón A. 40