TIPOS DE ARCHIVOS EN STATA
En STATA, distinguimos 4 tipos de archivos importantes:
      Archivo de extensión dta, para la generación de base de datos, en ella se
      almacenara información de las variables con su respectiva extensión.
      Archivo de extensión log, smcl, para la generación de bitácoras, en ella se
      guardaran los resultados de manera ordenada, sin tener que pasarlos a ningún
      tipo de archivo de texto.
      Archivo de extensión do, que es un archivo de ejecución, donde se elabora el
      programa.
      Archivo de extensión gph, para la generación de gráficos almacenados en la
      carpeta de trabajo




ORDEN INFILE (LEYENDO UN ARCHIVO ASCII)

    1) Cree un archivo en el notepad y guárdelo con extensión .dat
    2) Clic en el menu File/Import/ASCII data created by speadsheet
    3) Seleccione el archive en el escritorio




COMANDOS EJEMPLOS

Estos son ejemplos con el comando summarize (mean, minumum, máximum, etc.):

Prefix         Command        Varlist (Lista   Qualifiers      Options      Comments
(prefijo)      (comando)      de variables)    (Calificadores) (Opciones)   (Comentarios)
               summarize                                                    No hay lista
                                                                            de variables.
                                                                            Todas las
                                                                            variables
               summarize      _all                                          _all: Todas las
                                                                            variables
               summarize      make price                                    Dos variables
               summarize      mpg-turn                                      Variables en
                                                                            secuencia
               summarize      t*                                            Variables que
                                                                            empiecen con
                                                                            t
summarize       price           if foreign==0                     Tipo de carro
                                                                                  domestico
                                                                                  solamente
                summarize       price           in 1/10                           Primeras 10
                                                                                  observaciones
                sort foreign                                                      Separa la
                                                                                  tabla por cada
                                                                                  foraneo
                by foreign:                                                       Deben
                summarize                                                         ordenarse los
                price                                                             datos primero

                summarize       price                             , detail        Opcion, detail




LISTA DE VARIABLES

Una lista de variables (varlist) llama a una o más variables para ser procesadas. Ejemplos:

(nada)                             a veces lo mismo que _all

rep78 weight displacement          tres variables

price mpg-weight                  Price y las variables consecutivas mpg-weight

pro*                              todas las variables que empiecen con pro

En comandos que tienen una variable dependiente, esta es la primera en la lista de variables
(varlist):
oneway bmi sex                    bmi es la variable dependiente
regression bmi sex age            bmi es la variable dependiente
scatter weight height             scatterplot, weight es el eje y
tabulate expos case               La primera variable define las filas




COMANDO CONDICIONAL: EL CALIFICADOR IF
Este operador es usado en condiciones. Aquí hay ejemplos:
summarize mpg if price>10000       estadística para precios mallores a 10000
list make mpg if foreign==0        listar solamente si el tipo da carro es doméstico
replace price=. if foreign==0      Pone en nulo los precios para los carros foráneos

LISTA DE NÚMEROS. EL CALIFICADOR IN
Una lista del número (numlist) es un listado de números; hay algunas posibilidades:
1(3)11                 promedia 1 4 7 10
1(1)4 4.5(0.5)6        promedia 1 2 3 4 4.5 5 5.5 6
4 3 2 7(-1)1           promedia 4 3 2 7 6 5 4 3 2 1
1/5                    promedia 1 2 3 4 5
4/2 7/1                promedia 4 3 2 7 6 5 4 3 2 1
Ejemplo:
list sex age weight in 1/10 // observaciones 1 to 10
twoway line mort year , xlabel(1900(20)2000) // etiqueta del eje x




FREFIJO BY y BYSORT
Comando que hace que se muestren los resultados para subgrupos de datos. Deben pre-
ordenarse los datos:

sort foreign

by foreign: summarize price

o en una sola línea:

bysort foreign: summarize Price



CADENAS DE TEXTOS, CITAS (TEXT STRINGS, QUOTES)

Stata requiere las dobles comillas alrededor de las cadenas de texto, se puede omitir las
citas al menos que las cadenas se encuentren dentro con espacios en blanco o comas:
label define sex 1 male 2 female 9 "sex unknown"
Usted no necesita usar citas alrededor del nombres de archivos:
save c:dokumenterproj1alfa1.dta
al menos que ellos incluyan el espacio en blanco:
save "c:dokumenterproject 1alfa1.dta"


LOS COMENTARIOS
Lo siguiente se interpreta como comentarios, incluyen cortas explicaciones en un
archivo do-file:
Líneas que empiezan con *
Texto rodeado por / * y * /
Texto que sigue / /


COMANDO KEEP/DROP
Drop elimina variables u observaciones de los datos en memoria. Keep trabaja igual a
drop, sólo que usted especifica las variables u observaciones a conservar en lugar de
las variables u observaciones a ser eliminadas1.


Advertencia: keep y drop no son reversibles.




Ejemplo:
drop price
keep make mpg trunk turn foreign length


drop _all        (borra todas las variables y observaciones)
keep in 1/2 (borra todo pero mantiene las observaciones 1 y 2)
drop if price > 4000 (borra las observaciones cuyo precio es mayor a 4000)
drop in 1/2 (borra las 2 primeras observ)
drop pop* (borra las variables que comiencen con pop)



COMANDO SPLIT
Corta variables cadenas entre partes


split make
split make, gen(datos)
rename dato1 xyz


GRÁFICOS EN STATA
Ahora vamos a trabajar con los principales gráficos en Stata. Muchos de estos gráficos
son de bastante utilidad para observar los problemas inherentes al análisis de regresión
que observaremos en la próxima sección.
clear

1
    Help Stata
use auto.dta
                    histogram price
                    graph box price
                    graph box price weight
          3.0e-04
          2.0e-04
Density
          1.0e-04


                            0




                                0     5,000           10,000                  15,000
                                              Price



                                        Histrograma
                                                                     15,000
            15,000




                                                                     10,000
          Price 10,000




                                                                          5,000
                    5,000




                                                                                  0




                                                                                       Price   Weight (lbs.)
                            0




                                                               Gráficos de caja


                    GRAPH TWOWAY
                    twoway scatter length turn
                    twoway lfit length turn
240
                240




                                                                                                                     220
                220




                                                                                                                     200
                200




                                                                                        Fitted values
Length (in.)




                                                                                                                     180
                180




                                                                                                                     160
                160




                                                                                                                     140
                140




                         30             35             40                45                             50                   30              35       40              45   50
                                                   Turn Circle (ft.)                                                                              Turn Circle (ft.)




                                                                                scatter y ajuste lineal




               graph matrix mpg weight price

                                                        2,000   3,000   4,000   5,000
                                                                                                                                    40

                                                                                                                                    30
                                    Mileage
                                    (mpg)
                                                                                                                                    20

                                                                                                                                    10
                      5,000

                      4,000
                                                                  Weight
                      3,000                                       (lbs.)

                      2,000

                                                                                                                                    15,000



                                                                                                             Price                  10,000


                                                                                                                                    5,000

                              10   20        30    40                               5,000                    10,000        15,000




                                                  Gráfico matricial

Stata11 2

  • 1.
    TIPOS DE ARCHIVOSEN STATA En STATA, distinguimos 4 tipos de archivos importantes: Archivo de extensión dta, para la generación de base de datos, en ella se almacenara información de las variables con su respectiva extensión. Archivo de extensión log, smcl, para la generación de bitácoras, en ella se guardaran los resultados de manera ordenada, sin tener que pasarlos a ningún tipo de archivo de texto. Archivo de extensión do, que es un archivo de ejecución, donde se elabora el programa. Archivo de extensión gph, para la generación de gráficos almacenados en la carpeta de trabajo ORDEN INFILE (LEYENDO UN ARCHIVO ASCII) 1) Cree un archivo en el notepad y guárdelo con extensión .dat 2) Clic en el menu File/Import/ASCII data created by speadsheet 3) Seleccione el archive en el escritorio COMANDOS EJEMPLOS Estos son ejemplos con el comando summarize (mean, minumum, máximum, etc.): Prefix Command Varlist (Lista Qualifiers Options Comments (prefijo) (comando) de variables) (Calificadores) (Opciones) (Comentarios) summarize No hay lista de variables. Todas las variables summarize _all _all: Todas las variables summarize make price Dos variables summarize mpg-turn Variables en secuencia summarize t* Variables que empiecen con t
  • 2.
    summarize price if foreign==0 Tipo de carro domestico solamente summarize price in 1/10 Primeras 10 observaciones sort foreign Separa la tabla por cada foraneo by foreign: Deben summarize ordenarse los price datos primero summarize price , detail Opcion, detail LISTA DE VARIABLES Una lista de variables (varlist) llama a una o más variables para ser procesadas. Ejemplos: (nada) a veces lo mismo que _all rep78 weight displacement tres variables price mpg-weight Price y las variables consecutivas mpg-weight pro* todas las variables que empiecen con pro En comandos que tienen una variable dependiente, esta es la primera en la lista de variables (varlist): oneway bmi sex bmi es la variable dependiente regression bmi sex age bmi es la variable dependiente scatter weight height scatterplot, weight es el eje y tabulate expos case La primera variable define las filas COMANDO CONDICIONAL: EL CALIFICADOR IF Este operador es usado en condiciones. Aquí hay ejemplos: summarize mpg if price>10000 estadística para precios mallores a 10000 list make mpg if foreign==0 listar solamente si el tipo da carro es doméstico replace price=. if foreign==0 Pone en nulo los precios para los carros foráneos LISTA DE NÚMEROS. EL CALIFICADOR IN
  • 3.
    Una lista delnúmero (numlist) es un listado de números; hay algunas posibilidades: 1(3)11 promedia 1 4 7 10 1(1)4 4.5(0.5)6 promedia 1 2 3 4 4.5 5 5.5 6 4 3 2 7(-1)1 promedia 4 3 2 7 6 5 4 3 2 1 1/5 promedia 1 2 3 4 5 4/2 7/1 promedia 4 3 2 7 6 5 4 3 2 1 Ejemplo: list sex age weight in 1/10 // observaciones 1 to 10 twoway line mort year , xlabel(1900(20)2000) // etiqueta del eje x FREFIJO BY y BYSORT Comando que hace que se muestren los resultados para subgrupos de datos. Deben pre- ordenarse los datos: sort foreign by foreign: summarize price o en una sola línea: bysort foreign: summarize Price CADENAS DE TEXTOS, CITAS (TEXT STRINGS, QUOTES) Stata requiere las dobles comillas alrededor de las cadenas de texto, se puede omitir las citas al menos que las cadenas se encuentren dentro con espacios en blanco o comas: label define sex 1 male 2 female 9 "sex unknown" Usted no necesita usar citas alrededor del nombres de archivos: save c:dokumenterproj1alfa1.dta al menos que ellos incluyan el espacio en blanco: save "c:dokumenterproject 1alfa1.dta" LOS COMENTARIOS Lo siguiente se interpreta como comentarios, incluyen cortas explicaciones en un archivo do-file: Líneas que empiezan con *
  • 4.
    Texto rodeado por/ * y * / Texto que sigue / / COMANDO KEEP/DROP Drop elimina variables u observaciones de los datos en memoria. Keep trabaja igual a drop, sólo que usted especifica las variables u observaciones a conservar en lugar de las variables u observaciones a ser eliminadas1. Advertencia: keep y drop no son reversibles. Ejemplo: drop price keep make mpg trunk turn foreign length drop _all (borra todas las variables y observaciones) keep in 1/2 (borra todo pero mantiene las observaciones 1 y 2) drop if price > 4000 (borra las observaciones cuyo precio es mayor a 4000) drop in 1/2 (borra las 2 primeras observ) drop pop* (borra las variables que comiencen con pop) COMANDO SPLIT Corta variables cadenas entre partes split make split make, gen(datos) rename dato1 xyz GRÁFICOS EN STATA Ahora vamos a trabajar con los principales gráficos en Stata. Muchos de estos gráficos son de bastante utilidad para observar los problemas inherentes al análisis de regresión que observaremos en la próxima sección. clear 1 Help Stata
  • 5.
    use auto.dta histogram price graph box price graph box price weight 3.0e-04 2.0e-04 Density 1.0e-04 0 0 5,000 10,000 15,000 Price Histrograma 15,000 15,000 10,000 Price 10,000 5,000 5,000 0 Price Weight (lbs.) 0 Gráficos de caja GRAPH TWOWAY twoway scatter length turn twoway lfit length turn
  • 6.
    240 240 220 220 200 200 Fitted values Length (in.) 180 180 160 160 140 140 30 35 40 45 50 30 35 40 45 50 Turn Circle (ft.) Turn Circle (ft.) scatter y ajuste lineal graph matrix mpg weight price 2,000 3,000 4,000 5,000 40 30 Mileage (mpg) 20 10 5,000 4,000 Weight 3,000 (lbs.) 2,000 15,000 Price 10,000 5,000 10 20 30 40 5,000 10,000 15,000 Gráfico matricial