El documento proporciona una introducción a Stata. Describe las diferentes versiones de Stata, incluyendo Stata/IC, Stata/SE y Stata/MP. También explica la interfaz de Stata y conceptos básicos como el almacén de sintaxis, variables, tipos de archivos y comandos útiles.
4. 30/05/2012
4
Directorio de
Trabajo
• dir
St t t l fi h ti
Utilidades de fichero
– Stata muestra los ficheros que contiene ese
directorio.
• pwd
– Nos muestra la ruta donde está ubicado los
ficherosficheros.
– G:CursoStata
6. 30/05/2012
6
• use sexo edad VAS // solamente selecciona
l i bl d d
Abrir base datos
las variables sexo y edad
• use VAS in 1/5 // selecciona sólo las cinco
primeras observaciones, todas las variables
• use sexo edad using VAS in 1/5 //
selecciona dos variables y cinco primerasselecciona dos variables y cinco primeras
observaciones
Similar a los archivos spo de SPSS
log using "G:CursoStatavas smcl“log using G:CursoStatavas.smcl
log using "G:CursoStatavas.smcl, text“
translate vas.smcl to vas.txt
7. 30/05/2012
7
Similar a la ventana de sintaxis de SPSS
Si se pone un asterisco no ejecuta la orden
Ventana do
Si se pone un asterisco no ejecuta la orden
Por tanto, es útil para colocar notas aclaratorias y
comentarios.
Por ejemplo:
• *Este es el archivo do para la práctica 1
• También se pueden adjuntar comentarios al
comando poniendo /* Comentario */
• sum var1 /* Calcula un resumen de var1*/
Stata necesita hacer una copia de la base
Memoria versión 11
Stata necesita hacer una copia de la base
de datos que vamos a analizar en la
memoria RAM de nuestro ordenador
Para ampliar la capacidad de la memoria
RAM para Stata:
set mem 512mset mem 512m
set memory 512m
clear, borra los datos en memoria
8. 30/05/2012
8
• Los nombres de las variables puede tener
entre 1 y 32 caracteres
Variables
entre 1 y 32 caracteres
• No pueden empezar por un número
• No puede haber espacios
• No utilizar signos(& % $ ∙ ” !)
• Cuidado con los acentos
• Muy sensible
Sexo SEXO sexo son variables diferentes
Tipos de variables
Format
%8.0g
%8.0g
%12.0g
%9.0g
%10.0g
Format
%#s
Strings (Cadena) son guardadas como str# (,str1, str2, str3, ..., str244).
El número después de str indica la maxima extensión. Un str5 podría
valer para “varón", pero no para “masculino”.
Números son guardadas como byte, integer, long y float. Si se utilizan
valores con decimales el formato recomendado es float.
10. 30/05/2012
10
• Archivo de datos
Crear etiquetas
• Variable
• Valores
use "G:CursoStataVAS.dta", clear
Etiqueta archivo datos
use G:CursoStataVAS.dta , clear
label data "ESTE ES EL EJEMPLO DEL VAS"
save "G:CursoStataVAS.dta", replace
file G:CursoStataVAS.dta saved
use "G:CursoStataVAS.dta", clear
(ESTE ES EL EJEMPLO DEL VAS)
12. 30/05/2012
12
• Variables:
Nº historia clínica
Crear una nueva base de datos
– Nº historia clínica
– Sexo
– Fecha de nacimiento
– Fecha de visita
– Fumador(No, Si, EX fumador)
– AP DiabetesAP Diabetes
– AP HTA
– AP IAM
– Motivo consulta(texto libre)
Calculadora
* ( )
Utilidades
display 140+1.96*sqrt(15)
147.59105
Describir la base
describe
(resumen de base datos activa)
describe using "G:CursoStatavas12pre.dta“
(otra base no activa)
codebook (descripción mas detallada de base datos activa)
Informe con las 4 primeras observaciones
list in 1/4
13. 30/05/2012
13
• Signos útiles
+ t * d t / di i ió ^ t i
Sintaxis
+ suma ‐ resta * producto / división ^ potencia
> mayor < menor >= <=
~ not ! not | or & and ~= distinto == igual
• Dos signos de igual == se usan para
comparaciones lógicas y un solo para asignar
un valor
• help operators
• [quietly] [by group:] command [varlist] [weight] [if exp] [in range] [using
filename] [, options]
• Entre corchetes son opcionales
Sintaxis
Entre corchetes son opcionales
• quietly: Evita que se imprima salidas durante la ejecución.
• by group: Ejecuta el comando para grupos ordenados.
• varlist: Lista de variables sobre las que aplica el comando.
• weight: Pesos sobre los que se pondera el estadístico
• if exp: Sólo hace el comando si cumple la condición
i Sól tili l b i t• in range: Sólo utiliza las observaciones que estan en ese rango
• using filename: Fichero sobre el que se aplica el comando.
• , options: Opciones
14. 30/05/2012
14
.INSTRUCCCIÓN VARIABLE(S), OPCIONES
summarize edad
Sintaxis
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
edad | 107 49.61157 15.10253 4.775542 88.4566
.
SELECCIONAR
summarize edad if sexo==1 (sólo nos da la media en sexo=) 1
Variable | Obs Mean Std. Dev. Min Max
‐‐‐‐‐‐‐‐‐‐‐‐‐+‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
edad | 22 48.57535 13.45849 20.08838 72.30259
Si la variable es cadena entre comillas
if sexo==”hombre”
Un aspecto importante a tener en cuenta es que Stata
considera a los valores missing (“.”) como valores máximos
• Realizar un listado de la base con los varones
con fiebre menores de 50 años o mujeres > 60
Ejercicio
con fiebre menores de 50 años o mujeres > 60
con tos.(base datos tos.dta).
• Realizar un listado de los pacientes con valores
de plaquetas menores que 100 o missing.
R li t li t d l i tRealizar otro listado con los pacientes con
valores de colesterol por encima de 300 o
missing(base datos Cirrosis Biliar Primaria).
18. 30/05/2012
18
merge 1:1 nhc using G:CursoStatavas12post.dta"
Añadir variables
reshape wide, long Este comando transforma la base de datos de una
formato ancho (wide) a uno largo (long) y viceversa
reshape long inc i(id) j(year)
Transformar base datos
Data > Create or change data > Other variable- reshape long inc, i(id) j(year)
reshape wide inc, i(id) j(year)
Wide
id sex inc80 inc81 inc82
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
1 0 5000 5500 6000
2 1 2000 2200 3300
Long
Data > Create or change data > Other variable
transformation commands > Convert data
between wide and long
Long
i j x_ij
id year sex inc
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
1 80 0 5000
1 81 0 5500
1 82 0 6000
2 80 1 2000
2 81 1 2200
2 82 1 3300