2. Cargamos el archivo Excel llamado activosensalud1 en la base de datos de R
commander.
3.
4. Selecciona dos variables cualitativas-factor del
fichero “activossalud.RData”, descríbelas en
tablas de frecuencias e interpreta al menos 3
aspectos en relación a la distribución de las
mismas.
Ejercicio 1: Tablas de frecuencias
5. Visualizamos las tablas de frecuencias de las variables cualitativas dulces y embutidos.
Luego buscamos los resultados en la ventana de salida.
6.
7. Observando en la tabla de frecuencias que hemos obtenido
podemos analizar los siguientes aspectos:
¿Es más frecuente el consumo de dulces o de embutidos?
Es más frecuente el consumo de embutidos porque el porcentaje de individuos
que nunca los consumen es del 0,0%, frente al 16,67% de individuos que nunca
los consumen.
¿Con qué frecuencia consume embutidos el 50% o más de la muestra estudiada?
Frecuencias acumuladas: A diario (0,0%) + 3 o más veces semana (33,33%) + 1 o 2
veces semana (66,67%) > 50%.
Al menos, el 50% consume embutidos 1 o 2 veces a la semana.
¿Qué es más frecuente a diario?
Ninguno de los individuos de la muestra consume estos alimentos a diario.
8. Selecciona dos variables numéricas del fichero
“activossalud.RData”, y mediante resúmenes
numéricos describe e interpreta la distribución
de las mismas.
Ejercicio 2: Resúmenes numéricos
11. A continuación, podemos interpretar la distribución de
nuestras variables a partir de los resúmenes numéricos que
hemos obtenido:
Media: 1,673333 m
Variación estándar: 0,05887841
Primer cuartil: 1,6325 m
Segundo cuartil: 1,665 m
Tercer cuartil: 1,6975 m
Altura mínima: 1,61 m
Altura máxima: 1,77 m
12. Debes realizar al menos un gráfico de cada tipo con
variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la distribución
los mismos.
Ejercicio 3: Resumen de un conjunto
de datos (gráficos)
Para representar gráficamente un conjunto de datos podemos usar:
Gráficos de sectores, útiles cuando la variable es cualitativa y
tiene pocas categorías (≤ 4).
Gráficas de barras, útiles cuando la variable es cualitativa y tiene
muchas variables (> 4).