2. 1º Ejercicio para el blog
• Selecciona dos variables cualitativas-factor del
fichero “activossalud.RData”, descríbelas en
tablas de frecuencias e interpreta al menos 3
aspectos en relación a la distribución de las
mismas.
3. ¿Cómo elaborar las “tablas de
frecuencia”?
Ahora vamos a seleccionar
la variable que
comentaremos en relación
con su distribución
5. Interpreta al menos 3 aspectos en relación a la
distribución de las mismas.
¿Qué porcentaje lo consumió a diario?
La fruta la consumieron un 32,07%
El embutido lo consumieron un 12,85%
¿Qué es más frecuente la fruta o el embutido?
El porcentaje3 que no ha consumido fruta “nunca o casi nunca” es de un 11,03% ,
respecto al porcentaje de “nunca” de los embutidos que es 10,76%
Por lo cual, el porcentaje de los embutidos es menor que el de la fruta, lo que nos
indicada que de estas dos variables la más frecuente es “el embutido”
¿Qué es más frecuente a diario?
El porcentaje “a diario” en la fruta es de 32,07% , y el del embutido es de 12,85%
Por ello, la fruta es consumida más frecuentemente a diario que el embutido
6. 2º Ejercicio para el blog
• Selecciona dos variables numéricas del fichero
“activossalud.RData”, y mediante resúmenes
numéricos describe e interpreta la distribución
de las mismas.
7. ¿Cómo elaborar los resúmenes numéricos para poder
ser capaz de interpretar las diferentes distribuciones?
Aquí seleccionamos las dos
variables deseadas, en este caso
seleccionamos “peso” y “altura”
8. Podemos interpretar a través de los datos obtenidos que:
La media del peso es 62,75571, mientras que la de la altura es 1,667
Nos hemos fijado en la columna de “mean”
Desviacion típica del peso es 12,659 , y la de la altura es 0,0807
Con los datos de el peso podemos interpretar que están muy dispersos, mientras que los
datos de la altura nos dicen que se asemejan demasiado
Nos hemos fijado en la columna de “sd”
Encuestados
Peso: respondieron 275 encuestados y 16 no respondieron
Altura: respondieron 290 encuestados y 1 no respondió
Nos hemos fijado en la columna de “n” para los que SI respondieron y “NA” para los que
NO respondieron
9. 3º Ejercicio para el blog
• Debes realizar al menos un gráfico de cada tipo
con variables adecuadamente seleccionadas del
fichero “activossalud.RData”, describe e
interpreta la distribución los mismos.
10. Diagrama de Sectores
En los Diagrama de Sectores se
utilizan variables cualitativas, por
lo cual, he optado por
“madresanitaria”.
Además, tiene solo 2 categorías lo
cual hace que se vea claramente la
diferencia entre ambas.
Interpretación:
Color azul: encuestados que SÍ
tienen madre sanitaria
Color Rosa. Encuestados que NO
tienen madre sanitaria
11. Gráfica de Barras
En la Gráfica de Barras se
representan variables
cuantitativas. Por lo cual, he
optado por la variable “cerveza”.
En el eje X aparecen las diferentes
categorías
En el eje Y aparece la frecuencia
Interpretación:
Pocas personas (casi ninguna)
toman cerveza a diario
Predominan las personas que
nunca toman cerveza o 2-3 veces
por semana
12. Histograma
En los histogramas se representan
variables numéricas, por lo cual,
he optado por la variable “altura”
En el eje Y aparece la frecuencia
En el eje X aparece la altura
Interpretación:
Aproximadamente un 70% de los
encuestados presenta una altura
de 1,65m
13. Diagrama de Caja
En el Diagrama de Caja se
representan variables numéricas, por
lo cual he optado por
“mantenimiento del hogar”
El borde superior indica el valor más
alto
El borde inferior indica el valor más
bajo
La línea en negrita está
representando la media
El rango intercuartílico no es del
todo simétrico
Hay un dato que sobre sale del valor
más alto y quiere decir que esa
persona interviene más en el
mantenimiento del hogar.