2.
En el seminario 6 vamos a volver a trabajar con el
programa Rcommander.
Vamos a realizar una análisis exploratorio de datos y
también a realizar tablas de frecuencias, resúmenes
numéricos y gráficos en el programa estadístico.
Introducción.
3.
Paso 1: importar la base de datos y como está en el
formato de R hay que hacerlo de la siguiente manera:
datos cargar conjunto de datos activossalud2.
4.
En el primer ejercicio vamos a seleccionar dos variables cualitativas-
factor del fichero “activossalud.RData”, descríbelas en tablas de
frecuencias e interpreta al menos 3 aspectos en relación a la
distribución de las mismas. Hay que seguir los siguientes pasos:
estadísticos resúmenes distribución de frecuencia.
Las variables que hemos
elegido son “fruta” y
“cerveza”
5. A partir de esta tabla podemos sacar los siguientes datos:
• El tamaño de la muestra es de 290.
• El 89% come algo de fruta a lo largo de la semana y de este
porcentaje come fruta a diario el 32%.
• Todos los datos están disponibles.
• El 22% o no come fruta o come menos que una vez por
semana.
• De los 290 individuos, el 55% que serían 159 comen fruta 3 o
más veces por semana.
FRUTA
6. CERVEZA
A partir de esta tabla podemos sacar los siguientes datos:
• 107 personas nunca han tomado cerveza que sería el 37%.
• El 18% lo han probado alguna vez y abarca a 51 personas.
• El número de personas que consume cerveza 2 o 3 veces al mes es de 40 cuyo porcentaje
sería del 14%.
• El porcentaje de 9% toman cervezas 2 o 3 veces a la semanas y correspondería con 27
personas.
• 60 personas consumen cerveza los fines de semana. Correspondería el 21%.
• El número de personas que consumen a diario es de 4, siendo el porcentaje de 1,38%.
7.
En el segundo ejercicio vamos a seleccionar dos variables numéricas del
fichero “activossalud.RData”, y mediante resúmenes numéricos
describe e interpreta la distribución de las mismas. Hay que seguir los
siguientes pasos: estadísticos resúmenesresúmenes numéricos
elección de variable.
8. PESO.
A partir de estos datos podemos saber:
• La variable peso tiene una media de 62.75571 y su desviación
típica es de 12.65981.
• Existen 16 casos no disponibles.
• La mediana seria 60 y coincide con el segundo cuartil.
• Esta variable es simétrica ya que la media y la mediana tienen
valores similares.
9. ALTURA.
A partir de estos datos podemos saber:
• La variable altura tiene una media de 1.667 y su desviación típica
es de 0.08078101.
• Solo existe un caso no disponible.
• La mediana es 1.655 y coincide con el segundo cuartil.
• Esta variable es simétrica ya que la media y la mediana son
semejantes.
10.
En el tercer ejercicio vamos a realizar un gráfico de cada tipo
con variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la distribución los
mismos. Para las variables cualitativas tenemos el g´rafico de
barras y el gráfico de sectores. Hay que seguir los siguientes
pasos: grafica gráfica de barras/sectores.
12. Como se puede observar
en el diagrama la gran
mayoría no ha
consumido nunca hachís
y que el número de
personas que consumen
2 o 3 veces al mes es
practicamente el mismo
que el conjunto de los
que consumen 2 o 3
veces a la semana, los
fines de semana y a
diario.