Este documento describe tres ejercicios realizados con el fichero de datos "activossalud.RData". En el primer ejercicio, se seleccionan dos variables cualitativas y se generan tablas de frecuencias para describir la distribución de cada una. En el segundo ejercicio, se seleccionan dos variables cuantitativas y se generan resúmenes numéricos para describir su distribución. En el tercer ejercicio, se generan gráficos de diferentes tipos como histogramas, diagramas de cajas y gráficas de sectores y
2. EJERCICIO 1: Selecciona dos variables cualitativas-factor del fichero
“activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3
aspectos en relación a la distribución de las mismas.
En primer lugar seleccionamos las dos variables cualitativas que vamos a describir.
3. A continuación, realizamos una tabla de frecuencia de cada variable para poder describirlas de forma
adecuada:
INTERPRETACIÓN DE LA TABLA DE FRECUENCIA:
-Como podemos observar nos informa tanto de la frecuencia relativa como de la frecuencia absoluta.
-Frecuencias absolutas (número de individuos de cada modalidad): A diario (20 personas), 3 o mas veces
semana (49 personas), 1 o 2 veces semana (87 personas), menos de una vez semana (92 personas), nunca
(42 personas).
-Frecuencias relativas (proporción con respecto al total de individuos de la muestra) multiplicada por 100
para que quede expresada en porcentaje: a diario (6,9%), 3 o mas veces semana (16,90%), 1 o 2 veces
semana (30%), menos de una vez semana (31,72%), nunca (14,48%).
-Total de la muestra: 291 teniendo en cuenta que una persona no contestó.
4. INTERPRETACIÓN DE LA TABLA DE FRECUENCIA:
-Como podemos observar nos informa tanto de la frecuencia relativa como de la frecuencia absoluta.
-Frecuencia absoluta (número de individuos de cada modalidad): A diario (35 personas), 3 o mas veces
semana (43 personas), 1 o 2 veces semana (67 personas), menos de una vez semana (73 personas), nunca
(73 personas).
-Frecuencia relativa (proporción con respecto al total de individuos de la muestra) multiplicada por 100 para
que quede expresada en porcentaje: a diario (12,03%), 3 o mas veces semana (14,78%), 1 o 2 veces semana
(23,02%), menos de una vez semana (25,09%), nunca (25,09%).
-Total de la muestra: 291
5. EJERCICIO 2: Selecciona dos variables numéricas del fichero “activossalud.RData”, y
mediante resúmenes numéricos describe e interpreta la distribución de las mismas.
En primer lugar seleccionamos las dos variables cuantitativas:
6. Hacemos el resumen numérico para poder interpretar la distribución de las variables:
En estadísticos nos
aseguramos de que estén
marcadas las opciones de
media, desviación, rango
intercuartílico y cuantiles.
“comunicacionpares”
“malestaresactivos”
7. INTERPRETACIÓN:
-Media (mean)= 5,393
-Mediana= 5
Ambos valores (media y mediana) son muy parecidos, por tanto, podríamos decir que se
asemeja a una distribución normal.
-Desviación típica (sd)= 1,58
-Del total de la muestra (n)= 287, 4 personas no contestaron (NA).
-IQR= 2. El rango intercuartílico o rango intercuartil es la diferencia entre el tercer y el
primer cuartil de una distribución. Es una medida de la dispersión estadística. En este caso
es 2, por lo que podemos decir que los datos se encuentran menos dispersos que en el
caso de la siguiente variable (“malestaresactivos”) en la cual el IQR es 12.
Variable “comunicacionpares”
8. Variable “malestaresactivos”
INTERPRETACIÓN:
-Media (mean)= 43,458
-Mediana= 44
Ambos valores (media y mediana) son muy parecidos, por tanto, podríamos decir que se
asemeja a una distribución normal.
-Desviación típica (sd)= 9,574
-Del total de la muestra (n)= 279, 12 personas no contestaron (NA).
-IQR=12. En este caso los datos se encuentran bastante más dispersos que en la variable
anterior (“comunicacionpares”) en la cual el IQR era 2.
9. EJERCICIO 3: Debes realizar al menos un gráfico de cada tipo con variables
adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta
la distribución los mismos.
Para las variables cualitativas utilizaremos GRÁFICA DE SECTORES y GRÁFICA DE BARRAS.
VARIABLE CUALITATIVA “dulces”
En este caso, utilizaremos una gráfica de barras.
INTERPRETACIÓN:
Como podemos observar en la gráfica de barras obtenida, la mayoría de las personas comen dulces
menos de una vez a la semana, también bastantes personas comen dulces 1 o 2 veces semana,
menos personas comen dulces 3 o mas veces semana. También podemos observar como hay más
personas que no comen dulces nunca, que personas que coman dulces a diario.
10. VARIABLE CUALITATIVA “trabajo”
En este caso, utilizaremos una gráfica de sectores.
INTERPRETACIÓN:
Como podemos observar en la gráfica de sectores obtenida, hay más personas que no trabajan que
personas que sí trabajan.
11. Para las variables cuantitativas utilizaremos HISTOGRAMA y DIAGRAMA DE CAJAS.
VARIABLE CUANTITATIVA “comunicacionpares”
En este caso, utilizaremos un histograma.
INTERPRETACIÓN:
Como podemos observar en el histograma obtenido, las mayores frecuencias en relación a la variable
“comunicacionpares” se encuentran entre los valores 0 a 6, a partir del valor 6 disminuye de forma
pronunciada siendo cada vez más pequeños.
12. VARIABLE CUANTITATIVA “malestaresactivos”
En este caso, utilizaremos un diagrama de cajas.
INTERPRETACIÓN:
Como podemos observar en el diagrama de cajas obtenido:
-El valor más alto se encuentra en torno a 68 y el valor más pequeño en torno a 21.
-La mediana oscila en torno a 43.
-Hay datos atípicos: