2. En primer lugar, nos metemos en el programa R y cargamos el conjunto de
datos (base de datos: activossalud.Rdata)
3. A continuación, seleccionamos dos
variables cualitativas (para ello,
debemos meternos en estadísticos,
resúmenes y distribución de
frecuencias).
Las dos variables cualitativas elegidas,
son: cerveza y vino.
4. Cerveza
En cuanto a los datos obtenidos,
observamos que 107 personas nunca
la consumen (37,02%), que 51 la
consumen alguna vez (17,65%), 40 la
consumen 2 o 3 veces al mes
(13,84%), 27 personas 2 0 3 veces
por semana (9,34%), los fines de
semana 60 personas (20,76%) y a
diario, únicamente 4 personas
(1,38%).
5. Vino
En cuanto a los datos obtenidos,
observamos que hay 93 personas
que nunca lo consumen (32,18%),
que hay 82 que lo consumen alguna
vez (28,37%), 2 o 3 veces al mes lo
consumen 57 personas (19,72%), los
fines de semana 48 personas
(16,61%) y a diario únicamente 3
personas (1,04%).
6. ¿Cuántos participantes beben
cerveza? 182 personas
¿Qué porcentaje lo realizó a
diario? 1,38%
¿Con qué frecuencia bebe el
50% o
más de la muestra estudiada?
Los que la consumen
alguna vez, 2 o 3 veces al
mes, 2 o 3 veces por semana y
los fines de semana.
¿Qué es más frecuente el
consumo de cerveza o de
vino? El vino, pero la diferencia
es muy pequeña (190 frente a
182)
¿Qué es más frecuente a
diario? La cerveza, con una
mínima diferencia (4 frente a
3)
7. A continuación, seleccionamos dos
variables cuantitativas (en este caso
debemos meternos en estadísticos,
resúmenes y por último resúmenes
numéricos)
Las dos variables cuantitativas elegidas,
son: altura y peso
8. Altura
En cuanto a los datos obtenidos,
observamos que la media de la
altura es de 1,667 metros, su
desviación típica es de 0,08078101
(por ello, hay poca dispersion), tiene
un rango intercuartílico de 0,12.
Esta encuesta se realizó a 290
personas (solo 1 no contestó).
9. Peso
En cuanto a los datos obtenidos,
observamos que: la media es de
62,75571 kg, su desviación típica es
de 12,65981 (por tanto, su
dispersión de datos es mayor a la de
la altura), tiene un rango
intercuartílico de 14.
Por ultimo esta encuesta se le realizó
a 275 personas (16 no contestaron).
10. A continuación debemos realizar al menos un gráfico de cada tipo con variables
adecuadamente seleccionadas del fichero “activossalud.Rdata.
Las tablas de frecuencias y las representaciones gráficas son dos maneras
equivalentes de presentar la información.
Vino
Gracias a estas gráficas (de barras y de sectores) podemos observar la frecuencia con la que se
consume vino en la población, destacando los que nunca lo consumen y siendo la minoría los que la
consumen a diario, la diferencia es que con la gráfica de barras podríamos aproximar el número de
personas, algo que con la de sectores nos sería imposible (los gráficos de sectores no son útiles
cuando la variable tiene múltiples categorías).
11. Altura
Gracias al diagrama de cajas observamos
que la mediana está entorno a 1.65
aproximadamente (percentil 50).
El valor más bajo está cerca de 1.1 y el más
alto en 1.9 aproximadamente.
También encontramos datos atípicos, que
son observaciones con valores extremos:
259, 103, 116.
Por otro lado, gracias al histograma
observamos que las mayores frecuencias
se encuentran entre 1.55-1.7, que los
valores menores de 1.55 tienen frecuencias
muy bajas desde el principio, pero sin
embargo, los valores mayores de 1.7
disminuyen su frecuencia poco a poco.