2. Selecciona dos variables cualitativas-factor del fichero
“activossalud.RData”, descríbelas en tablas de
frecuencias e interpreta al menos 3 aspectos en
relación a la distribución de las mismas.
A
Primero cargamos el
conjunto de datos en
formato de R en R
Commander:
3. Para ver las tablas
de frecuencia de las
distintas variables:
Seleccionamos las
variables cualitativas
de las cuales
queremos saber su
frecuencia. En este
caso, yo he elegido las
variables
“estudiosmadre” y
“estudiospadre”.
4. En la ventana de debajo de R Commander podemos visualizar las
respectivas tablas:
Estudios de la madre
Estudios del padre
En estas tablas se aprecia que
aparecen dos tipos de
frecuencias: absolutas (primera
línea) y porcentajes (segunda
línea).
Comparando las dos tablas se
observa que:
- La mayoría de progenitores o
bien tienen únicamente estudios
primarios o no los tienen.
- Hay un menor porcentaje de
mujeres en cada ámbito, lo que
demuestra el menor grado de
educación en las mujeres.
- En torno al 50% de los
progenitores poseen el titulo de
Bachiller o universitario.
5. Selecciona dos variables numéricas del fichero
“activossalud.RData”, y mediante resúmenes numéricos
describe e interpreta la distribución de las mismas.
B
Para ver los resúmenes
numéricos de las
distintas variables:
A continuación elegimos las
variables numéricas que de las
cuales queramos sus
resúmenes numéricos. En este
caso yo he elegido “peso” y
“horapracticadeportiva”.
6. Debemos asegurarnos de que en el
resumen numérico aparece lo que
nos interesa:
El resumen de las dos
variables elegidas es el
siguiente:
La desviación típica de la primera tabla es 3.1 y la de la segunda es 12.66.
De los 291 participantes de la muestra, hay 1 dato no disponible en cuanto a la hora de
practica deportiva y 16 datos no disponibles en cuanto al peso.
La media de horas de practica deportiva de
las personas de la muestra es de 2.4 horas.
En cuanto al peso, la media de la muestra
es de 62.75 kg.
El 50% corresponde a la mediana por lo que en la primera tabla la mediana es 2
mientras que en la del peso, la mediana es 60.
7. C Debes realizar al menos un gráfico de cada tipo con
variables adecuadamente seleccionadas del fichero
“activossalud.RData”, describe e interpreta la
distribución los mismos.
En R podemos crear
diferentes gráficos.
Cada variable está
mejor representada
por un tipo de gráfico
en concreto.
Gráfico de sectores
Grafico de barras
Histograma de
frecuencias
Histograma de
frecuencias con curva
normal
Diagrama de cajas
Variables
cualitativas
Variables
cualitativas
Variables
numéricas
Variables
numéricas
Variables
numéricas
8. GRÁFICA DE SECTORES
Elegimos una variable
cualitativa como por ejemplo
“verduras”.
Se observa que la mayor parte de los
participantes de la investigación
consumen verdura varias veces a las
semana. Muy pocos son lo que nunca o
casi nunca la toman, lo que es algo
alentador en cuanto a la calidad de la
alimentación de la muestra. A pesar de
esto, teniendo en cuenta la
importancia del consumo diario de
verduras, el numero de personas que lo
cumples es muy bajo.
10. En cuanto al consumo de fruta destaca que la mayoría de las
personas encuestadas consumen fruta varias veces a la
semana destacando sobre todo un mayor numero de
personas que lo hace a diario.
En contraste con el consumo de verduras, podríamos afirmar
que fruta es consumida con mayor frecuencia.
11. HISTOGRAMA DE FRECUENCIAS
Elegimos una variable numérica como por
ejemplo “horapracticadeportiva”.
En este gráfico se muestra
claramente que la mayor parte de
las personas o bien no realiza
deporte a lo largo de la semana o
bien pocas horas.
A medida que aumenta el numero de
horas, la cantidad de personas que
realiza deporte disminuye
considerablemente.
13. Observando el diagrama
podemos conocer que el
50% de la muestra tiene
una altura entre 1.6 y 1.72
metros. Esto lo sabemos
porque el interior de la
caja representa el 50% de
la muestra.
La mediana es ≈ 1.65.
Hay tres valores atípicos u
outliers, es decir, valores
que se salen del máximo en
este caso. El mayor de
estos valores es la altura
de 2 metros.