2. EJERCICIO 1.
Selecciona dos variables cualitativas-
factor del fichero
“activossalud.RData”, descríbelas en
tablas de frecuencias e interpreta al
menos 3 aspectos en relación a la
distribución de las mismas.
7. Atendiendo a los datos de las tablas de
frecuencias de ambas variables, podemos
observar como más de la mitad de los
encuestados siempre utilizan
preservativo(61,57%), lo que nos indica una
buena concienciación de las medidas de
prevención. Ya que también, lo podemos
apreciar en la variable “marcha atrás” donde
sólo el 4,33% siempre utilizan este método y
la mitad de ellos (50,96%) nunca.
Por otro lado, podemos ver como la
tendencia a usar alguna vez uno de los dos
métodos, es mayor en la marcha atrás
(41,83%) que en el uso del preservativo
(31,37%).
8. Selecciona dos variables numéricas
del fichero “activossalud.RData”, y
mediante resúmenes numéricos
describe e interpreta la distribución
de las mismas.
9. Por un lado he elegido la variable “hora
practica deportiva”
Y por otro, la variable “peso”
10. En cuanto a “hora practica deportiva” podemos
observar como la media de horas de práctica
es de 2 y media aproximadamente (2,48) y que
la mediana es 2. Por lo tanto, podríamos decir
que se trata de una distribución simétrica. Por
otro lado, vemos como la desviación media es
mayor que la media. Esto sugiere que hay
puntuaciones extremas que inflaron la media, lo
que quiere decir que no sería del todo
representativa de la muestra.
Si nos fijamos en los cuartiles podemos ver
como la diferencia entre 25% y el 50%, y entre
el 50% y el 75% es la misma. De tal manera
que podemos decir que se trata de una
distribución homogénea.
11. En la variable del peso, podemos ver como la
media es de 62,75 y la mediana 60. Ésta
distribución es más o menos simétrica ya que
existe una ligera diferencia.
En cuanto a la desviación típica es muy grande lo
que quiere decir que la media no es muy
representativa.
Si nos fijamos en los cuartiles, podemos ver como
la diferencia entre el 25% y el 50% y entre el 50% y
el 75%, es un valor prácticamente parecido,
podemos decir que se trata de una distribución
homogénea.
También podemos observar como hay 16 valores
ausentes, pero no tiene repercusión ya que la
muestra es de 291 sujetos.
12. Debes realizar al menos un gráfico
de cada tipo con variables
adecuadamente seleccionadas del
fichero “activossalud.RData”,
describe e interpreta la distribución
los mismos
13. Este es un gráfico
de sectores donde
hemos utilizado la
variable sexo
(cualitativa) y
podemos observar
como la mayor
parte de la muestra
se trata de mujeres
14. Este es un gráfico de
barras utilizado en
variables cualitativas.
En este caso “hacer de
comer”. Observamos
como la mayor parte de los
individuos hacen de comer
a diario, seguido de 2 o 3
veces al mes y con la
menor frecuencia se
encuentran los sujetos que
nunca hacen de comer.
15. Se trata de un Histograma
que se utiliza para
variables cuantitativas, en
este caso, la altura.
Vemos como el valor con
mayor frecuencia es el 1,65
aproximadamente, que se
trata de la media. Esta a su
vez coincide con la
mediana, por lo que
podemos decir que es
simétrica.
16. Se trata de un diagrama de caja
utilizado en variables
cuantitativas, en este caso el
peso.
Podemos observar en los
extremos como el máximo es de
90kg y el mínimo peso de 40kg
aprox.
La caja representa el rango
intercuartílico. El segundo cuartil
corresponde con la mediana que
se encuentra aproximadamente
en los 60kg.
El tercer cuartil. Por debajo de
este valor se encuentra el 75%, es
decir, entre 40 y 70kg. Y el primer
cuartil que debajo de este, se
encuentran el 25%, es decir, entre
40 y 55 kg. Finalmente, vemos
como la mayor parte de la
muestra se encuentra entre los 40
y 70kg.