3. NORMALIDAD DE LAS VARIABLES
Antes que nada, tenemos que filtrar los datos y
visualizar únicamente los encuestados mujeres.
4. NORMALIDAD DE LAS VARIABLES
Calculamos la normalidad de las 2 variables en las
mujeres: PESO y ALTURA. Para ello, haremos
un histograma y una gráfica de comparación de
cuartiles.
9. Realizamos el test de Kolmogorov-Smirnov
con la variable ‘peso’ y nos sale p=0.0003874
10. Realizamos el test de Kolmogorov-Smirnov
con la variable ‘altura’ y nos sale p=0.001657
11. Como observamos, en ambas variables p es inferior a 0.05. Esto
significa que no sigue una distribución normal, así que usaremos el
test de correlación mediante Spearman y una matriz de
correlaciones. Seleccionaremos ‘peso’ y ‘altura’.
12. El coeficiente es de 0.4796492. Hay una correlación
positiva débil (considerando que es menor que 0.5 y por
tanto se aproxima al 0). Cuando aumente los valores de
la altura, aumentará los del peso.
Por otro lado, p-value es 2.739e-14, lo que equivale a
2.739·10 . Es muy inferior a 0.05: aceptamos la hipótesis
alternativa (altura influye en peso).
14
13. Haremos también un
diagrama de dispersión
y su matriz. Como la
altura es la variable
independiente, será la
variable x, y el peso es
dependiente, por lo que
será la variable y.
Hay cierta
correlación.
14.
15. NORMALIDAD DE LAS VARIABLES
Filtramos los datos con solo los encuestados
varones.
16. NORMALIDAD DE LAS VARIABLES
Calculamos la normalidad de las 2 variables en las
varones: PESO y ALTURA. Repetimos el
proceso para hacer un histograma.
23. En la variable altura, p es menor a 0.05. Sin embargo, en la variable
peso p es algo superior a 0.05. Esto significa que tampoco siguen
una distribución normal. Usaremos, por tanto, el test de correlación
de Spearman:
24. El coeficiente es de 0.3593082. Vuelve a haber una
correlación positiva débil. Los valores de la altura
aumentan a medida que incrementan los del peso.
Por otro lado, p-value es 0.009612. Es inferior a 0.05, por
lo que también aceptaremos la hipótesis alternativa (es
decir, que la altura influye en el peso).
25. Para el diagrama de
dispersión, repetimos el
proceso: la altura es
independiente (variable
x) y el peso es
dependiente (variable y).
Hay correlación.