2. EJERCICIO
Determina si existe relación entre las variables altura y peso del fichero de
datos “activos en salud” y si existe determina cómo de fuerte es.
Para resolver este ejercicio, vamos a abrir nuestra base de datos en R Commander y vamos
a crear una tabla de comparación de cuartiles con ambas variables:
3. Podemos comprobar como ambas variables, tanto altura como peso,
tienen muchos puntos fuera de la línea principal, lo que nos indica una
ausencia de normalidad
4. Vamos a probar ahora con un histograma:
Ninguno de los dos gráficos
presenta la simetría típica de
una distribución normal, como
vimos en el gráfico Q-Q
5. ¿…y con un boxplot?
Nada, de nuevo vemos como
los valores no siguen una
distribución normal (la caja no
está en el centro de la
muestra)
6. Ahora que sabemos que no siguen una distribución normal, vamos a estudiar qué
tipo de relación existe entre ambas variables y cómo de fuerte es esta relación
(en el caso de que la hubiera)
Para ello, vamos a crear un diagrama de dispersión entre ambas variables:
Vamos a marcar
esta opción para
que dibuje la recta
de regresión
7. Viendo este gráfico a simple vista podemos afirmar que, aunque la
muestra es lo suficientemente grande, no se aprecia una relación
entre ambas variables.
Para corroborar esta información, vamos a observarla
numéricamente mediante el test de correlación
10. Ambos resultados son muy semejantes: 0,63
aproximadamente, o lo que es lo mismo 63%
Esto significa que existe una correlación entre peso y
altura
Concretamente, esta correlación es positiva
Así pues, podemos aceptar y rechazar nuestras hipótesis:
Aceptamos H0: existe correlación entre peso y altura (Rho entre -1
y 1)
Rechazamos H1:no existe correlación entre peso y altura (Rho=0)