Seminario 8:Análisis bivariado con variables cuantitativas. Normalidad y linealidad.
1. Seminario 8:
Análisis bivariado con
variables cuantitativas.
Normalidad y linealidad.
Diagrama de dispersión.
Coeficientes de correlación
de Pearson y Rho de
Spearman.
ANA Mª MACHO TORRES
GRUPO A MACARENA
2. EJERCICIO:
Determina si existe relación entre las
variables altura y peso del fichero de datos
“activos en salud” y si existe determina cómo
de fuerte es.
3. 1-. Abrimos R Commander y cargamos el
conjunto de datos “Activos en salud”.
2-. Estudiaremos como se relacionan dos
variables cuantitativas, peso y altura. Para
ello, en primer lugar tenemos que comprobar
si siguen o no una distribución normal:
Pearson, si la distribución sigue la normalidad
Rho de Spearman que se emplea cuando la
distribución no sigue la normalidad.
4. • 3-. Observamos si mediante el Diagrama de dispersión se
puede ver algún tipo de relación entre las variables. En
este caso se observa algo de relación positiva pero no
queda muy claro, por lo que realizaremos los coeficientes
de correlación.
5. 4-. Antes de elegir un coeficiente de correlación
deberemos estudiar si existe distribución normal en
las variables (como indicamos anteriormente).
5-. Realizaremos el Test de Shapiro Wilk para
estudiar la normalidad.
Establecemos las hipótesis:
- H0: La variable (peso o altura) sí sigue la
normalidad.
- H1: La variable (peso o altura) no sigue la
normalidad.
6. ALTURA:
PESO:
En ambos casos, el p-
valor < 0,05 por tanto
aceptamos la
HIPÓTESIS
ALTERNATIVA. Esto es
debido a que el error
que cometeríamos si la
aceptáramos es menor
al que hemos
establecido (0,05).
7. 6.- Otra forma de estudiar la normalidad es
mediante graficas. Por ejemplo:
1. Gráfico Q-Q
No siguen la distribución normal, puesto que
existen muchos puntos que se salen de las
líneas.
8. 2. Box-plot
No siguen una distribución normal, puesto que si siguiesen una
distribución normal, media, mediana y moda deberían coincidir y
colocarse en el lugar central de la caja, a la misma distancia del rango
superior e inferior y esto en ninguna ocurre así.
9. 3. Histograma.
No siguen la distribución normal, puesto que para que las variables
siguiesen una distribución normal la gráfica tendría que ser simétrica a
un lado y otro de la mediana. En ambos casos, se encuentra
desplazada a la izquierda.
10. 6.- Como las variables no siguen la
distribución normal, utilizaremos el
coeficiente de Test de Spearman.
Establecemos las hipótesis:
-H0: existe correlación entre peso y
altura. (Rho entre -1 y 1)
-H1:no existe correlación entre peso y
altura (Rho=0)
11. Como rho es distinto de cero podemos decir que existe correlación entre
las variables. Es una correlación positiva, ya que 0,622 está alejado del
cero y más cerca del 1.
Por tanto, aceptamos la hipótesis nula: Existe correlación entre peso y
altura.