Este documento explica la correlación entre dos variables cuantitativas y cómo determinar si existe una correlación positiva, negativa o inexistente. Detalla los pasos para analizar la correlación entre dos variables: revisar la normalidad de las variables usando pruebas estadísticas, y luego utilizar el coeficiente de correlación apropiado (Pearson o Spearman) dependiendo de si siguen una distribución normal. Como ejemplo, analiza la posible correlación entre el año de nacimiento y las horas dedicadas al deporte de una muestra.
Correlación y concordancia: R de Pearson vs Rho de Sperman
1. Concordancia y correlación
En el seminario de hoy vamos a estudiar la correlación que puede existir entre dos
variables. La correlación mide la relación entre dos variables cuantitativas, es decir, si existe
correlación entre dos variables éstas varían conjuntamente. La correlación puede ser positiva
(si una aumenta, la otra también, si disminuye una, la otra también) o negativa (aumenta una,
disminuye la otra o viceversa) o ser inexistente (no existe correlación).
Vamos a explicarlo mediante el siguiente ejercicio:
Las variables elegidas para realizar el ejercicio son:
1) Año de nacimiento
2) Horas dedicadas a practicar deporte
A continuación tenemos que mirar la normalidad de las variables, ya que dependiendo
de la normalidad utilizaremos uno de los dos coeficientes que se utilizan para mirar la
correlación:
R de Pearson: Sí las variables se distribuyen normalmente.
Rho de Sperman: Sí las variables no se distribuyen normalmente.
Debemos conocer la normalidad de las variables. Para mirar la normalidad debemos
utilizar las dos pruebas de normalidad:
Test de Kolmogorov- Smirnov : Sí el tamaño muestral es superior a 50.
Test de Shapiro-Wilks : si el tamaño muestral es inferior a 50.
3. A continuación nos aparecerá esta tabla:
Tanto en una variable como en otra debemos fijarnos en la prueba de normalidad de
Shapiro, ya que N es inferior a 50. Como la significación nos da en ambas variables ,000 que es
menor que 0,5 esto quiere decir que no sigue la normalidad. Una vez que sabemos que
nuestras variables no siguen la normalidad, analizamos la correlación mediante el coeficiente
de Sperman.
4. A continuación apareceria la tabla de correlación:
Como no vemos ningún asterisco en la tabla, siginifica que no existe correlación entre
estas dos variables cuantitativas.