CORRELACIÓN
PEARSON Y SPEARMAN
Mª del Mar Torres Vilches
Grupo 1, subgrupo 5
Tarea del seminario 9
• Elaborar una hipótesis con dos variables cuantitativas de la
matriz trabajada para estudiar su correlación:
H0: No hay correlación entre peso y colesterol total.
Distribución normal y correlación
• Según la distribución que siguen los datos elegiremos:
• Coeficiente de correlación de Pearson: las dos variables estudiadas siguen
una distribución normal.
• Coeficiente de correlación de Spearman: al menos una de las variables
estudiadas no sigue una distribución normal.
Teniendo esto cuenta, antes de estudiar la correlación
deberemos estudiar la distribución de las variables
elegidas.
Seleccionamos “Analizar” en la barra superior. Después,
“estadísticos descriptivos”, y por último, la opción “explorar”
- Elegimos las variables (Peso y Colesterol total).
- Seleccionamos “gráficos”y añadimos: gráficos de normalidad con
pruebas e histograma.
Resultados: ¿distribución normal?
Los histogramas de ambas variables nos orientan: parece que las dos siguen distribuciones normales
(forma de campana). Ahora tenemos que comprobarlo con los test de normalidad.
Resultados: tests de normalidad
 Como la muestra es de tamaño >50, tendremos que utilizar el test de
normalidad de Shapiro-Wilk.
 La significación es >0,05 en ambas variables, por lo que aceptamos la
hipótesis nula:
Ambas variables siguen una distribución normal.
Partimos de la H0: La variable (peso/colesterol) sí sigue una distribución normal.
Estudio de la correlación entre las variables
Seleccionamos:
“Analizar”
 “correlacionar”
 “bivariadas”
*pues queremos estudiar
una correlación entre DOS
variables
Correlaciones bivariadas
 Introducimos las variables.
 Seleccionamos el coeficiente de correlación de
Pearson, pues ambas variables siguen una
distribución normal.
 Seleccionamos también el de Tau-b de Kendall, que
nos permite conocer el error que estamos
cometiendo al aceptar la correlación.
Resultados
Coeficiente Pearson: 0,164
Al ser un valor cercano a 0 por encima, la correlación es
difusa y ligeramente positiva.
Como la significación (p) es 0,132, significa que el
error de rechazar la H0 es >0,05, y por tanto, la
aceptamos:
No hay correlación entre peso y colesterol
total.
Gráficos
Seleccionamos “Gráficos”:
“cuados de diálogo antiguos”
 dispersión de puntos
 Elegimos la dispersión simple.
 Colocamos variable peso en el eje X, y el colesterol en el eje Y.
 Seleccionamos “opciones” y pedimos que se muestren los grupos definidos por los valores perdidos.
Gráfico de dispersión
• El gráfico prueba los resultados:
A pesar de que se aprecia una ligera
pendiente positiva indefinida que
los datos siguen, no existe
correlación entre las variables, por
eso los datos se muestran tan
dispersos.

Correlación

  • 1.
    CORRELACIÓN PEARSON Y SPEARMAN Mªdel Mar Torres Vilches Grupo 1, subgrupo 5
  • 2.
    Tarea del seminario9 • Elaborar una hipótesis con dos variables cuantitativas de la matriz trabajada para estudiar su correlación: H0: No hay correlación entre peso y colesterol total.
  • 3.
    Distribución normal ycorrelación • Según la distribución que siguen los datos elegiremos: • Coeficiente de correlación de Pearson: las dos variables estudiadas siguen una distribución normal. • Coeficiente de correlación de Spearman: al menos una de las variables estudiadas no sigue una distribución normal. Teniendo esto cuenta, antes de estudiar la correlación deberemos estudiar la distribución de las variables elegidas.
  • 4.
    Seleccionamos “Analizar” enla barra superior. Después, “estadísticos descriptivos”, y por último, la opción “explorar”
  • 5.
    - Elegimos lasvariables (Peso y Colesterol total). - Seleccionamos “gráficos”y añadimos: gráficos de normalidad con pruebas e histograma.
  • 6.
    Resultados: ¿distribución normal? Loshistogramas de ambas variables nos orientan: parece que las dos siguen distribuciones normales (forma de campana). Ahora tenemos que comprobarlo con los test de normalidad.
  • 7.
    Resultados: tests denormalidad  Como la muestra es de tamaño >50, tendremos que utilizar el test de normalidad de Shapiro-Wilk.  La significación es >0,05 en ambas variables, por lo que aceptamos la hipótesis nula: Ambas variables siguen una distribución normal. Partimos de la H0: La variable (peso/colesterol) sí sigue una distribución normal.
  • 8.
    Estudio de lacorrelación entre las variables Seleccionamos: “Analizar”  “correlacionar”  “bivariadas” *pues queremos estudiar una correlación entre DOS variables
  • 9.
    Correlaciones bivariadas  Introducimoslas variables.  Seleccionamos el coeficiente de correlación de Pearson, pues ambas variables siguen una distribución normal.  Seleccionamos también el de Tau-b de Kendall, que nos permite conocer el error que estamos cometiendo al aceptar la correlación.
  • 10.
    Resultados Coeficiente Pearson: 0,164 Alser un valor cercano a 0 por encima, la correlación es difusa y ligeramente positiva. Como la significación (p) es 0,132, significa que el error de rechazar la H0 es >0,05, y por tanto, la aceptamos: No hay correlación entre peso y colesterol total.
  • 11.
    Gráficos Seleccionamos “Gráficos”: “cuados dediálogo antiguos”  dispersión de puntos
  • 12.
     Elegimos ladispersión simple.  Colocamos variable peso en el eje X, y el colesterol en el eje Y.  Seleccionamos “opciones” y pedimos que se muestren los grupos definidos por los valores perdidos.
  • 13.
    Gráfico de dispersión •El gráfico prueba los resultados: A pesar de que se aprecia una ligera pendiente positiva indefinida que los datos siguen, no existe correlación entre las variables, por eso los datos se muestran tan dispersos.