Este documento resume un seminario sobre correlación. Explora la correlación entre el peso y la glucemia usando datos de obesidad. Realiza pruebas de normalidad para ambas variables y determina que no siguen una distribución normal. Por lo tanto, usa el coeficiente de correlación de Spearman, una prueba no paramétrica. Los resultados muestran una correlación baja positiva de 0.368 entre el peso y la glucemia.
2. • Correlación: relación o dependencia que
existe entre dos variables o cambio
sistemático en las puntuaciones de dos
variables de intervalo/razón.
• Dos variables se relacionan cuando las
mediciones de una variable cambian
simultáneamente con las medidas de la otra (=
si sus mediciones cambian simultánea y
proporcionalmente)
3. Usando la base de datos “obesidad.sav” (la cual descargamos de
la enseñanza virtual), procedemos a explorar la correlación
entre las variables peso y glucemia.
4. Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
5. Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
6. Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
7. Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
14. • Ante todo establecemos nuestras hipótesis con las que vamos a
trabajar.
H0: los datos siguen una distribución normal
H1: los datos NO siguen una distribución normal.
Para comprobar la correlación entre estas dos variables, tengo que decidir
que prueba voy a utilizar:
• - Coeficiente r de Pearson. Prueba paramétrica (cuando las variables
cuantitativas siguen una distribución normal).
• - Coeficiente rho de Spearman. Prueba no paramétrica (no exige que las
variables cuantitativas sigan una distribución normal)
Como vemos, para decidir entre las pruebas anteriormente tengo que
comprobar si las variables siguen o no una distribución normal, mediante
las pruebas de normalidad. Las tengo que realizar a las 2 variables.
19. • Tenemos que elegir si cojo la prueba de normalidad, Kolmogorov-Smirnov
o Shapiro-Wilk.
• Para ellos nos fijamos en la amplitud de nuestra muestra.
Si N < 50 Shapiro-Wilk
Si N > 50 Kolmogorov-Smirnov
Como nuestra muestra es > 50, vamos a trabajar con la prueba de normalidad
Kolmogorov- Smirnov.
20. • El siguiente paso es fijarnos en el nivel de significación y compararlo con el
nuestro ya preestablecido (0.5) (p valor)
A partir de esta comparación, podremos elegir entre H0 u H1.
• Como 0,0 < 0,5 rechazamos H0 y por consiguiente aceptamos H1. [conforme
este el nivel de significación mas cerca de cero, mas evidencia en contra de la
hipótesis nula (H0)]
• H1: los datos NO siguen una distribución normal.
30. • Tenemos que elegir si cojo la prueba de normalidad, Kolmogorov-Smirnov o
Shapiro-Wilk.
• Para ellos nos fijamos en la amplitud de nuestra muestra.
Si N < 50 Shapiro
Si N > 50 Kolmogorov
Como nuestra muestra es > 50, vamos a trabajar con la prueba de normalidad
Kolmogorov- Smirnov.
31. • El siguiente paso es fijarnos en el nivel de significación y
compararlo con el nuestro ya preestablecido (0.5) (p valor)
A partir de esta comparación, podremos elegir entre H0 u H1.
Como 0,0 < 0,5 rechazamos H0 y por consiguiente aceptamos H1.
[conforme este el nivel de significación mas cerca de cero, mas evidencia en
contra de la hipótesis nula (H0)]
H1: los datos NO siguen una distribución normal.
32. • Como ya hemos comprobado que las variables anteriores no
siguen una distribución normal, elegimos la prueba adecuada
con la que vamos a proceder.
• Utilizamos RHO DE SPEARMAN, una prueba paramétrica, que
no exige que las variables se distribuyan normalmente.
33.
34.
35.
36. Grados de correlación
a. Correlación fuerte: cuanto más se
aproximan los puntos a la recta.
a. Positiva
b. Negativa
b. Correlación débil: cuando los puntos
se separan de la recta
c. Correlación nula: No hay asociación
37. • El coeficiente de correlación varia entre 0 y 1. siendo 1 la correlación
máxima y 0 la mínima.
• Como vemos en el cuadro hay dos casillas con el coeficiente de correlación
1 (es decir la correlación máxima), ya que se trata de una variable consigo
misma .
38. • Estas dos casillas sin embargo la correlación esta entre 0 y 1.
esto significa que si hay existencia de correlación. Por lo que
seguidamente tendremos que valorar el grado de correlación
de estas.
39. • El coeficiente de correlación tanto para la glucemia
como para el peso es de 0.368.
• Por el cuadro podemos comprobar el nivel o grado
de correlación. Ya que esta entre 0.2 y 0.4 la
correlación de estas dos variables es una correlación
baja.