SEMINARIO 9
CORRELACION
Esther Escalante Molina.
Grupo 5. subgrupo 17.
Enfermería. Virgen del Rocío
• Correlación: relación o dependencia que
existe entre dos variables o cambio
sistemático en las puntuaciones de dos
variables de intervalo/razón.
• Dos variables se relacionan cuando las
mediciones de una variable cambian
simultáneamente con las medidas de la otra (=
si sus mediciones cambian simultánea y
proporcionalmente)
Usando la base de datos “obesidad.sav” (la cual descargamos de
la enseñanza virtual), procedemos a explorar la correlación
entre las variables peso y glucemia.
Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
Copiamos las columnas de las variables con las que vamos a
trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
Vista de variables.
Procedemos a realizar una grafica de dispersión, para
ver la proximidad de los datos.
Seleccionamos el gráfico con el que queremos trabajar
y lo arrastramos a la casilla de vista previa.
Arrastramos las variables a cada eje de la grafica.
Resultados obtenidos.
• Ante todo establecemos nuestras hipótesis con las que vamos a
trabajar.
 H0: los datos siguen una distribución normal
 H1: los datos NO siguen una distribución normal.
Para comprobar la correlación entre estas dos variables, tengo que decidir
que prueba voy a utilizar:
• - Coeficiente r de Pearson. Prueba paramétrica (cuando las variables
cuantitativas siguen una distribución normal).
• - Coeficiente rho de Spearman. Prueba no paramétrica (no exige que las
variables cuantitativas sigan una distribución normal)
Como vemos, para decidir entre las pruebas anteriormente tengo que
comprobar si las variables siguen o no una distribución normal, mediante
las pruebas de normalidad. Las tengo que realizar a las 2 variables.
Realizamos las pruebas de normalidad.
Primero realizamos a prueba de normalidad, para la
variable glucemia.
Resultados analíticos.
• Tenemos que elegir si cojo la prueba de normalidad, Kolmogorov-Smirnov
o Shapiro-Wilk.
• Para ellos nos fijamos en la amplitud de nuestra muestra.
Si N < 50  Shapiro-Wilk
Si N > 50  Kolmogorov-Smirnov
Como nuestra muestra es > 50, vamos a trabajar con la prueba de normalidad
Kolmogorov- Smirnov.
• El siguiente paso es fijarnos en el nivel de significación y compararlo con el
nuestro ya preestablecido (0.5) (p valor)
A partir de esta comparación, podremos elegir entre H0 u H1.
• Como 0,0 < 0,5  rechazamos H0 y por consiguiente aceptamos H1. [conforme
este el nivel de significación mas cerca de cero, mas evidencia en contra de la
hipótesis nula (H0)]
• H1: los datos NO siguen una distribución normal.
Resultados gráficos. Histograma
Resultados gráficos. Box-plot
Realizamos la prueba de normalidad para la variable
peso.
(No explico los pasos porque son los mismo que con la anterior
variable con la que hemos trabajado)
Resultados gráficos. Histograma.
Resultados gráficos. Box-Plot.
Resultados analíticos.
• Tenemos que elegir si cojo la prueba de normalidad, Kolmogorov-Smirnov o
Shapiro-Wilk.
• Para ellos nos fijamos en la amplitud de nuestra muestra.
Si N < 50  Shapiro
Si N > 50  Kolmogorov
Como nuestra muestra es > 50, vamos a trabajar con la prueba de normalidad
Kolmogorov- Smirnov.
• El siguiente paso es fijarnos en el nivel de significación y
compararlo con el nuestro ya preestablecido (0.5) (p valor)
A partir de esta comparación, podremos elegir entre H0 u H1.
Como 0,0 < 0,5  rechazamos H0 y por consiguiente aceptamos H1.
[conforme este el nivel de significación mas cerca de cero, mas evidencia en
contra de la hipótesis nula (H0)]
H1: los datos NO siguen una distribución normal.
• Como ya hemos comprobado que las variables anteriores no
siguen una distribución normal, elegimos la prueba adecuada
con la que vamos a proceder.
• Utilizamos RHO DE SPEARMAN, una prueba paramétrica, que
no exige que las variables se distribuyan normalmente.
Grados de correlación
a. Correlación fuerte: cuanto más se
aproximan los puntos a la recta.
a. Positiva
b. Negativa
b. Correlación débil: cuando los puntos
se separan de la recta
c. Correlación nula: No hay asociación
• El coeficiente de correlación varia entre 0 y 1. siendo 1 la correlación
máxima y 0 la mínima.
• Como vemos en el cuadro hay dos casillas con el coeficiente de correlación
1 (es decir la correlación máxima), ya que se trata de una variable consigo
misma .
• Estas dos casillas sin embargo la correlación esta entre 0 y 1.
esto significa que si hay existencia de correlación. Por lo que
seguidamente tendremos que valorar el grado de correlación
de estas.
• El coeficiente de correlación tanto para la glucemia
como para el peso es de 0.368.
• Por el cuadro podemos comprobar el nivel o grado
de correlación. Ya que esta entre 0.2 y 0.4 la
correlación de estas dos variables es una correlación
baja.

Seminario 9

  • 1.
    SEMINARIO 9 CORRELACION Esther EscalanteMolina. Grupo 5. subgrupo 17. Enfermería. Virgen del Rocío
  • 2.
    • Correlación: relacióno dependencia que existe entre dos variables o cambio sistemático en las puntuaciones de dos variables de intervalo/razón. • Dos variables se relacionan cuando las mediciones de una variable cambian simultáneamente con las medidas de la otra (= si sus mediciones cambian simultánea y proporcionalmente)
  • 3.
    Usando la basede datos “obesidad.sav” (la cual descargamos de la enseñanza virtual), procedemos a explorar la correlación entre las variables peso y glucemia.
  • 4.
    Copiamos las columnasde las variables con las que vamos a trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
  • 5.
    Copiamos las columnasde las variables con las que vamos a trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
  • 6.
    Copiamos las columnasde las variables con las que vamos a trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
  • 7.
    Copiamos las columnasde las variables con las que vamos a trabajar. Y las pegamos en un nuevo conjunto de datos en SPSS.
  • 8.
  • 9.
    Procedemos a realizaruna grafica de dispersión, para ver la proximidad de los datos.
  • 10.
    Seleccionamos el gráficocon el que queremos trabajar y lo arrastramos a la casilla de vista previa.
  • 12.
    Arrastramos las variablesa cada eje de la grafica.
  • 13.
  • 14.
    • Ante todoestablecemos nuestras hipótesis con las que vamos a trabajar.  H0: los datos siguen una distribución normal  H1: los datos NO siguen una distribución normal. Para comprobar la correlación entre estas dos variables, tengo que decidir que prueba voy a utilizar: • - Coeficiente r de Pearson. Prueba paramétrica (cuando las variables cuantitativas siguen una distribución normal). • - Coeficiente rho de Spearman. Prueba no paramétrica (no exige que las variables cuantitativas sigan una distribución normal) Como vemos, para decidir entre las pruebas anteriormente tengo que comprobar si las variables siguen o no una distribución normal, mediante las pruebas de normalidad. Las tengo que realizar a las 2 variables.
  • 15.
    Realizamos las pruebasde normalidad.
  • 16.
    Primero realizamos aprueba de normalidad, para la variable glucemia.
  • 18.
  • 19.
    • Tenemos queelegir si cojo la prueba de normalidad, Kolmogorov-Smirnov o Shapiro-Wilk. • Para ellos nos fijamos en la amplitud de nuestra muestra. Si N < 50  Shapiro-Wilk Si N > 50  Kolmogorov-Smirnov Como nuestra muestra es > 50, vamos a trabajar con la prueba de normalidad Kolmogorov- Smirnov.
  • 20.
    • El siguientepaso es fijarnos en el nivel de significación y compararlo con el nuestro ya preestablecido (0.5) (p valor) A partir de esta comparación, podremos elegir entre H0 u H1. • Como 0,0 < 0,5  rechazamos H0 y por consiguiente aceptamos H1. [conforme este el nivel de significación mas cerca de cero, mas evidencia en contra de la hipótesis nula (H0)] • H1: los datos NO siguen una distribución normal.
  • 21.
  • 22.
  • 23.
    Realizamos la pruebade normalidad para la variable peso.
  • 24.
    (No explico lospasos porque son los mismo que con la anterior variable con la que hemos trabajado)
  • 27.
  • 28.
  • 29.
  • 30.
    • Tenemos queelegir si cojo la prueba de normalidad, Kolmogorov-Smirnov o Shapiro-Wilk. • Para ellos nos fijamos en la amplitud de nuestra muestra. Si N < 50  Shapiro Si N > 50  Kolmogorov Como nuestra muestra es > 50, vamos a trabajar con la prueba de normalidad Kolmogorov- Smirnov.
  • 31.
    • El siguientepaso es fijarnos en el nivel de significación y compararlo con el nuestro ya preestablecido (0.5) (p valor) A partir de esta comparación, podremos elegir entre H0 u H1. Como 0,0 < 0,5  rechazamos H0 y por consiguiente aceptamos H1. [conforme este el nivel de significación mas cerca de cero, mas evidencia en contra de la hipótesis nula (H0)] H1: los datos NO siguen una distribución normal.
  • 32.
    • Como yahemos comprobado que las variables anteriores no siguen una distribución normal, elegimos la prueba adecuada con la que vamos a proceder. • Utilizamos RHO DE SPEARMAN, una prueba paramétrica, que no exige que las variables se distribuyan normalmente.
  • 36.
    Grados de correlación a.Correlación fuerte: cuanto más se aproximan los puntos a la recta. a. Positiva b. Negativa b. Correlación débil: cuando los puntos se separan de la recta c. Correlación nula: No hay asociación
  • 37.
    • El coeficientede correlación varia entre 0 y 1. siendo 1 la correlación máxima y 0 la mínima. • Como vemos en el cuadro hay dos casillas con el coeficiente de correlación 1 (es decir la correlación máxima), ya que se trata de una variable consigo misma .
  • 38.
    • Estas doscasillas sin embargo la correlación esta entre 0 y 1. esto significa que si hay existencia de correlación. Por lo que seguidamente tendremos que valorar el grado de correlación de estas.
  • 39.
    • El coeficientede correlación tanto para la glucemia como para el peso es de 0.368. • Por el cuadro podemos comprobar el nivel o grado de correlación. Ya que esta entre 0.2 y 0.4 la correlación de estas dos variables es una correlación baja.