Sucesión de hongos en estiércol de vaca experimento
Estudio de la correlación entre variables | Seminario 9
1.
2. La actividad propuesta consiste en usar la base de datos
obesidad.sav, para de este modo, explorar la correlación entre
las variables:
1.- Peso y glucemia
2.- Presión arterial sistólica y colesterol.
7. DISPERSIÓN DATOS
Ahora vamos a ver en una tabla de
dispersión, para de este modo
hacernos una idea de como se
distribuyen los datos.
Sigue los pasos indicados para realizar
la actividad en SPSS.
12. Por como se distribuyen los datos, se observa que
existe una débil correlación lineal (directa: cuando crece
X también crece Y).
13. NORMALIDAD PESO
Vamos a analizar como es la normalidad de
los datos de la variable cuantitativa peso.
14.
15.
16. Te aparecerá una ventana
como ésta, donde podrás
visualizar distintos datos,
referidos al peso, que podrás
utilizar para evaluar si siguen
una distribución normal o no.
17. Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístic
o gl Sig.
Estadístic
o gl Sig.
Peso medido en
consulta
,074 240 ,003 ,979 240 ,001
a. Corrección de significación de Lilliefors
La muestra tiene un número total de datos (N)= 240, por lo que tendremos que
observar la prueba de normalidad según Kolmogorov-Smirnov.
La hipótesis planteada es la siguiente:
Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad
Hipótesis alternativa (H1)= no se distribuyen con normalidad
0.003<0.05= se rechaza la h0, esto es, no sigue una distribución normal, por lo
que acepto la hipótesis alternativa.
Si p-valor ≥ α ⇒ Aceptar H0
Si p-valor < α ⇒ Rechazar H0
18. En el histograma también puedes visualizar como se
distribuyen los datos.
19. En el box-plot también puedes visualizar como se distribuyen
los datos.
En el box-plot también puedes visualizar como se distribuyen
los datos.
20. NORMALIDAD GLUCEMIA.
El mismo procedimiento que hemos realizado para analizar si
los datos se distribuyen con normalidad en la variable peso,
vamos a seguir para decidir si existe normalidad en los datos
de la variable glucemia.
21.
22.
23.
24.
25. Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Glucemia en
ayunas ,242 110 ,000 ,595 110 ,000
a. Corrección de significación de Lilliefors
= no siguen una
La muestra tiene un número total de datos (N)= 240, por lo que tendremos que
observar la prueba de normalidad según Kolmogorov-Smirnov.
La hipótesis planteada es la siguiente:
Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad
Hipótesis alternativa (H1)= no se distribuyen con normalidad
0.000<0.05= se rechaza la h0, esto es, no sigue una distribución normal, por lo
que acepto la hipótesis alternativa.
Si p-valor ≥ α ⇒ Aceptar H0
Si p-valor < α ⇒ Rechazar H0
26. En el histograma también puedes visualizar que los datos no
se distribuyen con normalidad, ya que no sigue la misma
distribución que seguirían los datos que estuvieran
englobados en una Campana de Gauss.
27. En el box-plot también puedes visualizar como se distribuyen
los datos.
28. COMO NO SIGUEN UNA DISTRIBUCIÓN
NORMAL= PRUEBA NO PARAMÉTRICAS= RHO
DE SPERMAN
A continuación, vamos a realizar la prueba de correlación
propiamente dicha. Las dos variables que hemos estudiado,
peso y glucemia, ambas cuantitativas, no siguen una
distribución normal, por lo que tenemos que usar la prueba
para analizar la correlación, para variables no paramétricas
de Rho de Sperman.
33. La hipótesis planteada es la siguiente:
Hipótesis nula (H0)= la igualdad= 0 = no existe correlación entre glucemia y peso.
Hipótesis alternativa (H1) ‡ 0 = existe correlación entre glucemia y peso.
Vemos en dicho cuadro como la correlación de cada variable consigo misma es
“perfecta” (Coef. de Correlación lineal = 1)
Mientras que la correlación con la otra variable vale 0,485, por lo que aceptamos
la hipótesis alternativa; el resultado es un valor positivo, lo que significa que la
“glucemia” aumenta conforme aumenta el “peso”, considerándose la correlación
obtenida como una correlación moderada, ya que se encuentra en un rango entre
0.4 – 0.6.
El valor de la p asociado al contraste de hipótesis evalúa la probabilidad de que en
la población ambas variables no estén correlacionadas linealmente y que el
Coeficiente de Correlación sea cero.
Ese valor p es 0,000 y es menor que 0,05 e incluso que 0,01.
Lo que permite rechazar la hipótesis nula (contraste significativo) con una alta
confianza (100%).
45. Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Colesterol total
,049 106 ,200* ,989 106 ,573
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
La muestra tiene un número total de datos (N)= 140, por lo que tendremos que
observar la prueba de normalidad según Kolmogorov-Smirnov.
La hipótesis planteada es la siguiente:
Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad
Hipótesis alternativa (H1)= no se distribuyen con normalidad
0.200<0.05= se acepta la h0, es decir, los datos siguen una distribución normal.
Si p-valor ≥ α ⇒ Aceptar H0
Si p-valor < α ⇒ Rechazar H0
46. En el histograma también puedes observar como se
distribuyen los datos.
47. En el box-plot también puedes visualizar como se distribuyen
los datos.
52. Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Tension arterial sistólica ,163 238 ,000 ,947 238 ,000
a. Corrección de significación de Lilliefors
o h0, acepto la h1=no
La muestra tiene un número total de datos (N)= 240, por lo que tendremos que
observar la prueba de normalidad según Kolmogorov-Smirnov.
La hipótesis planteada es la siguiente:
Hipótesis nula (H0)= la igualdad= se distribuyen con normalidad
Hipótesis alternativa (H1)= no se distribuyen con normalidad
0.200<0.05= se rechaza la h0, es decir, los datos no siguen una distribución
normal.
Si p-valor ≥ α ⇒ Aceptar H0
Si p-valor < α ⇒ Rechazar H0
53. En el histograma también puedes observar como los datos
se no se distribuyen como los que siguen una distribución
normal.
54. En el box-plot también puedes visualizar como se distribuyen
los datos.
58. Correlaciones
Colesterol
total
Tension
arterial
sistólica
Rho de Spearman Colesterol total Coeficiente de
correlación 1,000 ,263**
Sig. (bilateral) . ,007
N 106 105
Tension arterial sistólica Coeficiente de
correlación ,263** 1,000
Sig. (bilateral) ,007 .
N 105 238
**. La correlación es significativa en el nivel 0,01 (bilateral).
59. La hipótesis planteada es la siguiente:
Hipótesis nula (H0)= la igualdad= 0 = no existe correlación entre el colesterol y la
presión arterial.
Hipótesis alternativa (H1) ‡ 0 = existe correlación entre el colesterol y la presión arterial.
Vemos en dicho cuadro como la correlación de cada variable consigo misma es
“perfecta” (Coef. de Correlación lineal = 1)
Mientras que la correlación con la otra variable vale 0,263, por lo que aceptamos
la hipótesis alternativa; el resultado es un valor positivo, lo que significa que la
“presión arterial” aumenta conforme aumenta el “colesterol”, considerándose la
correlación obtenida como una correlación baja, ya que se encuentra en un rango
entre 0.2 – 0.4.
El valor de la p asociado al contraste de hipótesis evalúa la probabilidad de que en
la población ambas variables no estén correlacionadas linealmente y que el
Coeficiente de Correlación sea cero.
Ese valor p es 0,007 y es menor que 0,05 e incluso que 0,01.
Lo que permite rechazar la hipótesis nula (contraste significativo) con
una alta confianza (99%).