1. ACTIVIDADES SEMINARIO 10 – Concordancia y
correlación
Ejercicio de Correlación para el blog
Elige dos variables de la matriz de datos del cuestionario. (La que queráis pero
deberás justificarla y recuerda que tienes que hacer la prueba de normalidad para
decidir el estadístico de correlación que tienes que utilizar).
a) Comenta los resultados.
b) Represéntalos gráficamente.
Las dos variables escogidas son: Horas de dedicación a practicar deporte y Número de
cigarrillos fumados al día, ambas de tipo cuantitativo, necesarias para la correlación.
He elegido estas dos variables para ver si existe relación entre ambas, es decir, para ver si los
valores del número de cigarrillos fumados al día cambian según las horas de dedicación a
practicar deporte.
Antes de decidir el estadístico de la correlación, tenemos que ver si estas variables siguen o no
una distribución normal. Para ello, hay que realizar la prueba de la normalidad en el programa
SPSS y tener presente que aceptaremos la normalidad siempre que la prueba sea mayor que
0,05. En el SPSS para comprobar la normalidad, saldrán dos pruebas: Test de Kolmogorov –
Smirnov, si N es superior a 50, ó Test de Shapiro – Wilks, si N es inferior a 50. Los datos son los
siguientes
Pruebas de normalidad
Kolmogorov-Smirnova
Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Número de cigarrillos
fumados al día
,291 9 ,027 ,764 9 ,008
Horas de dedicación a
prácticar deporte
,172 9 ,200*
,964 9 ,840
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
Una vez obtenidos, nos fijamos en los grados de libertad que corresponde con el tamaño
muestral. Por tanto, como 9 < 50, nos centramos en el apartado de Shapiro – Wilk.
Observamos que la significación en la variable número de cigarrillos es 0,008 y en la variable
horas de dedicación al deporte es 0,840. Comparando los resultados con 0,05 vemos que la
variable numero de cigarrillo no sigue una distribución normal puesto que 0,008 < 0, 05; lo
que indica que existen diferencias estadísticamente significativa y no sigue una distribución
normal. Por otro lado, en la variable horas de dedicación al deporte vemos que 0,840 > 0,05
por lo que podemos afirma que sigue una distribución normal, puesto que no existen
diferencias estadísticamente significativas.
2. Estos resultados también podemos verlo más representativamente en los siguientes gráficos:
A continuación, una vez obtenidos los resultados de normalidad, tenemos que elegir el
estadístico de correlación que debemos utilizar. Hay dos coeficientes de correlación: R de
Pearson, utilizado si las variables se distribuyen normalmente, y Rho de Spearman, utilizado si
las variables no se distribuyen normalmente.
En nuestro caso, como la variable numero de cigarrillos se distribuye normalmente y la
variable horas de dedicación a practicar deporte no se distribuye normalmente, elegiremos el
estadísticos Rho de Spearman. Los datos obtenidos son los siguientes:
Correlaciones
Número de
cigarrillos
fumados al día
Horas de
dedicación a
prácticar
deporte
Rho de Spearman
Número de cigarrillos
fumados al día
Coeficiente de correlación 1,000 -,526
Sig. (bilateral) . ,146
N 12 9
Horas de dedicación a
prácticar deporte
Coeficiente de correlación -,526 1,000
Sig. (bilateral) ,146 .
N 9 31
Observando los resultados vemos que la correlación seria significativa, es decir habría relación
entra ambas variables, si la significación fuera menor a 0,05. Como la significación obtenida es
0,146; al compararse, vemos que es mayor a 0,05 (0,146 > 0,05). Por lo tanto, no existe una
correlación entre ambos puesto que al ser mayor hay una gran diferencia estadísticamente
significativa. Al no haber correlación, podemos afirmar que no existe relación entre el nº de
cigarrillos fumados al día y las horas de dedicación a practicar deporte, así al cambiar los
valores de una no cambiará los valores de otras.
3. Todos estos resultados, podemos verlo más representativamente gracias al siguiente gráfico
de correlación:
Como vemos en la tabla, no muestra correlación entre ambas variables puesto que para que
hubiera se debería trazar una clara diagonal; y como vemos los datos están más dispersos en el
lado derecho, por lo que resultaría imposible trazar esta diagonal.