Este documento trata sobre la correlación y concordancia. Explica que la correlación mide la relación entre dos variables y puede ser positiva o negativa. Detalla los estadísticos de Pearson y Spearman para medir la correlación dependiendo de si las variables siguen una distribución normal o no. Como ejercicio, propone analizar la relación entre el número de cigarrillos fumados y las horas dedicadas al deporte, realizando antes las pruebas de normalidad correspondientes.
2. Correlación
La mide la relación entre dos
Existe correlación entre dos variables, si estas
Hay dos tipos de
correlaciones:
Si el cambio es en la misma
dirección
Si el cambio se produce en
distinta dirección.
La correlación se representa mediante
3. Estadísticos que miden la
correlación
Según cómo se distribuyan las variables usamos:
: si las variables se distribuyen
normalmente
: si las variables no se distribuyen
normalmente.
Para decidir primero cuál usamos, hay que
comprobar la normalidad a través de unos Test:
: tamaño muestral > 50
: tamaño muestral < 50
4. Ejercicio de Correlación
El ejercicio propuesto para el Seminario 10 es:
Elige dos variables de la matriz de datos del
cuestionario. La que queráis pero deberás
justificarla.
Recuerda que tienes que hacer la prueba de
normalidad para decidir el estadístico de
correlación que tienes que utilizar.
Comenta los resultados.
Represéntalos gráficamente.
5. Ejercicio de Correlación
Para elegir las variables que vamos a utilizar
abrimos la matriz de datos del Seminario 5, en la
que vamos a trabajar.
De ahí escojo 2 variables cuantitativas:
◦ Horas de dedicación a practicar deporte
◦ Numero de cigarrillos fumados al día
Con esto quiero averiguar si existe alguna relación
entre las personas que fuman y hacen ejercicio.
6. Ejercicio de Correlación
Antes de todo, nombraremos las hipótesis:
: no sigue una distribución
normal, por lo que usaríamos el estadístico de
Spearman.
: sigue una distribución
normal, por lo que usaríamos el estadístico de Pearson.
Por lo tanto puede ocurrir que:
◦ Significación menor de 0,05 (p<0,05): rechazamos la
hipótesis nula, por lo que no seguiría una distribución
normal.
◦ Significación mayor de 0,05 (p>0,05): aceptamos la
hipótesis nula, por lo que sigue una distribución normal