Este documento resume un seminario sobre correlaciones. Explica que la correlación indica la fuerza y dirección de la relación lineal entre dos variables estadísticas. Luego describe las pruebas de correlación de Spearman y Pearson y cómo interpretar sus resultados. Finalmente, el documento guía a realizar un ejercicio práctico seleccionando dos variables, analizando su normalidad y realizando las pruebas de correlación correspondientes.
2. ¿Cuál es la
definición de
correlación?
En probabilidad y estadística, la
correlación indica la fuerza y la
dirección de una relación lineal y
proporcionalidad entre dos variables
estadísticas. Se considera que dos
v a r i a b l e s c u a n t i t a t i v a s e s t á n
correlacionadas cuando los valores de
una de ellas varían sistemáticamente
con respecto a los valores homónimos
de la otra: si tenemos dos variables (A
y B) existe correlación entre ellas si al
disminuir los valores de A lo hacen
también los de B y viceversa.
3. Pruebas que podremos utilizar
según nuestros resultados
Coeficiente correlación de Spearman es una
medida de la correlación entre variables
cuantitativas que no siguen una distribución
normal. Se considera una prueba no
paramétrica.
Coeficiente correlación de Pearson es una
medida de la correlación entre variables
cuantitativas que siguen una distribución
normal. Se considera una prueba paramétrica.
4. Entre ambos coeficientes la cifra
estará situada entre ± 1, haciendo
que mientras más se acerque el valor
a + 1 la correlación será más
positiva, a diferencia de que nuestro
valor se encontrase más cercano a
- 1, indicando que la correlación es
más negativa. Si los valores se
acercaran a 0 indicaría una más
débil correlación que las comentadas
anteriormente.
5. Prueba que realizaremos
independientemente de nuestros
resultados
Test de Tau-B de Kendall mide el grado
de asociación entre varios conjuntos (k)
de N entidades. Es útil para determinar
la asociación entre tres o más variables.
6. Tarea
Elegir dos variables cuantitativas y:
justificar la razón por la que he cogido
esas dos variables
Realizarles la prueba de normalidad para
decidir que test de correlación elegiremos,
si Spearman o Pearson
Comentar y publicar los gráficos y
representaciones obtenidas
Realizar también el Gráfico de Dispersión
7. Variables elegidas
Las dos variables elegidas han sido:
Trigliceridemia
Edad
El motivo por el que hemos elegido
esas dos son porque se encuentran
en la escala Intervalo/Razón
8. Prueba de Normalidad
Primero le hemos
dado a
ANALIZAR—>
ESTADISTICOS
DESCRIPTIVOS—>
EXPLORAR—>
añadimos
nuestras dos
variables y le
damos a
GRAFICOS
11. Nos fijamos en la Prueba de Kolmogorov-Smirnov, ya
que el grado de libertad (N-1) es 61 (62-1), por tanto
nuestra muestra es mayor de 50.
Podemos observar como la significación asintótica es
0,000 (<0,05), por lo que rechazaríamos la Hipótesis
Nula, aceptándose la Hipótesis Alternativa. Por tanto,
podemos concluir diciendo que los resultados no
siguen una distribución normal, por tanto,
realizaríamos el test de correlación de Spearman.
12.
13.
14.
15. Prueba de Spearman
Primero le daríamos a
ANALIZAR—> CORRELACIONAR
—> BIVARIADAS, y
posteriormente en el
APARTADO VARIABLES
colocaríamos nuestras dos
variables, Seleccionaríamos
Tau-b de Kendall y Spearman
en el apartado
COEFICIENTES DE
CORRELACION. Además,
marcaríamos BILATERAL del
APARTADO DE SIGNIFICACI
´ON Y marcaríamos SEÑALAR
LAS CORRELACIONES
SIGNIFICATIVAS. Finalmente
le daríamos a ACEPTAR.
17. Como podemos observar la correlación
entre nuestras variables edad y
trigliceridemia según Spearman es 0,166, lo
cual indica una correlación positiva y
moderada, pues el resultado se encuentra
cercano a 0.
En el test de Kendall la significación
asintótica bilateral es 0,245 (>0,005), por
tanto debemos aceptar la Hipótesis Nula,
diciendo así que no existe una correlación
entre nuestras variables
Peso-Trigliceridemia.
18. Gráfico de dispersión
Los pasos a seguir para realizar un gráfico de
dispersión con nuestras variables son los
siguientes
GRAFICOS—>
CUADROS DE
DIALOGOS
ANTIGUOS—>
DISPERSION/
PUNTOS
19. lo primero que hicimos fue
señalar DISPERSION SIMPLE
—>DEFINIR. Esto en la
primer ventana. En la
segunda, en el eje Y
colocamos nuestra variable
dependiente, que es
TRIGLICERIDEMIA, y en el
eje X, nuestra variable
independiente, que es EDAD
y finalmente le dimos a
ACEPTAR.
20. A continuación, le dimos a OPCIONES
—>MOSTRAR LOS GRUPOS OBTENIDOS POR LOS
VALORES PEDIDOS—> CONTINUAR—> ACEPTAR.
22. Se puede ver como no hay correlación
e n t r e l a s v a r i a b l e s e d a d -
trigliceridemia, y esto ya lo habíamos
visto antes al aceptar la H0 y eso nos
decía que no había correlación entre
las variables y es pura casualidad los
datos.