COEFICIENTE DE SPERMAN1111111111111111111111111111
1. Coeficientes Correlación:
Spearman
Prof: Esteban LAVADO VAZQUEZ.
2024 - PASCO
Universidad Nacional Daniel Alcides Carrión
FACULTAD DE CIENCIAS ECONÓMICAS Y CONTABLES
Escuela de Formación Profesional de Economía
2. Charles Spearman y el
coeficiente de
correlación de Spearman
Charles Spearman fue un psicólogo
inglés que nació en 1863 y falleció en
1945. A lo largo de su vida enseñó en la
Universidad de Londres e investigó
asuntos relacionados con la psicología y
la inteligencia.
Una de sus formulaciones más
importantes fue la teoría de que
la inteligencia se compone de un factor
general y otros específicos. Así, creyó en
la existencia de un factor general que
interviene en las distintas fases de la
conducta humana e imputó a las
capacidades específicas un papel clave
en cada actividad.
3. El coeficiente de
correlación de
Spearman
El método de
Spearman, considerado
uno de los grandes
estadistas de todos los
tiempos, ya que se
incluye en
las matemáticas
experimentales. Así, este
psicólogo estudió las
dimensiones del campo
empírico.
En estadística, ρ (rho) es una medida de
la correlación entre dos variables
aleatorias, tanto continuas como
discretas.
El cálculo de esta se realiza a partir de
los datos que son ordenados y
reemplazados por su respectivo orden.
Por lo tanto, la correlación de Spearman
evalúa la relación entre dos variables
continuas u ordinales.
En una relación monótona, las variables
suelen cambiar al mismo tiempo, pero no
tienen por qué hacerlo a un ritmo
constante. El coeficiente de correlación
de Spearman se basa en los valores
jerarquizados de cada variable y no en los
datos sin procesar.
4. En resumen:
El coeficiente de correlación de
Spearman es una medida no
paramétrica de la correlación de
rango (dependencia estadística del
ranking entre dos variables
cuantitativas. ). Se utiliza
principalmente para el análisis de
datos.
Esta prueba se realiza sobre todo
para conocer el grado y el sentido de
la relación que existe entre dos
variables que se miden en un nivel
ordinal cuando menos. La diferencia
con respecto a otro tipo de test es
que este ofrece datos muy precisos,
ya que está fundamentado en la
estadística.
En definitiva, el coeficiente de
correlación de Spearman analiza
una serie de variables a través de
una fórmula específica. Este tipo
de análisis puede ser muy útil y
aplicarse en diferentes
situaciones.
5. Aspectos a considerar:
Es el coeficiente más empleado en los métodos de correlación por rangos
Se recomienda usar este método, con datos entre 25 o 30 o menos
Las variables son medidos en escalas ordinales
Es más fácil y rápido de calcular que el Coeficiente de Correlación de
Pearson.
Propiedades:
Toma valores entre – 1 < rs <+ 1
El coeficiente rs es un caso particular de xy
Si calculamos el coeficiente de correlación de Pearson entre dos variables
X e Y, y el coeficiente de correlación de Spearman para las mismas
puntuaciones pero transformadas en rangos, ambos coeficientes se
aproximan en valor según aumenta el número de sujetos n.
Coeficiente de Spearman
6.
7.
8.
9.
10.
11. Como puedes ver en los gráficos de dispersión de arriba, cuanto más
fuerte es la correlación entre dos variables más juntos están los puntos
en el gráfico. Por otro lado, si los puntos están muy separados entre sí
significa que la correlación es débil.
12. •r=-1: las dos variables tienen una
correlación perfecta negativa, por lo que se
puede trazar una recta con pendiente
negativa en la que se encuentren todos los
puntos.
•-1<r<0: la correlación entre las dos
variables es negativa, por lo tanto, cuando
una variable aumenta la otra disminuye.
Cuanto más cerca esté el valor de -1
significa que más relacionadas
negativamente están las variables.
13. •r=0: la correlación entre las dos
variables es muy débil, de hecho,
la relación lineal entre ellas es
nula. Esto no significa que las
variables sean independientes, ya
que podrían tener una relación no
lineal.
•0<r<1: la correlación entre las dos
variables es positiva, cuanto más
cerca esté el valor de +1 más
fuerte es la relación entre las
variables. En este caso, una
variable tiende a incrementar su
valor cuando la otra también
aumenta.
•r=1: las dos variables tienen una
correlación perfecta positiva, es
decir, tienen una relación lineal
positiva.
14. La correlación de
rangos de Spearman
examina la relación entre
dos variables, siendo
la contrapartida no
paramétrica de
la correlación de Pearson.
Por lo tanto, en este caso
no se requiere una
distribución normal de los
datos.
Existe una diferencia importante entre
ambos coeficientes de correlación. La
correlación de Spearman utiliza los rangos
de los datos en lugar de los datos en sí, de
ahí el nombre de correlación de rangos.
15. Ejemplo de correlación de
Spearman
Medimos el tiempo de
reacción de 8 jugadores
de ordenador y les
preguntamos su edad.
16. El tiempo de reacción ya está ordenado
por tamaño. 12 es el valor más pequeño,
por lo que obtiene el rango 1, 15 es el
segundo más pequeño, por lo que obtiene
el rango 2 y así sucesivamente. Ahora
hacemos lo mismo con la edad.
Recordemos :
Si utilizamos una
correlación de Pearson,
simplemente tomamos las dos
variables tiempo de reacción y
edad y calculamos el
coeficiente de correlación de
Pearson. Sin embargo, ahora
queremos calcular la
correlación de rangos de
Spearman, por lo que primero
asignamos un rango a cada
persona para el tiempo de
reacción y la edad.
17. Hemos estudiado a 8
personas y como no
tenemos correlaciones de
rangos, tenemos por tanto
8 rangos que asignar.
Mediante esta
transformación, ahora
tenemos los datos más
uniformemente distribuidos.
Veámoslo en un diagrama de dispersión. A
la izquierda vemos los datos iniciales de
edad y capacidad de respuesta y a la
derecha los rangos.
Ahora, para calcular la correlación de Spearman, simplemente calculamos la
correlación de Pearson de los rangos. Así pues, la correlación de Spearman es la
misma que la correlación de Pearson, salvo que se utilizan los rangos en lugar de
los valores iniciales.
18. Vamos A RESOLVERLO EN
DATA tab
Por un lado, tenemos el
tiempo de reacción y la
edad, y por el otro,
tenemos los rangos recién
creados a partir del
tiempo de reacción y la
edad.
19. Ahora podemos calcular la correlación de rangos de Spearman a partir del
tiempo de reacción y la edad o podemos calcular la correlación de Pearson a
partir de los rangos. En ambos casos obtenemos una correlación de 0.9.
Ecuación de correlación de Spearman:
Si no hay empates de rango, esta ecuación también se
puede utilizar para calcular la correlación de Spearman.
20. Donde n es el número de
casos y d es la diferencia
de clasificación entre las
dos variables. Para nuestro
ejemplo, el resultado es el
siguiente:
La suma de di2 es 8 y n, que es el número
de personas, también es 8. Si lo juntamos
todo, obtenemos un coeficiente de
correlación de 0.9.
21. Entonces se determina que:
Al igual que el coeficiente de
correlación r de Pearson, el coeficiente de
correlación rs de Spearman también varía
entre -1 y 1.
Con la ayuda del coeficiente podemos
determinar ahora dos cosas:
la fuerza de la correlación y
en qué dirección va la correlación.
0.7 < 1 correlación
muy alta
Como respuesta a
nuestro ejemplo
tenemos que:
22. Comprobación de la significación de los coeficientes de
correlación
A menudo, partiendo de una muestra, queremos probar una
hipótesis sobre la población.
23. Hemos calculado el coeficiente de correlación para los datos de la
muestra. Ahora podemos comprobar si el coeficiente de correlación es
significativamente diferente de 0.
La hipótesis nula y la hipótesis alternativa resultan así:
•Hipótesis nula: el coeficiente de correlación rs = 0 (No hay correlación).
•Hipótesis alternativa El coeficiente de correlación rs ≠ 0 (Hay
correlación).
Si el coeficiente de correlación es significativamente distinto de cero,
según la muestra recogida, puede comprobarse mediante una prueba t.
24. Si utilizamos DATAtab
para el cálculo del
ejemplo, obtenemos
un valor p de 0.002.
Donde r es el coeficiente
de correlación y n es el
tamaño de la muestra. A
continuación, puede
calcularse un valor p a partir
del estadístico de prueba t.
Si el valor p es inferior al
nivel de significación
especificado (normalmente
el 5%), se rechaza la
hipótesis nula; de lo
contrario, no.
Así pues, el valor p es inferior a 0.05 y, por lo tanto,
podemos rechazar la hipótesis nula de que en la
población el coeficiente de correlación es cero.
27. Ejemplo 1:
Se desea conocer el grado de relación entre las posiciones que ocuparon
10 atletas que tomaron parte en dos pruebas de 100 (Xi ) y 200 (Yi ) mts
planos. Los resultados se muestran a continuación:
Atleta A B C D E F G H I J
100 1 2 4 3 5 6 7 8 10 9
200 2 1 3 4 6 5 7 8 9 10
calcularelcoeficientedecorrelacióndeSpearmanmediantefórmula:
28. Procedimiento:
1) Los valores están dados directamente en rangos
2) Establecer la diferencia entre los lugares ocupados por cada atleta:
di = Xi - Yi
Atleta A B C D E F G H I J
100
(Xi )
1 2 4 3 5 6 7 8 10 9
200
(Yi )
2 1 3 4 6 5 7 8 9 10
di -1 1 1 -1 -1 1 0 0 1 -1
29. Procedimiento:
3) Elevar al cuadrado cada diferencia y finalmente sumar el cuadrado de
tales diferencias. di
2 .
Prof.: Johnnalid González G.
Atleta A B C D E F G H I J
100
(Xi )
1 2 4 3 5 6 7 8 10 9
200
(Yi )
2 1 3 4 6 5 7 8 9 10
di -1 1 1 -1 -1 1 0 0 1 -1
di2 1 1 1 1 1 1 0 0 1 1 = di
2 = 8
30. 4) Aplicar la fórmula
1
6*8
0,95
10*11*9
r 1
n(n1)(n1)
2
i
d
n
6
i1
s
5) Interpretación: Los atletas que lograron las mejores posiciones
en la prueba de 100 metros planos, tienden en forma muy alta a
obtener las mejores posiciones en la prueba de 200 metros planos.
31. Ejemplo 2:
Calcular e interpretar el Coeficiente de Correlación de Spearman, entre los
resultados obtenidos por un grupo de estudiantes de tercer año en dos
pruebas objetivas finales de lapso, Castellano (Xi ) y Cs. Biológicas (Yi ).
Estudiantes A B C D E F G
Castellano 48 47 46 46 45 43 43
Cs
Biológicas
25 25 19 12 12 12 11
32. Estudiantes A B C D E F G
Castellano
(Xi )
48 47 46 46 45 43 43
Cs
Biológicas
(Yi )
25 25 19 12 12 12 11
(Xi ´) 1 2 3,5 3,5 5 6,5 6,5
(Yi ´) 1,5 1,5 3 5 5 5 7
Procedimiento:
1) Se convierte los puntajes en posiciones, de la siguiente manera: en la Variable Xi
(Castellano), el estudiante A obtuvo la mayor puntuación, entonces se le asigna la
posición 1 y asi sucesivamente, en el caso de los estudiantes C y D, tienen las
mismas puntuaciones, es decir se tiene un “empates”, se deben sumar los
lugares que les tocarían si no estuviesen empates y se divide entre el número de
valores iguales, de la misma forma se le aplicaría a los estudiantes F y G.
33. Estudiantes A B C D E F G
(Xi ´) 1 2 3,5 3,5 5 6,5 6,5
(Yi ´) 1,5 1,5 3 5 5 5 7
di -0,5 0,5 0,5 -1,5 0 1,5 -0,5
di2 0,25 0,25 0,25 2,25 0 2,25 0,25
Procedimiento:
2) Establecer la diferencia entre los lugares ocupados por cada atleta:
di = Xi ´- Yi ´.
3) Elevar al cuadrado cada diferencia y finalmente sumar el cuadrado de tales
diferencias. di
2 .
= di
2 = 5,5
34. 4) Aplicar la fórmula
1
6*5,5
0,90
7*8*6
r 1
n(n1)(n1)
2
i
d
n
6
i1
s
5) Interpretación: Los estudiantes que lograron las mejores notas
en la prueba de Castellano, tienden muy altamente a obtener las
mejores calificaciones en la prueba de Ciencias Biológicas.