2. El coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y
reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
El coeficiente de Spearman es un caso especial del coeficiente de correlación de Pearson aplicada a dos series de los
n primeros números naturales (cuando no hay empates; si hay muchos empates hay otra fórmula
es la diferencia entre el valor ordinal en X y el valor ordinal en Y del sujeto i .
Se diferencia de la correlación de Pearson en que utiliza valores medidos a nivel de una escala
ordinal. Si alguna de las variables está medida a nivel de escala de intervalo/razón deberá procederse antes de
operar el estadístico a su conversión en forma ordinal.
id
3. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es
decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística
Descriptiva se emplea la notación rs.
La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson
a dos series de puntuaciones ordinales, compuestas cada una de ellas por los n primeros números naturales .
A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos variables X e Y, medidas al
menos en escala ordinal, es la siguiente:
Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas
puntuaciones han sido ordenadas para X y para Y.
4. El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1.
Es decir, -1 < rs < 1.
Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de
rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al
segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.
El coeficiente rs es un caso particular de rxy, puesto que se calcula a partir de éste, por aplicación del
coeficiente de Pearson a valores ordinales considerados como puntuaciones.
Si calculamos el coeficiente de correlación de Pearson entre dos variables X e Y, y el coeficiente de
correlación de Spearman para las mismas puntuaciones pero transformadas en rangos, ambos
coeficientes se aproximan en valor según aumenta el número de sujetos n.
5. el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables
aleatoriascuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la
escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que
puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas.
Es un índice estadístico que mide la relación lineal entre dos variables cuantitativas. A diferencia de la
covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. El cálculo
del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones
estándar de ambas variables:
r = Sxy
Sx.Sy
Permite predecir el valor de una variable dado un valor determinado de la otra variable. Se trata de valorar
la asociación entre dos variables cuantitativas estudiando el método conocido como correlación. Dicho
cálculo es el primer paso para determinar la relación entre las variables.
6. El valor del índice de correlación varía en el intervalo [-1,1]:
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos
variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en
proporción constante.
Si 0 < r < 1, existe una correlación positiva.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos
variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción
constante.
Varios grupos de puntos (x, y), con el coeficiente de correlación para cada grupo.
7. Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos es que las dos variables que se comparan deben
observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear
entre las dos variables.
Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear
positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una
mayor correlación positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear
negativa entre las dos variables.
Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El
valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las
variables que se comparan.
Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de
correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los
grados de libertad se calculan como el número de las dos observaciones menos 2.
8. El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables.
Mientras mas grande sea la muestra mas exacta será la estimación.
Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución
de ambas sea semejante a la de la curva normal.
9. No esta afectada por los cambios en las unidades de medida.
Al ser una técnica no parámetra, es libre de distribución probabilística.
Es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho
el coeficiente de correlación de Pearson, o ante distribuciones no normales.
r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
10. Ejemplo :
El cálculo del coeficiente de correlación (r) entre peso y talla de 20 niños varones se muestra .
La covarianza, que en este ejemplo es el producto de peso (kg) por talla (cm), para que no tenga dimensión y sea un
coeficiente, se divide por la desviación típica de X (talla) y por la desviación típica de Y (peso) con lo que obtenemos
el coeficiente de correlación de Pearson que en este caso es de 0.885 e indica una importante correlación entre las dos
variables.
Es evidente que el hecho de que la correlación sea fuerte no implica causalidad. Si elevamos al cuadrado el coeficiente
de correlación obtendremos el coeficiente de determinación (r2=0.783) que nos indica que el 78.3% de la variabilidad
en el peso se explica por la talla del niño. Por lo tanto existen otras variables que modifican y explican la variabilidad
del peso de estos niños. La introducción de más variable con técnicas de análisis multivariado nos permitirá identificar
la importancia de que otras variables pueden tener sobre el peso.
13. La siguiente tabla muestra el rango u orden obtenido en la primera evaluación (X) y el rango o puesto obtenido
en la segunda evaluación (Y) de 8 estudiantes universitarios en la asignatura de Estadística. Calcular el
coeficiente de correlación por rangos de Spearman.
14. Solución:
Para calcular el coeficiente de correlación por rangos de Spearman de se llena la siguiente tabla:
Se aplica la fórmula:
15. Por lo tanto existe una correlación positiva moderada entre la primera y segunda evaluación de los 8
estudiantes.
En Excel se calcula de la siguiente manera:
a) Se inserta la función COEF.DE.CORREL y pulsar en Aceptar. En el cuadro de argumentos de la función,
en el recuadro de la Matriz 1 seleccionar las celdas de X, y en el recuadro de la Matriz 2 seleccionar las
celdas de Y. Pulsar en Aceptar.