2. *
Correlación De Pearson
El coeficiente de correlación de Pearson es una medida de la relación
lineal entre dos variables aleatorias cuantitativas. A diferencia de
la covarianza, la correlación de Pearson es independiente de la escala de
medida de las variables. De manera menos formal, podemos definir el
coeficiente de correlación de Pearson como un índice que puede utilizarse
para medir el grado de relación de dos variables siempre y cuando ambas
sean cuantitativas.
Los coeficientes de correlación son medidas que indican la situación
relativa de los mismos sucesos respecto a las dos variables, es decir, son
la expresión numérica que nos indica el grado de relación existente entre
las 2 variables y en qué medida se relacionan. Son números que varían
entre los límites +1 y -1. Su magnitud indica el grado de asociación entre
las variables; el valor r = 0 indica que no existe relación entre las
variables; los valores(1 son indicadores de una correlación perfecta
positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o
decrecer X decrece o crece y)
3. *
Interpretación
*El valor del índice de correlación varía en el intervalo [-1,1]:
*Si r = 1, existe una correlación positiva perfecta. El índice indica
una dependencia total entre las dos variables
denominada relación directa: cuando una de ellas aumenta, la
otra también lo hace en proporción constante.
*Si 0 < r < 1, existe una correlación positiva.
*Si r = 0, no existe relación lineal. Pero esto no necesariamente
implica que las variables son independientes: pueden existir
todavía relaciones no lineales entre las dos variables.
*Si -1 < r < 0, existe una correlación negativa.
*Si r = -1, existe una correlación negativa perfecta. El índice indica
una dependencia total entre las dos variables llamada relación
inversa: cuando una de ellas aumenta, la otra disminuye en
proporción constante.
4. Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta
Para interpretar el coeficiente de
correlación utilizamos la
siguiente escala
5. *
X 18 17 15 16 14 12 9 15 16 14 16 18
SX
=18
0
Y 13 15 14 13 9 10 8 13 12 13 10 8
SY=
138
Para datos no agrupados se calcula aplicando la
siguiente ecuación:
Ejemplo:
Con los datos sobre las temperaturas en dos días diferentes en una ciudad,
determinar el tipo de correlación que existe entre ellas mediante el coeficiente de
PEARSON.
9. *
Uso Del Coeficiente De Correlación de Pearson
Identifica el dependiente variable que se probara entre dos
observaciones derivadas independientemente. Uno de los requisitos es
que las dos variables que se comparan deben observarse o medirse de
manera independiente para eliminar cualquier resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que
no hay que relación.
Reporta un valor de correlación cercano a 1 como indicador de que
existe una relación linear positiva entre las dos variables las dos
variables. Un valor mayor a cero que se acerque a 1 da como resultado
una mayor correlación positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de que
hay una relación linear negativa entre las dos variables.
10. *
Correlación de Spearman
El coeficiente de correlación de Spearman, ρ (rho) es una medida
de la correlación (la asociación o interdependencia) entre
dos variables aleatorias continuas. Para calcular ρ, los datos son
ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de
orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal
circunstancia. Para muestras mayores de 20 observaciones,
podemos utilizar la siguiente aproximación a la distribución t de
Student.
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente, 0
cero, significa no correlación pero no independencia. La tau de
Kendall es un coeficiente de correlación por rangos, inversiones
entre dos ordenaciones de una distribución normal bivariante
11. *
Uso Del Coeficiente De Correlación De Spearman
Para aplicar el coeficiente de correlación de spearman se requiere que
las variables estén medidas al menos en escala ordinal, es decir, de
forma que las puntuaciones que las representa puedan ser colocadas en
dos series ordenadas.
A veces este coeficiente es denominado por la letra griega ρ (rho),
aunque cuando nos situamos en el contexto de estadística descriptiva se
emplea la notación rs.
La formula de calculo para rs puede derivarse de la utilizada en el caso
de rxy, bastaría aplicar el coeficiente de correlación de Pearson a dos
series de puntuaciones ordinales, compuesta cada una de ellas por los n
primeros números naturales.
A partir de un conjunto de n puntuaciones, la formula que permite el
calculo de la correlación entre dos variables X e Y, medidas al menos en
escala ordinal.x
12. *
Propiedades de Coeficiente de correlación de
Spearman
El coeficiente de correlación de spearman se encuentra siempre
comprendido entre -1 y 1 es decir, -1 < rs < 1.
Cuando todos los sujetos se sitúan en el mismo puesto de la variable X y
para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es
decir, al primer sujeto en X le corresponde el ultimo lugar en Y, al
segundo en X le corresponde el ultimo lugar en Y, al segundo en X le
corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.
El coeficiente rs es un caso particular de rxy, puesto que se calcula a
partir de este, por aplicación del coeficiente de Pearson a valores
ordinales considerados como puntuaciones.
Si calculamos el coeficiente de correlación entre dos variables X e Y, el
coeficiente de spearman para las mismas puntuaciones pero
transformadas en rangos, ambos coeficientes se aproximan en valor
según aumenta el numero de sujetos n.
13. *
Ejemplo de Spearman
La siguiente tabla muestra el rango u orden obtenido en la
primera evaluación (X) y el rango opuesto obtenido en la
segunda evaluación (Y) de 8 estudiantes universitarios en la
asignatura de Estadística. Calcular el coeficiente de correlación
por rangos de Spearman.
.Estudiante X Y
Dyana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Mathías 5 6
Josué 6 2
Anita 7 8
Lucía 8 7
14. *
Solución:
Para calcular el coeficiente de correlación por rangos de
Spearman se llena la siguiente tabla:
Por lo tanto existe una correlación positiva moderada entre
la primera y segunda evaluación de los 8 estudiantes.