1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
I.U.P “Santiago Mariño”.
Sede Barcelona.
Correlación de Pearson y de
Spearman.
Bachiller:
Valentina Hurtado.
C.I: 23.997.291
Profesor:
Pedro Beltrán.
Bna, 03 de Julio del 2015.
2. El coeficiente de correlación de
Pearson.
Normalmente denotado como "r", es un
valor estadístico que mide la relación linear
entre dos variables. Los rangos de valor
van de +1 a -1, lo que indica una perfecta
relación linear positiva y negativa
respectivamente entre ambas variables. El
cálculo del coeficiente de correlación
normalmente se realiza con programas de
estadística, como SPSS y SAS, para dar
los valores posibles más precisos en
estudios científicos. Su interpretación y uso
varía de acuerdo con el contexto y
propósito del respectivo estudio en donde
se calcula.
3. Instrucciones:
Identifica el dependiente variable que se probará entre dos observaciones
derivadas independientemente. Uno de los requisitos del coeficiente de
correlación de Pearson es que las dos variables que se comparan deben
observarse o medirse de manera independiente para eliminar cualquier
resultado sesgado.
Calcula el coeficiente de correlación de Pearson. Para cantidades grandes
de información, el calculo puede ser tedioso. Además de los varios
programas de estadística, muchas calculadoras científicas pueden calcular
el valor.
Reporta un valor de correlación cercano a 0 como un indicador de que no
hay relación linear entre las dos variables. Conforme el coeficiente de
correlación se acerque al 0, los valores se vuelven menos correlacionados,
lo que identifica las variables que no pueden ser relacionadas entre sí.
Reporta un valor de correlación cercano al 1 como indicador de que existe
una relación linear positiva entre las dos variables. Un valor mayor a cero
que se acerque a 1 da como resultado una mayor correlación positiva entre
la información. Conforme una variable aumenta cierta cantidad, la otra
aumenta en cantidad correspondiente. La interpretación debe determinarse
de acuerdo con el contexto del estudio.
4. Instrucciones:
Reporta un valor de correlación cercano a -1 como indicador de que hay una
relación linear negativa entre las dos variables. Conforme el coeficiente se
acerca a -1, las variables se vuelven negativamente más correlacionadas, lo
que indica que conforme una variable aumenta, la variable disminuye por
una cantidad correspondiente. La interpretación, de nuevo, debe
determinarse de acuerdo con el contexto del estudio.
Interpreta el coeficiente de correlación de acuerdo con el contexto de los
datos particulares. El valor de correlación es esencialmente un valor
arbitrario que debe aplicarse de acuerdo con las variables que se comparan.
Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy
fuerte entre las dos variables. En un estudio donde se comparan dos
variables que normalmente se identifican como relacionadas, estos
resultados dan evidencia de que una variable puede afectar de manera
positiva a la otra, lo que resulta un caso para mayor investigación entre las
dos. Sin embargo, el mismo valor r en un estudio que compara dos variables
donde está probado que tienen una relación linear positiva puede identificar
un error en la información u otros problemas potenciales en
el diseño experimental. Por ello, es importante entender el contexto de la
información cuando se reporta e interpreta el coeficiente de correlación de
Pearson.
5. Instrucciones:
Determina la importancia de los resultados. Esto se logra con el uso del
coeficiente de correlación, grados de libertad y una tabla de valores críticos
del coeficiente de correlación. Los grados de libertad se calculan como el
número de las dos observaciones menos 2. Con este valor, identifica el valor
crítico correspondiente en la tabla de correlación para una prueba de 0.05 y
0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad
respectivamente. Compara el valor crítico al coeficiente de correlación
previamente calculado. Si el coeficiente de correlación es mayor, los
resultados son importantes.
Dada dos variables, la correlación permite hacer estimaciones del valor de
una de ellas conociendo el valor de la otra variable.
Los coeficientes de correlación son medidas que indican la situación relativa
de los mismos sucesos respecto a las dos variables, es decir, son la
expresión numérica que nos indica el grado de relación existente entre las 2
variables y en qué medida se relacionan. Son números que varían entre
los límites +1 y -1. Su magnitud indica el grado de asociación entre las
variables; el valor r = 0 indica que no existe relación entre las variables; los
valores ( 1 son indicadores de una correlación perfecta positiva (al crecer o
decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o
crece Y).
6.
7. Para interpretar el coeficiente de correlación utilizamos la
siguiente escala:
Valor Significado
-1 Correlación negativa grande y
perfecta.
-0,9 a -0,99 Correlación negativa muy alta.
-0,7 a -0,89 Correlación negativa alta.
-0,4 a -0,69 Correlación negativa moderada.
-0,2 a -0,39 Correlación negativa baja.
-0,01 a -0,19 Correlación negativa muy baja.
0 Correlación nula.
0,01 a 0,19 Correlación positiva muy baja.
0,2 a 0,39 Correlación positiva baja.
0,4 a 0,69 Correlación positiva moderada.
0,7 a 0,89 Correlación positiva alta.
0,9 a 0,99 Correlación positiva muy alta.
1 Correlación positiva grande y
perfecta.
8. Para datos no agrupados se calcula aplicando la siguiente
ecuación:
Para datos agrupados, el coeficiente de Correlación de Pearson
se calcula aplicando la siguiente fórmula:
9. Ejemplo:
El calculo de coeficiente de correlación (r) entre peso y talla de 20
niños varones se muestra. La covarianza, que en este ejemplo
es el producto de peso (kg) por talla (cm), para que no tenga
dimensión y sea un coeficiente, se divide por la desviación típica
de X (talla) y por la desviación típica de Y (peso) con lo que
obtenemos el coeficiente de correlación de Pearson que en este
caso es de 0.885 e indica una importante correlación entre las
dos variables. Es evidente que el hecho de que la correlación sea
fuerte no implica causalidad. Si elevamos al cuadrado el
coeficiente de correlación obtendremos el coeficiente de
determinación (r2=0.783) que nos indica que el 78.3% de la
variabilidad en el peso se explica por la talla del niño. Por lo tanto
existen otras variables que modifican y explican la variabilidad del
peso de estos niños. La introducción de más variable con
técnicas de análisis multivariado nos permitirá identificar la
importancia de que otras variables pueden tener sobre el peso.
10.
11.
12. •Coeficiente de correlación de Spearman.
Es una medida de la correlación (la asociación o interdependencia) entre
dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados
y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden
de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente
de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero, significa no correlación pero
no independencia. La tau de Kendall es un coeficiente de correlación por
rangos, inversiones entre dos ordenaciones de una distribución normal
bivariante.
13. Ejemplo:
Los datos brutos usados en este ejemplo se ven debajo.
CI Horas de tv a la semana.
106 7
86 0
100 28
100 50
99 28
103 28
97 20
113 12
113 7
110 17
14. El primer paso es ordenar los datos de la primera columna. Se
agregan dos columnas 'orden(i)' y 'orden(t)‘
Para el orden i, se corresponderán con el numero de fila del cuadro,
para 99, orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a
mayor.
Para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de
TV a la semana', para no hacer otro cuadro, la secuencia ordenada
quedaría…
T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }
Para este caso, el orden sería para cada elemento, respectivamente:
orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }
Sin embargo, el valor de orden esta dado por el valor promedio de sus
posiciones, así para:
7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5
28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8
50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10
Después, se crean dos columnas más, una columna "d" que muestra
las diferencias entre las dos columnas de orden y, otra columna "d2".
Esta última es sólo la columna "d" al cuadrado.
15. Después de realizar todo esto con los datos del ejemplo, se debería
acabar con algo como lo siguiente:
Nótese como el número de orden de los valores que son idénticos es
la media de los números de orden que les corresponderían si no lo
fueran.
CI H.
sem.
Orden (i) Orden (t) d d2
106 7 1 1 0 0
86 0 2 6 4 16
100 28 3 8 5 25
100 50 4.5 10 5.5 30.25
99 28 4.5 8 3.5 12.25
103 28 6 8 2 4
97 20 7 2.5 4.5 20.25
113 12 8 5 3 9
113 7 9.5 2.5 7 49
110 17 9.5 4 5.5 30.25
16. Los valores de la columna d2 pueden ser sumados para averiguar
El valor de n es 10. Así que esos valores pueden ser sustituidos en la
fórmula.
De lo que resulta
¿Cuándo utilizar la prueba de correlación de rangos de Spearman?
El coeficiente de correlación no debe utilizarse para comparar dos
métodos que intentan medir el mismo evento, como por ejemplo dos
instrumentos que miden la saturación de oxígeno en sangre. El
coeficiente de correlación mide el grado de asociación entre dos
cantidades, pero no mira el nivel de acuerdo o concordancia. Si los
instrumentos de medida miden sistemáticamente cantidades
diferentes uno del otro, la correlación puede ser 1 y su concordancia
ser nula . El coeficiente de correlación de Spearman es recomendable
utilizarlo cuando los datos presentan valores extremos, ya que dichos
valores afectan mucho el coeficiente de correlación de Pearson, o
ante distribuciones no normales. No está afectada por los cambios en
las unidades de medida.