1. República Bolivariana De Venezuela
Ministerio Del Poder Popular para la Educación
Instituto Universitario Politécnico “Santiago Mariño”
IV Semestre de Ing. En Mantenimiento Mecánico.
Pearson y Spearman
Prof.: Pedro Beltrán
Bachiller:
Arnaly Perozo
C.I:24.581.230
Julio, 2015
2. Coeficiente de correlación de Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por
su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede
ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y
+1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no
independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una
distribución normal bivariante.
3. Ejemplo
Los datos brutos usados en este ejemplo se ven debajo.
El primer paso es ordenar los datos de la primera columna. Se agregan dos columnas 'orden(i)' y 'orden(t)'
Para el orden i, se corresponderán con el numero de fila del cuadro, para 99, orden(i) =3 ya que ocupa el 3.er lugar,
ordenado de menor a mayor
para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de TV a la semana', para no hacer otro cuadro, la
secuencia ordenada quedaría
para este caso, el orden sería para cada elemento, respectivamente:
4. sin embargo, el valor de orden esta dado por el valor promedio de sus posiciones, así para:
7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5
28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8
50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10
Después, se crean dos columnas más, una columna "d" que muestra las diferencias entre las dos columnas de orden y, otra columna "d2". Esta
última es sólo la columna "d" al cuadrado.
Después de realizar todo esto con los datos del ejemplo, se debería acabar con algo como lo siguiente:
Nótese como el número de orden de los valores que son idénticos es la media de los números de orden que les corresponderían si no lo fueran.
Los valores de la columna d2 pueden ser sumados para averiguar
El valor de n es 10. Así que esos valores pueden ser sustituidos en la fórmula.
5.
6. Coeficiente de correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de la relación
lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson
como un índice que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas.
7. En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el
coeficiente de correlación de Pearson se simboliza con la letra
siendo la expresión que nos permite calcularlo:
8. Interpretación
El valor del índice de correlación varía en el intervalo [-1,1]:
- Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre
las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo
hace en proporción constante.
- Si 0 < r < 1, existe una correlación positiva.
- Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son
independientes: pueden existir todavía relaciones no lineales entre las dos variables.
- Si -1 < r < 0, existe una correlación negativa.
- Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre
las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en
proporción constante.
9. CONCLUSIONES
(Spearman)
1. La utilidad de la prueba de coeficiente de correlación de rangos de Spearman en el campo de la medicina
aporta una respuesta cuantificable a la relación que en momentos determinados pueda existir entre dos
variables, siendo esta un punto de partida para pronósticos y predicciones en problemas prácticos de salud.
2. El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que
existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados.
3. La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores
de -1 y 1.
4.La significancia estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia
clínica del fenómeno que se estudia.
(Pearson)
Los valores de la correlación van de + 1 a - 1, pasando por el cero, el cual corresponde a ausencia de
correlación. Los primeros dan a entender que existe una correlación directamente proporcional e
inversamente proporcional, respectivamente. Ayuda a comprobar y ver la relación que existe entre dos
variables en un problema.
10. CONCLUSIONES
(Spearman)
1. La utilidad de la prueba de coeficiente de correlación de rangos de Spearman en el campo de la medicina
aporta una respuesta cuantificable a la relación que en momentos determinados pueda existir entre dos
variables, siendo esta un punto de partida para pronósticos y predicciones en problemas prácticos de salud.
2. El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que
existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados.
3. La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores
de -1 y 1.
4.La significancia estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia
clínica del fenómeno que se estudia.
(Pearson)
Los valores de la correlación van de + 1 a - 1, pasando por el cero, el cual corresponde a ausencia de
correlación. Los primeros dan a entender que existe una correlación directamente proporcional e
inversamente proporcional, respectivamente. Ayuda a comprobar y ver la relación que existe entre dos
variables en un problema.