Edificio residencial Tarsia de AEDAS Homes Granada
Coeficiente de Pearson y Spearman
1. REPÚBLICA BOLIVARIANA DE VENEZUELA
INSTITUTO UNIVERSITARIO POLITÉCNICO
“SANTIAGO MARIÑO”
SEDE BARCELONA
INGENIERÍA DE INDUSTRIAL
Profesor:
Pedro Beltrán
Asignatura: Estadística I
Coeficiente de correlación de
Pearson y Spearman
2. En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre
dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que
puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas.
3. PASOS PARA EL CÁLCULO
Halamos la media aritmética.
Calculamos la covarianza.
Calculamos la desviación típica.
Aplicamos la fórmula del coeficiente de
correlación lineal.
4. Identifica el dependiente variable que se probará entre dos observaciones
derivadas independientemente. Uno de los requisitos es que las dos variables que
se comparan deben observarse o medirse de manera independiente para eliminar
cualquier resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay
relación linear entre las dos variables.
Reporta un valor de correlación cercano al 1 como indicador de que existe una
relación linear positiva entre las dos variables. Un valor mayor a cero que se
acerque a 1 da como resultado una mayor correlación positiva entre la información.
5. Ventajas:
Cuando en el fenómeno estudiado las dos variables son cuantitativas se usa
el coeficiente de correlaciones de Pearson.
Es llamado así en homenaje a Karl Pearson. Las dos variables son designadas
por X e Y.
Desventajas:
El valor 0 representa falta de correlación.
Cuando las variables X e Y son independientes, el numerador se anula y el
coeficiente de correlación poblacional tiene el valor cero.
En cambio una correlación nula no implica la independencia de variables.
6. Para la aplicación de person se necesita Identifica el dependiente variable que se
probará entre dos observaciones derivadas independientemente. Uno de los requisitos
es que las dos variables que se comparan deben observarse o medirse de manera
independiente para eliminar cualquier resultado sesgado. Para cantidades grandes de
información, el calculo puede ser tedioso. Reporta un valor de correlación cercano a 0
como un indicador de que no hay relación linear entre las dos variables. Reporta un valor
de correlación cercano al 1 como indicador de que existe una relación linear positiva
entre las dos variables.
Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación
positiva entre la información. Reporta un valor de correlación cercano a -1 como
indicador de que hay una relación linear negativa entre las dos variables. Interpreta el
coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor
de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con
las variables que se comparan. Determina la importancia de los resultados.
7. El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este
ejemplo: Pearson = 0.30706 Spearman = 0.76270
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia)
entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal
circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de
Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
8. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables
estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que
las representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando
nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs
La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy;
bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones
ordinales, compuestas cada una de ellas por los n primeros números naturales
9. El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los
valores -1 y 1. Es decir, -1 < rs < 1.
Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la
variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le
corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc.,
entonces el valor de rs es -1.
10. Ventajas:
Al ser Spearman una técnica no paramétrica es libre de distribución
probabilística (2, 5, 9). - Los supuestos son menos estrictos. Es robusto a la
presencia de outliers (es decir permite ciertos desvíos del patrón normal).
La manifestación de una relación causa-efecto es posible sólo a través de
la comprensión de la relación natural que existe entre las variable y no debe
manifestarse sólo por la existencia de una fuerte correlación (1, 5).
Desventajas:
Indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación pero no independencia.
La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre
dos ordenaciones de una distribución normal bivariante. Aplicar usos de enfoques
Pearson y enfoque Sperman a problemas estadísticos.
11. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables
estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las
representan puedan ser colocadas en dos series ordenadas. A veces, este coeficiente es
denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la
Estadística Descriptiva se emplea la notación rs La fórmula de cálculo para rs puede
derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de
Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n
primeros números naturales. El coeficiente de correlación de Spearman se encuentra
siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los sujetos
se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si
ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en
Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.w