1. REPÚBLICA BOLIVARIANA DE VENEZUELA
INSTITUTO UNIVERSITARIO POLITÉCNICO
“SANTIAGO MARIÑO”
SEDE BARCELONA – PUERTO LA CRUZ
INGENIERÍA MANTENIMIENTO MECANICO
USO DE LOS COEFICIENTE DE CORRELACIÓN
DE PEARSON YSPEARMAN
AUTOR: CARLOS MARCANO
C.I: 17.537.366
TUTOR: ING. RAMÓN ARAY|
BARCELONA, 27 DE JULIO DE 2016
2. En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal
entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación
de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un
índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando
ambas sean cuantitativas.
COEFICIENTE DE CORRELACIÓN DE PERSON
3. PROPIEDADES DE LA CORRELACIÓN DE PERSON Y SPEARMAN
correlación no varía al hacerlo la escala de medición
Es decir, si expresamos la altura en metros o en centímetros el coeficiente de
correlación no varía.
• El signo del coeficiente de correlación es el mismo que el de la covarianza.
• Si la covarianza es positiva, la correlación es directa.
• Si la covarianza es negativa, la correlación es inversa.
• Si la covarianza es nula, no existe correlación.
4. • El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.
−1 ≤ r ≤ 1
• Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa,
y será tanto más fuerte cuanto más se aproxime r a −1.
• Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y
será tanto más fuerte cuanto más se aproxime r a 1.
• Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
• Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables
hay dependencia funcional.
PROPIEDADES DE LA CORRELACIÓN DE PERSON Y SPEARMAN
5. COEFICIENTE DE CORRELACIÓN SPEARMAN
Es una medida de la correlación la asociación o interdependencia entre
dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y
reemplazados por su respectivo orden. El estadístico ρ viene dado por la
expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden de x -
y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos,
aunque si éstos son pocos, se puede ignorar tal circunstancia
6. PROPIEDADES DE LA CORRELACIÓN DE PERSON Y SPERMAN
El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los
valores muy lejos de lo esperado. En este ejemplo: Pearson = 0.30706 Spearman =
0.76270
7. FORMULA DE SPEARMAN
Spearman llamado también rho de Spearman es más fácil de
calcular que el de Kendall. 5
Fórmula
en donde d i = r xi – r yi es la diferencia entre los rangos de X e
Y.
8. VENTAJAS Y DESVENTAJAS DE PEARSON
VENTAJAS DESVENTAJAS
El valor de coeficiente de correlación
es independiente de cualquier unidad
usada para medir variables.
Requiere supuestos acerca de las
naturaleza o forma de las poblaciones
afectadas
Mientras más grande se muestra más
grande será la estimación
Requiere que las dos variables hayan
ido medida hasta un nivel cuantitativo
continuo y que la
Distribución sea semejante a la de la
curva normal
9. CONCLUSIONES
• La interpretación del coeficiente rho de Spearman concuerda en valores próximos a 1;
indican una correlación fuerte y positiva. Valores próximos a –1 indican una correlación
fuerte y negativa. Valores próximos a cero indican que no hay correlación lineal. Puede
que exista otro tipo de correlación, pero no lineal. Los signos positivos o negativos solo
indican la dirección de la relación; un signo negativo indica que una variable aumenta a
medida que la otra disminuye o viceversa, y uno positivo que una variable aumenta
conforme la otra también lo haga disminuye, si la otra también lo hace.
• Una vez obtenido el coeficiente de correlación, pueden utilizarse pruebas estadísticas
y la construcción de intervalos de confianza para probar su significación.
• La significancia estadística de un coeficiente debe tenerse en cuenta conjuntamente
con la relevancia clínica del fenómeno que se estudia, ya que coeficientes de 0.5 a 0.7
tienden a ser significativos en muestras pequeñas.
• La estimación del coeficiente de determinación (r 2) nos muestra el porcentaje de la
variabilidad de los datos que se explica por la asociación entre las dos variables.