1. INSTITUTO UNIVERSITARIO SANTIAGO MARIÑO
INGENIERIA INDUSTRIAL
ESTADISTICA I
SECCION: YV
coeficiente de correlacion de pearson y
spearman
Participante:
Michelly Calzadilla
C.I 26.146.835
Profesor:
Ramón A. Aray López
Febrero 2015 Barcelona
2. Coeficiente de correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre
dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que
puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas.
3. En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el
coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión que
nos permite calcularlo:
Coeficiente de correlación de Pearson
Donde:
es la covarianza de
es la desviación típica de la variable
es la desviación típica de la variable
4. Coeficiente de correlación de Pearson
De manera análoga podemos calcular este coeficiente sobre un estadístico muestral denotado como a:
Interpretación
El valor del índice de correlación varía en el intervalo [-1,1]:
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos
variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en
proporción constante.
Si 0 < r < 1, existe una correlación positiva.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos
variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción
constante.
5. Cómo usar el coeficientede correlación de Pearson
El coeficiente de correlación de Person, normalmente denotado como "r", es un valor estadístico que
mide la relación linear entre dos variables. Los rangos de valor van de +1 a -1, lo que indica una
perfecta relación linear positiva y negativa respectivamente entre ambas variables. El cálculo del
coeficiente de correlación normalmente se realiza con programas de estadística, como SPSS y
SAS, para dar los valores posibles más precisos en estudios científicos. Su interpretación y uso varía
de acuerdo con el contexto y propósito del respectivo estudio en donde se calcula.
Instrucciones
Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos del coeficiente de correlación de Pearson es que las dos
variables que se comparan deben observarse o medirse de manera independiente para eliminar
cualquier resultado sesgado.
Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de información, el calculo
puede ser tedioso. Además de los varios programas de estadística, muchas calculadoras científicas
pueden calcular el valor.
6. Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las
dos variables. Conforme el coeficiente de correlación se acerque al 0, los valores se vuelven menos
correlacionados, lo que identifica las variables que no pueden ser relacionadas entre sí.
Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva
entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información. Conforme una variable aumenta cierta cantidad, la otra aumenta
en cantidad correspondiente. La interpretación debe determinarse de acuerdo con el contexto del estudio.
Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa
entre las dos variables. Conforme el coeficiente se acerca a -1, las variables se vuelven negativamente
más correlacionadas, lo que indica que conforme una variable aumenta, la variable disminuye por una
cantidad correspondiente. La interpretación, de nuevo, debe determinarse de acuerdo con el contexto del
estudio.
Cómo usar el coeficientede correlación de Pearson
7. Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de
correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se
comparan. Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy fuerte entre las dos
variables. En un estudio donde se comparan dos variables que normalmente se identifican como
relacionadas, estos resultados dan evidencia de que una variable puede afectar de manera positiva a la
otra, lo que resulta un caso para mayor investigación entre las dos. Sin embargo, el mismo valor r en un
estudio que compara dos variables donde está probado que tienen una relación linear positiva puede
identificar un error en la información u otros problemas potenciales en el diseño experimental. Por ello, es
importante entender el contexto de la información cuando se reporta e interpreta el coeficiente de
correlación de Pearson.
Cómo usar el coeficientede correlación de Pearson
8. Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de
correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación.
Los grados de libertad se calculan como el número de las dos observaciones menos 2. Con
este valor, identifica el valor crítico correspondiente en la tabla de correlación para una
prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad
respectivamente. Compara el valor crítico al coeficiente de correlación previamente
calculado. Si el coeficiente de correlación es mayor, los resultados son importantes.
CÓMO USAR EL COEFICIENTE DE
CORRELACIÓN DE PEARSON
9. VENTAJAS Y DESVENTAJAS
Ventajas requiere datos de cantidad solo del periodo base
Desventajas no refleja cambios en los patrones de compra
conforme pasa el tiempo
10. USOS DE ENFOQUES PEARSON A
PROBLEMAS ESTADÍSTICOS
En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al
impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidirá cual de ellos es
preferible minimizar.
Pearson llamaron alfa al error tipo l y beta al error tipo ll; a partir de este ultimo topo de error, introdujeron
el concepto de «poder de una prueba estadística, el cual se refiere a su capacidad para evitar el error
tipo ll, y esta definido por 1-beta, y en estrecha relación con este se ha desarrollado el concepto de
«tamaño del efecto» que algunos han propuesto como sustituto de los valores p en los informes de
investigación científica.
Las pruebas paramétricas mas conocidas y usadas son la prueba T de Student, la prueba F llamada así
en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.
11. Coeficiente de correlación de Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de
la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para
calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de
parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son
pocos, se puede ignorar tal circunstancia
12. Coeficiente de correlación de Spearman
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente
de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero, significa no correlación pero
no independencia. La tau de Kendall es un coeficiente de correlación por
rangos, inversiones entre dos ordenaciones de una distribución normal
bivariante.
13. cómo usar el coeficiente de correlacion de spearman
El coeficiente de correlación de Spearman permite identificar si dos variables se relacionan en una
función monótona (es decir, cuando un número aumenta, el otro también o viceversa).
Dibuja tu tabla. Esta organizará la información que necesitas para calcular el coeficiente de
correlación de Spearman. Necesitarás:6 columnas con encabezados como se muestra a
continuación.
Las filas necesarias para poner los pares de datos que tengas.
14. cómo usar el coeficiente de correlacion de spearman
Llena las primeras dos columnas con los pares de datos.
En tu tercer columna clasifica tus datos de la primera columna del 1 hasta n(el número de datos que
tienes). Comienza con el más bajo, el cual debe tener el 1, el siguiente número más bajo el 2 y así
sucesivamente.
15. cómo usar el coeficiente de correlacion de spearman
En tu cuarta columna haz lo mismo que en el paso 3, pero clasifica la segunda columna en lugar de la
primera.
En la columna "d" calcula la diferencia del número de clasificación para cada par de datos. Esto
quiere decir que si un dato es tiene el 1 y el otro el número 3, la diferencia sería de 2 (no importa el
signo porque el siguiente paso es elevarlo al cuadrado).
16. cómo usar el coeficiente de correlación de spearman
Eleva al cuadrado cada número de la columna "d" y escribe estos valores en la columna "d2".
Suma todos los valores que hay en la columna "d2". Este resultado es Σd2.
17. cómo usar el coeficiente de correlación de spearman
Si no hay ninguna relación en los pasos anteriores, introduce este valor en la fórmula simplificada
del coeficiente de correlación de Spearman
Interpreta el resultado. Puede variar entre -1 y 1.Cercano a -1: correlación negativa
Cercano a 0: sin correlación linear
Cercano a 1: correlación positiva
Recuerda dividir entre el total exacto de resultados, luego redúcelo a la mitad. A continuación, divídelo
entre Σd2.
18. VENTAJAS Y DESVENTAJAS
Ventajas no esta afectada por los cambios en las unidades de
medida.
Al ser una técnica no parametra, es libre de distribución
probabilística.
Desventajas es recomendable usarlo cuando los datos presentan
valores extremos, ya que dichos de correlación de Pearson, o ante
distribuciones no normales.
r no debe ser utilizada para decir algo sobre la relación entre causa y
efecto
19. USOS DE ENFOQUES SPEARMAN
A PROBLEMAS ESTADÍSTICOS
Una generalización del coeficiente de Spearman es útil en la situación en la cual hay 3 o mas
condiciones, varios individuos son observados en cada una de ella, y predecimos que las observaciones
tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener 3 oportunidades para
intentar cierta tarea, y predecimos que su habilidad mejorar de intento en intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que
existan varios extremos, pues si calculamos la correlación de Pearson, los resultados se varan afectados.
La interpretación del resultado del coeficiente de correlación de Speraman se encuentra entre los valores
de -1 y 1.
El significado estadística de un coeficiente debe tener en cuenta conjuntamente con la relevancia clinica
del fenómeno que se estudia