El documento explica la diferencia entre el coeficiente de correlación de Pearson y Spearman. El coeficiente de Pearson mide la relación lineal entre dos variables cuantitativas, mientras que el coeficiente de Spearman se utiliza para variables medidas al menos a nivel ordinal. Ambos coeficientes toman valores entre -1 y 1 para indicar la fuerza y dirección de la correlación.
1. Profesor: Bachiller:
Aray Ramón Gomez Eliannys
Barcelona, julio de 2016
Instituto Universitario Politécnico Santiago Mariño
Sede Barcelona
Ingeniería Industrial
2. Como determinar el uso de los coeficientes de
correlación de Pearson y de Sperman
Coeficiente de correlación de Pearson
Es un índice estadístico que mide la relación lineal entre dos variables
cuantitativas. A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables, es decir, son la
expresión numérica que nos indica el grado de relación existente entre
las 2 variables y en qué medida se relacionan.
El coeficiente de correlación entre dos variables aleatorias X e Y es el
cociente, se denota de la siguiente manera:
3. Usos de la Correlación de Pearson
Identifica el dependiente variable que se probará entre dos observaciones
derivadas independientemente. Uno de los requisitos es que las dos
variables que se comparan deben observarse o medirse de manera
independiente para eliminar cualquier resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no
hay relación linear entre las dos variables. Reporta un valor de
correlación cercano al 1 como indicador de que existe una relación linear
positiva entre las dos variables. Un valor mayor a cero que se acerque a 1
da como resultado una mayor correlación positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de que hay
una relación linear negativa entre las dos variables.
Interpreta el coeficiente de correlación de acuerdo con el contexto de los
datos particulares. El valor de correlación es esencialmente un valor
arbitrario que debe aplicarse de acuerdo con las variables que se
comparan.
Determina la importancia de los resultados. Esto se logra con el uso del
coeficiente de correlación, grados de libertad y una tabla de valores
críticos del coeficiente de correlación. Los grados de libertad se calculan
como el número de las dos observaciones menos 2.
4. Ventajas y Desventajas de Pearson
Ventajas
Requiere datos en cantidad solo del período base.
A diferencia de la covarianza la correlación de Pearson es
independiente de la escala de medidas de las variables.
Dada dos variables, permite hacer estimaciones del valor de una de
ellas conociendo el valor de la otra variable.
El coeficiente de Pearson es paramétrico.
Permite medir la correlación o asociación entre dos variables cuando
se trabaja con variables numéricas con distribución normal.
Es calculado en función de las varianzas y la covarianza entre
ambas variables
Desventajas
No refleja cambios en los patrones de compra, conforme pasa el
tiempo.
Conforme el coeficiente de correlación se acerque al 0, los valores se
vuelven menos correlacionados, lo que identifica las variables que no
pueden ser relacionadas entre sí.
5. Coeficiente de correlación de Sperman
A partir de un conjunto de n puntuaciones, la formula que permite el calculo de
la correlación entre dos variables x,y, medidas al menos en escala ordinal
P=0 no hay correlación
P≠ 0 no hay correlación
Donde d es la distancia existente entre los puestos que ocupan las puntuaciones
correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas
para X y para Y.
Para aplicar el coeficiente de correlación de Spearman se requiere que las
variables estén medidas al menos en escala ordinal, es decir; de forma que las
puntuaciones que la representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque
cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la
notación rs.
6. Usos de la Correlación de Spearman
Para aplicar la correlación de Spearman se requiere que al menos las
variables estén medidas en al menos escala ordinal, es decir, de forma que
las puntuaciones que la representan puedan ser colocadas en dos series
ordenadas.
Una generalización del coeficiente de Spearman es útil en la situación en la
cual hay tres o más condiciones, varios individuos son observados en cada
una de ellas, y predecimos que las observaciones tendrán un orden en
particular. Por ejemplo, un conjunto de individuos pueden tener tres
oportunidades para intentar cierta tarea, y predecimos que su habilidad
mejorará de intento en intento.
El coeficiente de correlación de Spearman es recomendable utilizarlo
cuando los datos presentan valores extremos, ya que dichos valores
afectan mucho el coeficiente de correlación de Pearson, o ante
distribuciones no normales. No está afectada por los cambios en las
unidades de medida.
7. Este coeficiente es una medida de asociación lineal que utiliza los rangos,
números de orden, de cada grupo de sujetos y compara dichos rangos.
Existen dos métodos para calcular el coeficiente de correlación de los
rangos: uno, señalado por Spearman y otro, por Kendall. El r de Spearman
llamado también rho de Spearman es más fácil de calcular que el de
Kendall.
8. Ventajas de Desventajas de Spearman
Ventajas
El coeficiente de Spearman es no paramétrico, (es decir, es libre de
distribución probabilística).
Permite medir la correlación o asociación entre dos variables cuando
las mediciones se realizan en una escala ordinal, o cuando no
existe distribución normal.
Se calcula en base a una serie de rangos asignados.
Los supuestos son menos estrictos. Es robusto a la presencia de
outsiders (es decir permite ciertos desvíos del patrón normal). La
manifestación de una relación causa-efecto es posible sólo a través de
la comprensión de la relación natural que existe entre las variable y no
debe manifestarse sólo por la existencia de una fuerte correlación.
9. Desventajas:
Es menos sensible que el coeficiente de Pearson para los valores
muy lejos de lo esperado.
El coeficiente de correlación no debe utilizarse para comparar dos
métodos que intentan medir el mismo evento.
10. Usos de enfoques de Pearson y Spearman a Problemas
Estadísticos
Tanto el coeficiente de correlación de Pearson como el de Spearman, siguen
las mismas normas de interpretación:
1. Solamente toma en cuenta valores entre 1 y -1.
2. El 0 indica que no existe correlación.
3. El valor numérico indica la magnitud de la correlación.
4. El coeficiente de correlación cuantifica la correlación entre dos variables,
cuando esta realmente existe.
5. El hecho de que exista una correlación entre ellas no implica que exista
causalidad o dependencia entre ellas.
6. El signo indica la dirección de la correlación.
7. Los valores cercanos a 1 nos indican una correlación muy buena y los
cercanos a cero una correlación mínima o nula.
11. Enfoques de Pearson y Spearman en Problemas
Estadísticos
1. Cuando el signo es positivo refleja una correlación directa.
2. Mientras mas altos sean los valores de la variable independiente más
altos serán los de la variable dependiente.
3. Cuando el signo es negativo refleja una correlación inversa.
4. Mientras más altos sean los valores de la variable independiente más
bajos serán los de la variable dependiente.
12. Referencias Bibliográficas
WWww.wikipedia.com Tema N° 1: Coeficiente de
correlación de Spearman. Tema N° 2: Coeficiente de
Correlación de Pearson.
Www.es.scribd.com Tema: Coeficiente de correlación
de Pearson y Spearman - Dr. Enrique Sierra.
Www.ehowenespañol.comTema: Cómo usar el
coeficiente de correlación de Pearson.
http://www.fisterra.com/mbe/investiga/var_cuantitativa
s/var_cuantitativas2.pdf Correlation en Wikipedia
(inglés).
http://www.monografias.com/trabajos93/muestreo-
correlaciones-contingencias-y-pearson/muestreo-
correlaciones-contingencias-y-pearson2.shtml
Notas del editor
Profesor: Bachiller:
Ramon Aray Gomez Eliannys CI: 24948058