1. INSTITUTO UNIVERSITARIO SANTIAGO MARIÑO
INGENIERÍA DE SISTEMAS
SECCIÓN: SV
COEFICIENTES DE CORRELACION DE PEARSON
Y SPEaRMAN
INSTITUTO UNIVERSITARIO POLITECNICO
“SANTIAGO MARIÑO”
EXTENSION BARCELONA
Barcelona, Julio de 2015
Patricia Castillo: 15.291.705Prof. Pedro Beltrán
2. El Coeficiente de Correlación de Pearson es una medida de la relación lineal entre dos variables
aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un
índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando
ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el
coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión que nos
permite calcularlo:
Coeficiente de Correlación de Pearson
3. Donde;
es la covarianza de (X,Y)
es la desviación típica de la variable X
es la desviación típica de la variable Y
De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado
como a:
Coeficiente de Correlación de Pearson
4. Ventajas y Desventajas del Coeficiente
de Pearson
Ventajas
El valor del coeficiente de correlación es
independiente de cualquier unidad usada
para medir variables.
Mientras mas grande sea la muestra mas
exacta será la estimación.
Desventajas
Requiere supuestos acerca de la naturaleza
o formas de las poblaciones afectadas.
Requiere que las dos variables hayan ido
medidas hasta un nivel cuantitativo continuo
y que la distribución de ambas sea semejante
a la de la curva normal.
5. Permite predecir el valor de una variable dado un valor determinado de la otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método
conocido como correlación.
Dicho cálculo es el primer paso para determinar la relación entre las variables.
Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error
típico de estimación.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación lineal
entre 2 variables.
Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación
lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como
resultado una mayor correlación positiva entre la información.
Usos del Coeficiente de Correlación de
Pearson
6. La r de Pearson es una medida que indica hasta que punto los mismos individuos o sucesos
ocupan la misma posición relativa a 2 variables.
La r de Pearson refleja únicamente la relación lineal entre 2 variables.
Cuando la relación es perfecta positiva, cada individuo obtiene exactamente las mismas
calificaciones en ambas variables.
Un valor alto positivo alto de r de Pearson indica que cada individuo obtiene,
aproximadamente; las mismas calificaciones en ambas variables.
Características de la R de Pearson
9. En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que
atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se
decidiría cuál de ellos es preferible minimizar.
Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error,
introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad
para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha
desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de
los valores p en los informes de investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F,
llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.
Usos de Enfoques de Pearson a
Problemas Estadísticos
10. El Coeficiente de Correlación de Spearman, ρ (rho) es una medida de la correlación (la
asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los
datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
Coeficiente de Correlación de
Spearman
11. Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el
número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos
son pocos, se puede ignorar tal circunstancia.
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a
la distribución t de Student
Coeficiente de Correlación de
Spearman
12. La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de
Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0
cero, significa no correlación pero no independencia.
La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson
para el conjunto de rangos apareados.
La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos
transformado las puntuaciones en rangos.
Coeficiente de Correlación de
Spearman
13. A partir de un conjunto de n puntuaciones, la formula que permite el calculo de la correlación
entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:
P=0 No hay correlación
p≠ 0 Hay correlación
Donde d es la distancia existente entre los puestos que ocupan las puntuaciones
correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para
Y.
Usos del Coeficiente de correlación de
Spearman
14. Ventajas y Desventajas del Coeficiente
de Spearman
Ventajas
No esta afectada por los cambios en las
unidades de medida.
Al ser una técnica no parámetra, es libre de
distribución probabilística.
Desventajas
Es recomendable usarlo cuando los datos
presentan valores extremos, ya que dichos
valores afectan mucho el coeficiente de
correlación de Pearson, o ante
distribuciones no normales.
r no debe ser utilizado para decir algo sobre
la relación entre causa y efecto.
15. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén
medidas al menos en escala ordinal, es decir; de forma que las puntuaciones que la
representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos
situamos en el contexto de la Estadística Descriptiva se emplea la notación rs.
Usos del Coeficiente de correlación de
Spearman
16. El Coeficiente de Correlación de Spearman se encuentra siempre comprendido entre los
valores -1 y 1. Es decir, -1 < rs < 1.
Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y,
el valor de rs es 1. Si ocupan valores opuestos, es decir; al primer sujeto en X le corresponde
el ultimo lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc. Entonces el valor
de rs es -1.
Propiedades Coeficiente de
Correlación de Spearman
18. Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más
condiciones, varios individuos son observados en cada una de ellas, y predecimos que las
observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden
tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de
intento en intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los
que existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se
verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre
los valores de -1 y 1.
La significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con la
relevancia clínica del fenómeno que se estudia.
Usos de Enfoques de Spearman a
Problemas Estadísticos
19. Internet
Correlación en Wikipedia (español): http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación
entre variables cuantitativas.
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas2.pdf Correlation
en Wikipedia (inglés).
http://personal.us.es/vararey/adatos2/correlacion.pdf.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson.
Bibliografía