1. República Bolivariana de Venezuela.
Ministerio del Poder Popular para la Educación Superior.
Instituto Universitario Politécnico.
“Santiago Mariño”.
Sede-Barcelona.
Coeficientes de correlación de
Pearson y de Sperman
Profesor: Bachiller:
Ramón Aray María Barreto.
C.I.: 26.766.797
Sección: YV.
Barcelona, Julio 2016.
2. COEFICIENTE DE CORRELACIÓN DE PEARSON
El coeficiente de correlación de Pearson es una medida de la relación lineal entre
dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación
de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación de
dos variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una
población; el coeficiente de correlación de Pearson se simboliza con la letra Pxy,
siendo la expresión que nos permite calcularlo:
Dónde:
O X Y es la covarianza de (Y,X)
O X es la desviación típica de la variable X
O Y es la desviación típica de la variable Y
De manera análoga podemos calcular este coeficiente sobre un estadístico
muestra, denotado como rxy a:
a) Para datos no agrupados se calcula aplicando la siguiente ecuación:
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos días diferentes en una ciudad,
determinar el tipo de correlación que existe entre ellas mediante el coeficiente de
PEARSON.
3. X 18 17 15 16 14 12 9 15 16 14 16 18
SX
=180
Y 13 15 14 13 9 10 8 13 12 13 10 8
SY=
138
Solución:
Se calcula la media aritmética
Se llena la siguiente tabla:
Se aplica la fórmula:
b) Para datos agrupados, el coeficiente de Correlación de Pearson se calcula
aplicando la siguiente fórmula:
4. Donde
n = número de datos.
f = frecuencia de celda.
fx = frecuencia de la variable X.
fy = frecuencia de la variable Y.
dx = valores codificados o cambiados para los intervalos de la variable X,
procurando que al intervalo central le corresponda dx = 0, para que se hagan más
fáciles los cálculos.
dy = valores codificados o cambiados para los intervalos de la variable X,
procurando que al intervalo central le corresponda dy = 0, para que se hagan más
fáciles los cálculos.
USOS DEL COEFICIENTE CORRELACIÓN DE PEARSON
Permite predecir el valor de una variable dado un valor determinado
de la otra variable
Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación
Dicho cálculo es el primer paso para determinar la relación entre las
variables
Consiste en la posibilidad de calcular su distribución muestra y así
poder determinar su error típico de estimación
Reporta un valor de correlación cercano a 0 como un indicador de que
no hay relación lineal entre dos variables
Reporta un valor de correlación cercano a 1 como un indicador de que
existe una relación lineal positiva entre las dos variables. Un valor
mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información
Ventajas
El valor de coeficiente de correlación es independiente de cualquier
unidad usadas para medir variables
5. Mientras más grande sea la muestra más exacta será la estimación
Desventajas
Requiere supuestos acerca de la naturaleza o formas de las
poblaciones afectadas
Requiere que las dos variables hayan sido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sean semejantes
a la de la curva normal
APLICAR USO DE ENFOQUES PEARSON EN LOS PROBLEMAS
ESTADÍSTICOS
En la perspectiva de Pearson, para establecer el nivel de significación
estadística habría que atender al impacto de cada tipo de error en el objetivo
del investigador, y a partir de ahí se decidirá cuál de ellos es preferible
minimizar.
Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este
último tipo de error, introdujeron el concepto de “poder de una prueba
estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está
definido por 1-beta, y en estrecha relación con éste se ha desarrollado el
concepto de “tamaño del efecto” que algunos han propuesto como sustituto
de los valores p en los informes de investigación científica. Las pruebas
paramétricas más conocidas y usadas son la prueba T de Student, la prueba
F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson,
simbolizado por r. Usos de Enfoques de Pearson a Problemas Estadísticos
COEFICIENTE DE CORRELACIÓN DE SPEARMAN
El coeficiente de correlación de Spearman, ρ (rho) es una medida de la
correlación (la asociación o interdependencia) entre dos variables aleatorias
continuas. Para calcular ρ, los datos son ordenados y reemplazados por su
respectivo orden.
El estadístico ρ viene dado por la expresión:
6. Donde D es la diferencia entre los correspondientes estadísticos de orden de
x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente
de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero, significa no correlación pero
no independencia. La tau de Kendall es un coeficiente de correlación por
rangos, inversiones entre dos ordenaciones de una distribución normal
bivariante.
USOS DEL COEFICIENTE CORRELACIÓN DE SPEARMAN
A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo
de la correlación entre dos variables X e Y, medidas al menos en escala
ordinal, es la siguiente:
P=0 No hay correlación
p≠ 0 Hay correlación
Donde d es la distancia existente entre los puestos que ocupan las
puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han
sido ordenadas para X y para Y. Usos del Coeficiente de correlación de
Spearman
VENTAJAS Y DESVENTAJAS DEL COEFICIENTE DE SPEARMAN
Ventajas
No está afectada por los cambios en las unidades de medida.
Al ser una técnica no parámetra, es libre de distribución probabilística.
7. Desventajas
Es recomendable usarlo cuando los datos presentan valores
extremos, ya que dichos valores afectan mucho el coeficiente de
correlación de Pearson, o ante distribuciones no normales.
r no debe ser utilizado para decir algo sobre la relación entre causa y
efecto.
APLICAR USO DE ENFOQUES SPEARMAN EN LOS PROBLEMAS
ESTADÍSTICOS
Para aplicar el coeficiente de correlación de Spearman se requiere
que las variables estén medidas al menos en escala ordinal, es decir;
de forma que las puntuaciones que la representan puedan ser
colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho),
aunque cuando nos situamos en el contexto de la Estadística
Descriptiva se emplea la notación rs. Usos del Coeficiente de
correlación de Spearman