El documento describe los coeficientes de correlación de Pearson y Spearman. El coeficiente de Pearson mide la relación lineal entre dos variables cuantitativas, mientras que el coeficiente de Spearman se puede aplicar a variables ordinales. Ambos coeficientes varían de -1 a 1, donde valores cercanos a -1 o 1 indican una fuerte relación negativa o positiva respectivamente, y un valor cercano a 0 indica una falta de relación lineal.
1. REPÚBLICA BOLIVARIANA DE
VENEZUELA
INSTITUTO UNIVERSITARIO
POLITÉCNICO
“SANTIAGO MARIÑO”
SEDE BARCELONA
INGENIERÍA DE INDUSTRIAL
Profesor:
Pedro Beltrán
Sección: Yv
Asignatura: Estadística I
Bachiller:
Andrea Beltrán
C.I:25.429.987
2. En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables
aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de
las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse
para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
3. PASOS PARA EL CÁLCULO
Halamos la media aritmética.
Calculamos la covarianza.
Calculamos la desviación típica.
Aplicamos la fórmula del coeficiente de
correlación lineal.
4. Identifica el dependiente variable que se probará entre dos observaciones
derivadas independientemente. Uno de los requisitos es que las dos variables
que se comparan deben observarse o medirse de manera independiente para
eliminar cualquier resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no
hay relación linear entre las dos variables.
Reporta un valor de correlación cercano al 1 como indicador de que existe
una relación linear positiva entre las dos variables. Un valor mayor a cero que
se acerque a 1 da como resultado una mayor correlación positiva entre la
información.
5. Ventajas:
Cuando en el fenómeno estudiado las dos variables son cuantitativas se
usa el coeficiente de correlaciones de Pearson.
Es llamado así en homenaje a Karl Pearson. Las dos variables son
designadas por X e Y.
Desventajas:
El valor 0 representa falta de correlación.
Cuando las variables X e Y son independientes, el numerador se anula y
el coeficiente de correlación poblacional tiene el valor cero.
En cambio una correlación nula no implica la independencia de
variables.
6. Para la aplicación de person se necesita Identifica el dependiente variable que se
probará entre dos observaciones derivadas independientemente. Uno de los requisitos
es que las dos variables que se comparan deben observarse o medirse de manera
independiente para eliminar cualquier resultado sesgado. Para cantidades grandes de
información, el calculo puede ser tedioso. Reporta un valor de correlación cercano a 0
como un indicador de que no hay relación linear entre las dos variables. Reporta un
valor de correlación cercano al 1 como indicador de que existe una relación linear
positiva entre las dos variables.
Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación
positiva entre la información. Reporta un valor de correlación cercano a -1 como
indicador de que hay una relación linear negativa entre las dos variables. Interpreta el
coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor
de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con
las variables que se comparan. Determina la importancia de los resultados.
7. El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este
ejemplo: Pearson = 0.30706 Spearman = 0.76270
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su
respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal
circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de
Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
8. Para aplicar el coeficiente de correlación de Spearman se requiere que las
variables estén medidas al menos en escala ordinal, es decir, de forma que las
puntuaciones que las representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque
cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la
notación rs
La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy;
bastaría aplicar el coeficiente de correlación de Pearson a dos series de
puntuaciones ordinales, compuestas cada una de ellas por los n primeros
números naturales
9. El coeficiente de correlación de Spearman se encuentra siempre comprendido
entre los valores -1 y 1. Es decir, -1 < rs < 1.
Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la
variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto
en X le corresponde el último lugar en Y, al segundo en X le corresponde el
penúltimo en Y, etc., entonces el valor de rs es -1.
10. Ventajas:
Al ser Spearman una técnica no paramétrica es libre de distribución
probabilística (2, 5, 9). - Los supuestos son menos estrictos. Es robusto
a la presencia de outliers (es decir permite ciertos desvíos del patrón
normal).
La manifestación de una relación causa-efecto es posible sólo a
través de la comprensión de la relación natural que existe entre las
variable y no debe manifestarse sólo por la existencia de una fuerte
correlación (1, 5).
Desventajas:
Indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación pero no independencia.
La tau de Kendall es un coeficiente de correlación por rangos, inversiones
entre dos ordenaciones de una distribución normal bivariante. Aplicar usos de
enfoques Pearson y enfoque Sperman a problemas estadísticos.
11. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén
medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las
representan puedan ser colocadas en dos series ordenadas. A veces, este coeficiente es
denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de
la Estadística Descriptiva se emplea la notación rs La fórmula de cálculo para rs puede
derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación
de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la
n primeros números naturales. El coeficiente de correlación de Spearman se encuentra
siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los
sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs
es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último
lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de
rs es -1.w