cortes de luz abril 2024 en la provincia de tungurahua
Coeficientes Pearson y Sperman
1. COEFICIENTES PEARSON Y SPERMAN
Instituto Universitario Politécnico
“Santiago Mariño”
Extensión Caracas
Asignatura: Estadística
Génesis Cordobés
C.I.: 23.920.491
42 - Ing. Civil
2. COEFICIENTE DE CORRELASIÓN PEARSON
El coeficiente de correlación de Person, normalmente
denotado como "r", es un valor estadístico que mide
la relación linear entre dos variables. Los rangos de
valor van de +1 a -1, lo que indica una perfecta
relación linear positiva y negativa respectivamente
entre ambas variables. El cálculo del coeficiente de
correlación normalmente se realiza con programas
de estadística, como SPSS y SAS, para dar los
valores posibles más precisos en estudios científicos.
Su interpretación y uso varía de acuerdo con el
contexto y propósito del respectivo estudio en donde
se calcula.
3. COMO SE DETERMINA EL COEFICIENTE
PEARSON
En el caso de que se esté estudiando dos variables aleatorias X y Y
sobre una población; el coeficiente de correlación de Pearson se
simboliza con la letra , siendo la expresión que nos permite calcularlo:
Donde:
De manera análoga podemos calcular este coeficiente sobre un
estadístico muestral, denotado como r x y a:
4. VENTAJAS DEL COEFICIENTE DE PEARSON
El valor del
coeficiente de
correlación es
independiente de
cualquier unidad usada
para medir variables.
Mientras mas grande
sea la muestra, mas
exacta será la
estimación.
5. Requiere supuestos
acerca de la naturaleza
o formas de las
poblaciones afectadas.
Requiere que las dos
variables hayan ido
medidas hasta un nivel
cuantitativo continuo y
que la distribución de
ambas sea semejante a
la de la curva normal.
DESVENTAJAS DEL COEFICIENTE DE
PEARSON
6. USOS – COEFICIENTE PEARSON
Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos es que las dos variables que se comparan
deben observarse o medirse de manera independiente para eliminar cualquier
resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay
relación linear entre las dos variables. Reporta un valor de correlación cercano al 1
como indicador de que existe una relación linear positiva entre las dos variables. Un
valor mayor a cero que se acerque a 1 da como resultado una mayor correlación
positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de
que hay una relación linear negativa entre las dos variables.
Interpreta el coeficiente de correlación de acuerdo con el
contexto de los datos particulares. El valor de correlación es
esencialmente un valor arbitrario que debe aplicarse de acuerdo
con las variables que se comparan.
Determina la importancia de los resultados. Esto se logra con el
uso del coeficiente de correlación, grados de libertad y una tabla
de valores críticos del coeficiente de correlación. Los grados de
libertad se calculan como el número de las dos observaciones
menos 2.
7. COEFICIENTE DE CORRELACIÓN SPERMAN
En estadística, el coeficiente de correlación de
Spearman, ρ (rho) es una medida de la correlación
(la asociación o interdependencia) entre dos
variables aleatorias continuas. Para calcular ρ, los
datos son ordenados y reemplazados por su
respectivo orden.
El estadístico ρ viene dado por la expresión:
8. Donde D es la diferencia entre los
correspondientes estadísticos de orden de x - y. N
es el número de parejas.
Se tiene que considerar la existencia de datos
idénticos a la hora de ordenarlos, aunque si éstos
son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones,
podemos utilizar la siguiente aproximación a la
distribución t de Student
9. LA INTERPRETACIÓN DE COEFICIENTE DE
SPERMAN
Es igual que la del coeficiente de correlación
de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o
positivas respectivamente, 0 cero, significa
no correlación pero no independencia. La tau
de Kendall es un coeficiente de correlación
por rangos, inversiones entre dos
ordenaciones de una distribución normal
bivariante.
10. No esta afectada
por los cambios en
las unidades de
medida.
Al ser una técnica
no parámetro, es
libre de distribución
probabilística.
VENTAJAS DEL COEFICIENTE DE
SPERMAN
11. Es recomendable usarlo
cuando los datos
presentan valores
extremos, ya que dichos
valores afectan mucho el
coeficiente de correlación
de Pearson, o ante
distribuciones no
normales.
R no debe ser utilizado
para decir algo sobre la
relación entre causa y
efecto.
DESVENTAJAS DEL COEFICIENTE DE
SPERMAN
12. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén
medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las
representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos
situamos en el contexto de la Estadística Descriptiva se emplea la notación rs.
La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría
aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales,
compuestas cada una de ellas por la n primeros números naturales.
A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la
correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:
Donde d es la distancia existente entre los puestos que ocupan las puntuaciones
correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y
para Y.
El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los
valores -1 y 1. Es decir, -1 < rs < 1.
Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la
variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X
le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y,
etc., entonces el valor de rs es -1.
USOS – COEFICIENTE SPERMAN