Correlaciones de Spearman Pearson
Como determinar el uso de dichas correlaciones.
entajas y desventajas de cada uno de ellos.
Aplicar usos de enfoques Pearson y enfoque Sperman a problemas estadísticos.
1. Republica Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación Superior
Instituto Universitario Politécnico “Santiago Mariño”
Extensión – Caracas
Correlaciones de Spearman y Pearson
Integrante:
Br. Oliver Ramirez
C.I: 21.287.166
Ing. Electrónica #44A
2. Coeficiente de Correlación de Spearman
• En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la
correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para
calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
• Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el
número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si
éstos son pocos, se puede ignorar tal circunstancia.
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la
distribución t de Student:
3. Coeficiente de Relación de Spearman:
En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias
cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las
variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse
para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de
Pearson se simboliza con la letra , siendo la expresión que nos permite calcularlo:
Donde:
4. Como determinar el uso de los coeficientes de
correlación de Pearson y de Spearman
Coeficiente de correlación de Karl Pearson:
Dada dos variables, la correlación permite hacer estimaciones del valor de una
de ellas conociendo el valor de la otra variable.
Los coeficientes de correlación son medidas que indican la situación relativa
de los mismos sucesos respecto a las dos variables, es decir, son la expresión
numérica que nos indica el grado de relación existente entre las 2 variables y
en qué medida se relacionan. Son números que varían entre los límites +1 y -1.
Su magnitud indica el grado de asociación entre las variables; el valor r = 0
indica que no existe relación entre las variables; los valores (1 son indicadores
de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y)
o negativa (Al crecer o decrecer X, decrece o crece Y).
5. Como se utiliza la Correlación de
Spearman
• Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente.
Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera
independiente para eliminar cualquier resultado sesgado.
• Para cantidades grandes de información, el calculo puede ser tedioso.
• Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de
correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se
comparan.
• Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos
variables. Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva
entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación
positiva entre la información.
• Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las
dos variables.
• Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de
libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el
número de las dos observaciones menos 2.
6. Para que se Utiliza el Coeficiente de
Spearman
• Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al
menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en
dos series ordenadas.
• A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el
contexto de la Estadística Descriptiva se emplea la notación rs
• La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente
de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n
primeros números naturales
• A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos
variables X e Y, medidas al menos en escala ordinal, es la siguiente:
• Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un
sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.
• El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es
decir, -1 < rs < 1.
• Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es
1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en
X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.
7. Ejemplo de Como se utilizan Las
correlaciones Spearman-Pearson
• Por ejemplo, usted analiza la satisfacción de los clientes de un concesionario de vehículos que ofrece tres niveles de servicio para
los automóviles nuevos: sin servicio, servicio estándar y servicio premium. Toma una muestra aleatoria de clientes y les pregunta si
se sienten insatisfechos, indiferentes o satisfechos con el servicio al cliente. Los datos incluyen dos variables ordinales: paquete de
servicio y satisfacción del cliente. Usted desea determinar si existe una asociación entre el nivel de servicio que reciben los clientes
y su satisfacción general. Ingresa los datos en la siguiente tabla de dos factores:
La rho de Spearman y la r de Pearson para esta tabla son ambas 0.424. Usted concluye que existe una asociación positiva entre el
nivel de servicio y la satisfacción del cliente: los clientes que eligen un plan de servicio más alto tienden a expresar más satisfacción
con esta empresa.
Sin servicio Servicio estándar Servicio premium
Insatisfecho 162 104 36
Indiferente 99 91 93
Satisfecho 39 105 171
8. Diferencias de las Correlaciones
Pearson – Spearman
Coeficiente de Pearson:
• Es Paramétrico.
• Permite medir la Correlación o asociación entre dos variables cuando se trabaja
con variables numéricas con distribución normal.
• Es calculado en función de las varianzas y covarianzas entre ambas variables.
Coeficiente de Spearman:
• No es Paramétrico.
• Es un coeficiente que permite medir la correlación o asociación entre dos
variables cuando las mediciones se realizan en una escala ordinal, o cuando no
existe una distribución normal.
• Se calcula en base a una serie de rangos asignados.
9. Interpretación de las Correlaciones
Spearman-Pearson
Tanto el coeficiente de Pearson como el de Spearman, siguen la mismas normas de interpretación:
• Solamente toma en cuenta valores entre 1 y -1.
• El o índica que no existe correlación.
• El valor numérico indica la magnitud de la correlación.
• El coeficiente de correlación cuantifica la correlación entre dos variables, cuando esta realmente existe.
• El hecho de que exista correlación entre las variables implica que exista casualidad o dependencia entre ellas.
• El signo indica la dirección de la correlación.
• Los valores cercanos a 1 nos indican una correlación muy buena y los cercanos a cero una correlación mínima
o nula.
10. Ventajas y Desventajas de las
Correlaciones Generalizadas
Ventajas:
• El valor del coeficiente de
correlación es independiente
de cualquier unidad usada
para medir variables.
• Mientras más grande sea la
muestra mas exacta será la
estimación. Desventajas:
• Requiere forma de las
poblaciones afectadas.
• Requiere que las dos
variables hayan ido medidas
hasta un nivel cuantitativo
continuo y que la distribución
de ambas sea semejantes a la
de la curva normal.
11. Coeficiente de Pearson: Ventajas y
Desventajas.
Ventajas:
• Cuando en el fenómeno estudiado las dos variables son cuantitativas se usa el
coeficiente de correlaciones de Pearson.
• Es llamado así en homenaje a Karl Pearson. Las dos variables son designadas
por X e Y.
Desventajas:
• El valor 0 representa falta de correlación.
• Cuando las variables X e Y son independientes, el numerador se anula y el
coeficiente de correlación poblacional tiene el valor cero.
• En cambio una correlación nula no implica la independencia de variables.
12. Coeficiente de Spearman: Ventajas y
Desventajas.
Ventajas:
• Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2,
5, 9).
• Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir
permite ciertos desvíos del patrón normal).
• La manifestación de una relación causa-efecto es posible sólo a través de la
comprensión de la relación natural que existe entre las variable y no debe
manifestarse sólo por la existencia de una fuerte correlación (1, 5).
Desventajas:
• Indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación pero no independencia.
• La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre
dos ordenaciones de una distribución normal bi-variante.
13. Uso de los Enfoques de Spearman a
Problemas Estadísticos
Una generalización del coeficiente de Spearman es útil en la situación en la cual
hay tres o más condiciones, varios individuos son observados en cada una de
ellas, y predecimos que las observaciones tendrán un orden en particular. Por
ejemplo, un conjunto de individuos pueden tener tres oportunidades para
intentar cierta tarea, y predecimos que su habilidad mejorará de intento en
intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para series de
datos en los que existan valores extremos, pues si calculamos la correlación de
Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se
encuentra entre los valores de -1 y 1.
La significación estadística de un coeficiente debe tenerse en cuenta
conjuntamente con la relevancia clínica del fenómeno que se estudia.
14. Uso de los Enfoques de Pearson a
Problemas Estadísticos
En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto
de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible
minimizar.
Pearson llamó alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el
concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y
está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto”
que algunos han propuesto como sustituto de los valores p en los informes de investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en
honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.