Este documento explica los coeficientes de correlación de Pearson y Spearman. El coeficiente de Pearson mide la relación lineal entre dos variables cuantitativas y varía de -1 a 1, donde valores cercanos a -1 o 1 indican una fuerte correlación negativa o positiva respectivamente. El coeficiente de Spearman es similar pero se aplica a variables ordinales mediante el uso de rangos. Ambos coeficientes son útiles para medir la fuerza y dirección de la asociación entre variables.
1. Republica Bolivariana de Venezuela
Instituto Universitario Politécnico
“Santiago Mariño”
Extensión Caracas
Catedra: Estadística
Participante:
José A Virardi
C.I:21.412.166
Coeficientes de correlaciónCoeficientes de correlación
de Pearson y de Spearmande Pearson y de Spearman
Caracas, 09 de Abril del 2016
2. Coeficientes de Correlación de Pearson
Es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que
puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas.
El coeficiente de correlación es una medida de asociación entre dos
variables y. se simboliza con la literal r.
Los valores de la correlación van de + 1 a - 1, pasando por el cero, el
cual corresponde a ausencia de correlación. Los primeros dan a entender
que existe una correlación directamente proporcional e inversamente
proporcional, respectivamente
3. De lo anterior referimos que:
• +1 ó -1 = Correlación perfecta.
• 0.95 = Correlación fuerte.
• 80% = Correlación significativa.
• 70% = Correlación moderada.
• 50% = Existe una relación parcial.
Permite predecir el valor de una variable dado un valor determinado de la otra variable. Se trata de valorar la
asociación entre dos variables cuantitativas estudiando el método conocido como correlación. Dicho cálculo
es el primer paso para determinar la relación entre las variables.
Si r = 0 Se dice que las variables están correlacionadas: no puede establecerse ningún sentido de variación.
4. Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de
los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente
para eliminar cualquier resultado sesgado.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos
variables.
El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables
Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las
dos variables.
Ø
Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la
información.
Ø
Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las
dos variables.
Mientras mas grande sea la muestra mas exacta será la estimación.
Ventajas de Coeficientes de Correlación de Pearson
5. Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas
Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución
de ambas sea semejante a la de la curva normal
El coeficiente de correlación debe ser seleccionado en base a las escalas de medidas usadas en cada una de
las variables.
Ø
La determinación del tamaño de muestra en las de tablas de contingencias varia según sea el objetivo:
a) Determinar probabilidades de incidencias.
b) Decimar independencias entres dos variables.
c) Analizar la asociación entre las variables.
El tamaño de muestra para construir intervalo de confianza para el coeficiente de correlación poblacional de
Pearson es función de la longitud del intervalo, de la probabilidad de confianza y del coeficiente de
correlación muestral. Por esta razón se sugiere un procedimiento secuencial para este propósito.
Desventajas de Coeficientes de Correlación de Pearson
6. Es una medida de la correlación entre dos variables aleatorias continuas. Este coeficiente es una medida de
asociación lineal que utiliza los rangos, números de orden, de cada grupo de sujetos y compara dichos
rangos
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson.
Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlación pero no independencia
Se diferencia de la correlación de Pearson en que utiliza valores medidos a nivel de una escala ordinal. Si
alguna de las variables está medida a nivel de escala de intervalo/razón deberá procederse antes de operar el
estadístico a su conversión en forma ordinal.
El coeficiente de correlación de Spearman es
menos sensible que el de Pearson para los
valores muy lejos de lo esperado. En este
ejemplo: Pearson = 0.30706 Spearman = 0.76270
Coeficiente de correlación de Spearman
7. El coeficiente rs es un caso particular de rxy, puesto que se calcula a partir de éste, por aplicación del
coeficiente de Pearson a valores ordinales considerados como puntuaciones.
Ø
El coeficiente de correlación de Spearman es exactamente el mismo que el coeficiente de correlación de
Pearson, calculado sobre el rango de observaciones.
La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson para el
conjunto de rangos apareados. La correlación de Spearman puede ser calculada con la fórmula de Pearson, si
antes hemos transformado las puntuaciones en rangos.
El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es
decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable
Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último
lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.
Ventajas de Coeficientes de correlación de Spearman
8. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos
en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos
series ordenadas.
Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9). Los supuestos
son menos estrictos.
Ø
Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal).
Ø
La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación
natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación
(1, 5)
Ø
Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos
en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos
series ordenadas.
Desventajas de Coeficientes de correlación de Spearman
9. Aplicar usos de enfoques Pearson y enfoque Spearman
a problemas estadísticos
Usos de enfoques Pearson:
Métodos Estadísticos para Investigadores”. Desde entonces, el contraste de
Hipótesis es considerado uno de los métodos de inferencia estadística de
utilización obligada en casi todas las disciplinas.
Si bien hoy en día los estudiantes de Estadística aprenden a testear hipótesis aplicando una secuencia de
pasos más o menos estandarizada, es importante recordar que no estamos ante una teoría unificada, sino
ante la amalgama de los estudios sistemáticos realizados separadamente por Fisher por un lado y
Neyman y Pearson por el otro. Fisher desarrolló su teoría que denominó Pruebas de Significación y
Neyman y Pearson las llamadas Pruebas de Hipótesis. Desde 1930, fecha en que aparecieron los trabajos de
NP., la teoría de los tests de hipótesis fue dominada por el paradigma de la decisión. Esto ha llevado al
estado actual de cosas en el cual predomina la teoría de Neyman-Pearson como modelo ó esquema de
razonamiento para la toma decisiones, pero la práctica estadística en la investigación, aplicando los mismos
procedimientos, interpreta los datos como evidencia para validar teorías.
10. Aplicación de la prueba estadística
Las observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias entre los
rangos, efectuar la sumatoria y elevar ésta al cuadrado. Educación de algunas madres y calificación de
desarrollo mental de los hijos.
Calculo de los grados de libertad (gl). gl = numero de parejas - 1 = 8 - 1 = 7
El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos de
Spearman. El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de
significancia es 0.714, o sea, mayor que el calculado.
Por lo tanto, éste tiene una probabilidad mayor que 0.05. Decisión Como el valor de probabilidad de rs de
0.69 es mayor que 0.05, se acepta Ho y se rechaza Ha.
Interpretación El coeficiente de correlación de Spearman de 0.69 es menor que los valores críticos de la
tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud, al nivel de confianza de 0.05 y 0.01,
para 0.714 y 0.893. Esto significa que para aceptar Ha, se requiere tener un valor igual o más lato que 0.714.
Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en la siguiente figura, existe una
asociación relativa entre la educación formal de la madre y el desarrollo mental de sus hijos; sin embargo,
ésta no es significativa.