Contenido:
1.- Como determinar el uso de los coeficientes de correlación de Pearson y de Sperman
2.- Ventajas y desventajas de cada uno de ellos.
3.- Aplicar usos de enfoques Pearson y enfoque Sperman a problemas estadísticos.
2. Coeficiente de Correlación de Pearson
El Coeficiente de Correlación de Pearson es una medida de la relación lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson
es independiente de la escala de medida de las variables. De manera menos formal,
podemos definir el coeficiente de correlación de Pearson como un índice que puede
utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas.
Ejemplos de diagramas de dispersión
con diferentes valores del coeficiente
de correlación (ρ)
3. Coeficiente de Correlación de Pearson
El coeficiente de correlación de Pearson es un índice de fácil ejecución e, igualmente, de fácil
interpretación. Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y 1.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el
coeficiente de correlación de Pearson se simboliza con la letra 𝜌 ₓ ̦ᵧ siendo la expresión que nos
permite calcularlo:
Donde:
𝜎𝑥𝑦 es la varianza de (X, Y).
𝜎𝑥 es la desviación típica de la variable X.
𝜎𝑦 es la desviación típica de la variable Y.
𝜌 ₓ ᵧ =
𝜎𝑥𝑦
𝜎𝑥𝑦
=
𝐸 𝑋 − 𝜇𝑥 − (𝑋 − 𝜇𝑦)]
𝜎𝑥 𝜎𝑦
4. Uso del Coeficiente de Correlación de Pearson
Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos es que las dos variables que se comparan deben
observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear
entre las dos variables. Reporta un valor de correlación cercano al 1 como indicador de que
existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque
a 1 da como resultado una mayor correlación positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear
negativa entre las dos variables.
Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El
valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las
variables que se comparan.
Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de
correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación.
Los grados de libertad se calculan como el número de las dos observaciones menos 2.
5. Ventajas del Coeficiente de Correlación de Pearson
► Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear
negativa entre las dos variables.
► Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El
valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las
variables que se comparan.
► Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de
correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los
grados de libertad se calculan como el número de las dos observaciones menos 2.
► Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos es que las dos variables que se comparan deben
observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.
► Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre
las dos variables.
► Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear
positiva entre las dos variables.
► Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre
la información.
6. Desventajas del Coeficiente de Correlación de Pearson
El coeficiente de correlación debe ser seleccionado en base a las escalas de medidas usadas en
cada una de las variables.
La determinación del tamaño de muestra en las de tablas de contingencias varia según sea el
objetivo:
a) Determinar probabilidades de incidencias.
b) Docimar independencias entres dos variables.
c) Analizar la asociación entre las variables.
El tamaño de muestra para construir intervalo de confianza para el coeficiente de correlación
poblacional de Pearson es función de la longitud del intervalo, de la probabilidad de confianza y
del coeficiente de correlación muestral. Por esta razón se sugiere un procedimiento secuencial
para este propósito.
El tamaño de muestra para docimar la significación del coeficiente de correlación poblacional
de Pearson es función de las probabilidades de cometer errores del tipo I y del tipo II y del valor
del coeficiente de correlación muestral.
Para cantidades grandes de información, el calculo puede ser tedioso.
7. Aplicación de la prueba estadística
Las observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias
entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado.
Educación de algunas madres y calificación de desarrollo mental de los hijos.
Calculo de los grados de libertad (gl). gl = numero de parejas - 1 = 8 - 1 = 7
El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por
rangos de Spearman.
El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de
significancia es 0.714, o sea, mayor que el calculado. Por lo tanto, éste tiene una probabilidad
mayor que 0.05. Decisión Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta
Ho y se rechaza Ha. Interpretación El coeficiente de correlación de Spearman de 0.69 es menor que
los valores críticos de la tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud,
al nivel de confianza de 0.05 y 0.01, para 0.714 y 0.893. Esto significa que para aceptar Ha, se
requiere tener un valor igual o más lato que 0.714.
Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en la siguiente figura,
existe una asociación relativa entre la educación formal de la madre y el desarrollo mental de sus
hijos; sin embargo, ésta no es significativa.
Enfoque de Pearson
8. Es una medida de la correlación entre dos variables aleatorias continuas. Este coeficiente es
una medida de asociación lineal que utiliza los rangos, números de orden, de cada grupo de
sujetos y compara dichos rangos.
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación
de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no independencia.
Se diferencia de la correlación de Pearson en que utiliza valores medidos a nivel de una
escala ordinal.
Si alguna de las variables está medida a nivel de escala de intervalo/razón deberá procederse
antes de operar el estadístico a su conversión en forma ordinal.
Coeficiente de Correlación de Spearman
9. Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén
medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las
representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega 𝑃𝑆 (rho), aunque cuando nos
situamos en el contexto de la Estadística Descriptiva se emplea la notación 𝑟𝑆
La fórmula de cálculo para 𝑟𝑆 puede derivarse de la utilizada en el caso de 𝑟𝑋𝑌; bastaría
aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales,
compuestas cada una de ellas por los n primeros números naturales.
Uso del Coeficiente de Correlación de Spearman
10. Uso del Coeficiente de Correlación de Sperman
► A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la
correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:
𝑝 = 0 𝑁𝑜 ℎ𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛
𝑝 ≠ 0 𝐻𝑎𝑦 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑟 𝑠 = 1 −
6 𝑑𝑖
2
𝑛 (𝑛2 − 1)
► Donde d es la distancia existente entre los puestos que ocupan las puntuaciones
correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para
Y.
11. Propiedades del Coeficiente de Correlación de Spearman
► El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los
valores -1 y 1. Es decir, -1 < rs < 1.
► Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable
Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le
corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc.,
entonces el valor de rs es -1.
► El coeficiente rs es un caso particular de rxy, puesto que se calcula a partir de éste, por
aplicación del coeficiente de Pearson a valores ordinales considerados como puntuaciones.
► Si calculamos el coeficiente de correlación de Pearson entre dos variables X e Y, y el
coeficiente de correlación de Spearman para las mismas puntuaciones pero transformadas
en rangos, ambos coeficientes se aproximan en valor según aumenta el número de sujetos
n.
12. Ventajas del Coeficiente de Correlación de Spearman
► Al ser Spearman una técnica no paramétrica es libre de distribución probabilística.
► Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos
desvíos del patrón normal).
► La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la
relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una
fuerte correlación.
► Los valores se repiten asignado el promedio de los rangos que les correesponderian a cada uno de
ellos.
► El coeficiente de correlación de Spearman es enos sensible a los valores extremos que el coeficiente
de Pearson
Ejemplo: Con base en la información de las 44 truchas y ante el no cumplimiento de los supuestos del
coeficiente de correlación de Pearson se aplicó la técnica no paramétrica de Spearman dando como
resultado la siguiente salida:
13. Desventajas del Coeficiente de Correlación de Spearman
► Es asociada entre dos variables aleatorias continuas.
► Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos.
► 0 cero, significa no correlacion pero no independencia.
► R no debe ser usado para decir algo sobra la relación causa y efecto.
14. Enfoque de Spearman
Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más
condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones
tendrán un orden en particular.
Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y
predecimos que su habilidad mejorará de intento en intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que
existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán
afectados.
La interpretación del resultado del coeficiente de correlación de Spearman
se encuentra entre los valores de -1 y 1. La significación estadística de un
coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica
del fenómeno que se estudia.