Este documento explica los coeficientes de correlación de Pearson y Spearman. El coeficiente de Pearson mide la relación lineal entre dos variables cuantitativas, mientras que el coeficiente de Spearman se utiliza para variables ordinales. Ambos coeficientes varían de -1 a 1, donde valores cercanos a 1 indican una fuerte relación positiva y valores cercanos a -1 indican una fuerte relación negativa. El documento también discute las ventajas y desventajas de cada coeficiente y cómo se pueden usar para analizar problemas estadísticos.
2. USOS DEL COEFICIENTE DE CORRELACIÓN DE
PEARSON
Permite predecir el valor de una variable dado un valor determinado de
la otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
Dicho cálculo es el primer paso para determinar la relación entre las
variables.
Consiste en la posibilidad de calcular su distribución muestral y así
poder determinar su error típico de estimación.
Reporta un valor de correlación cercano a 0 como un indicador de que
no hay relación lineal entre 2 variables.
Reporta un valor de correlación cercano a 1 como un indicador de que
existe una relación lineal positiva entre las 2 variables. Un valor mayor
a cero que se acerque a 1 da como resultado una mayor correlación
positiva entre la información.
3. COEFICIENTE DE CORRELACIÓN DE
PEARSON
Se define como un índice que puede utilizarse para medir el grado de
relación de dos variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias (x) e (y)
sobre una población; el coeficiente de correlación de Pearson se
simboliza con la letra , siendo la expresión que nos permite calcularlo:
4. COEFICIENTE DE CORRELACIÓN DE
PEARSON
Donde;
es la covarianza de (X,Y)
es la desviación típica de la variable X
es la desviación típica de la variable
Y De manera análoga podemos calcular este coeficiente sobre un estadístico
muestral, denotado como a:
5. VENTAJAS Y DESVENTAJAS DEL
COEFICIENTE DE PEARSON
Ventajas:
El valor del coeficiente de correlación es
independiente de cualquier unidad usada
para medir variables.
Mientras mas grande sea la muestra mas
exacta será la estimación.
Desventajas:
Requiere supuestos acerca de la
naturaleza o formas de las
poblaciones afectadas.
Requiere que las dos variables hayan ido
medidas hasta un nivel cuantitativo
continuo y que la distribución de ambas
sea semejante a la de la curva normal.
7. USOS DE ENFOQUES DE PEARSON A
PROBLEMAS ESTADÍSTICOS
En la perspectiva de Pearson, para establecer el nivel de significación
estadística habría que atender al impacto de cada tipo de error en el objetivo
del investigador, y a partir de ahí se decidiría cuál de ellos es preferible
minimizar.
Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este
último tipo de error, introdujeron el concepto de “poder de una prueba
estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está
definido por 1-beta, y en estrecha relación con éste se ha desarrollado el
concepto de “tamaño del efecto” que algunos han propuesto como sustituto de
los valores p en los informes de investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T de
Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de
correlación de Pearson, simbolizado por r.
8. USOS DEL COEFICIENTE DE CORRELACIÓN DE
SPEARMAN
Para aplicar el coeficiente de correlación de Spearman se requiere que
las variables estén medidas al menos en escala ordinal, es decir, de
forma que las puntuaciones que las representan puedan ser colocadas
en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega 𝜌𝑠 (rho),
aunque cuando nos situamos en el contexto de la Estadística
Descriptiva se emplea la notación 𝑟𝑠.
La fórmula de cálculo para 𝑟𝑠 puede derivarse de la utilizada en el caso
de 𝑟𝑥𝑦 ; bastaría aplicar el coeficiente de correlación de Pearson a dos
series de puntuaciones ordinales, compuestas cada una de ellas por
los n primeros números naturales.
9. A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de
la correlación entre dos variables X e Y, medidas al menos en escala ordinal,
es la siguiente:
P=0 No hay correlación
p≠ 0 Hay correlación
Donde d es la distancia existente entre los puestos que ocupan las
puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han
sido ordenadas para X y para Y.
Usos del Coeficiente de Correlación
de Spearman
10. VENTAJAS Y DESVENTAJAS DEL
COEFICIENTE DE SPEARMAN
Ventajas:
No esta afectada por los cambios
en las unidades de medida.
Al ser una técnica no
parámetra, es libre de distribución
probabilística.
Desventajas :
Es recomendable usarlo cuando los
datos presentan valores extremos,
ya que dichos valores afectan
mucho el coeficiente de correlación
de Pearson, o ante distribuciones no
normales.
r no debe ser utilizado para decir
algo sobre la relación entre causa y
efecto.
12. USOS DE ENFOQUES DE SPEARMAN A
PROBLEMAS ESTADÍSTICOS
Una generalización del coeficiente de Spearman es útil en la situación en la
cual hay tres o más condiciones, varios individuos son observados en cada
una de ellas, y predecimos que las observaciones tendrán un orden en
particular.
Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para
intentar cierta tarea, y predecimos que su habilidad mejorará de intento en
intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para
series de datos en los que existan valores extremos, pues si calculamos la
correlación de Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se
encuentra entre los valores de -1 y 1. La significación estadística de un
coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del
fenómeno que se estudia.
13. BIOGRAFÍA
Internet:
Correlación en Wikipedia (español):
http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre variables
cuantitativas.
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas2.pdf
Correlation en Wikipedia (inglés).
http://personal.us.es/vararey/adatos2/correlacion.pdf.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson