Uso de los coeficientes de correlación de pearson y de spearman
1.
2.
3. En el caso de que se esté estudiando dos variables
aleatorias x e y sobre una población; el coeficiente de
correlación de Pearson se simboliza con la letra , siendo
la expresión que nos permite calcularlo:
De manera análoga podemos calcular este coeficiente
sobre un estadístico muestra, denotado como:
4. •El valor del coeficiente
de correlación es
independiente de
cualquier unidad
usada para medir
variables.
•Mientras mas grande
sea la muestra mas
exacta será la
estimación.
•Requiere supuestos acerca de
la naturaleza o formas de las
poblaciones afectadas.
•Requiere que las dos variables
hayan ido medidas hasta un
nivel cuantitativo continuo y
que la distribución de ambas
sea semejante a la de la curva
normal.
5. •Dicho cálculo es el primer paso para determinar la relación
entre las variables.
•Reporta un valor de correlación cercano a 0 como un indicador
de que no hay relación lineal entre 2 variables.
• Reporta un valor de correlación cercano a 1 como un indicador
de que existe una relación lineal positiva entre las 2 variables. Un
valor mayor a cero que se acerque a 1 da como resultado una
mayor correlación positiva entre la información. Usos del
Coeficiente de Correlación de Pearson
• Consiste en la posibilidad de calcular su distribución muestral
y así poder determinar su error típico de estimación.
6. En la perspectiva de Pearson, para establecer el nivel de significación
estadística habría que atender al impacto de cada tipo de error en el
objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es
preferible minimizar.
Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este
último tipo de error, introdujeron el concepto de “poder de una prueba
estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y
está definido por 1-beta, y en estrecha relación con éste se ha
desarrollado el concepto de “tamaño del efecto” que algunos han
propuesto como sustituto de los valores p en los informes de
investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T de
Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de
correlación de Pearson, simbolizado por r.
7. Este coeficiente es una medida de asociación lineal
que utiliza los rangos, números de orden, de cada
grupo de sujetos y compara dichos rangos. Existen
dos métodos para calcular el coeficiente de
correlación de los rangos: uno, señalado por
Spearman y otro, por Kendall. El r de Spearman
llamado también rho de Spearman es más fácil de
calcular que el de Kendall.5
8. Donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a
la hora de ordenarlos, aunque si éstos son pocos, se
puede ignorar tal circunstancia.
Para muestras mayores de 20 observaciones, podemos
utilizar la siguiente aproximación a la distribución t de
Student
9. • Los valores se repiten asignado
el promedio de los rangos que les
corresponderían a cada uno de
ellos.
•El coeficiente de correlación de
Spearman es menos sensible a los
valores extremos que el coeficiente
de Pearson.
•Una alternativa al coeficiente de
correlación de Pearson es el
coeficiente de correlación de
Spearman basado en rangos.
• Se tiene que considerar la
existencia de datos idénticos a
la hora de ordenarlos.
• Es asociada entre dos
variables aleatorias continuas.
•0 cero, significa no
correlación pero no
independencia.
10. •A partir de un conjunto de n puntuaciones, la formula que
permite el calculo de la correlación entre dos variables X e Y,
medidas al menos en escala ordinal, es la siguiente:
P=0 No hay correlación
p≠ 0 Hay correlación
•Donde d es la distancia existente entre los puestos que ocupan las
puntuaciones correspondientes a un sujeto i cuando estas
puntuaciones han sido ordenadas para X y para Y.
11. Una generalización del coeficiente de Spearman es útil en la
situación en la cual hay tres o más condiciones, varios individuos
son observados en cada una de ellas, y predecimos que las
observaciones tendrán un orden en particular.
Por ejemplo, un conjunto de individuos pueden tener tres
oportunidades para intentar cierta tarea, y predecimos que su
habilidad mejorará de intento en intento. El coeficiente de
correlación de rangos de Spearman debe utilizarse para series de
datos en los que existan valores extremos, pues si calculamos la
correlación de Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de
Spearman se encuentra entre los valores de -1 y 1. La significación
estadística de un coeficiente debe tenerse en cuenta conjuntamente
con la relevancia clínica del fenómeno que se estudia.