Clasificaciones, modalidades y tendencias de investigación educativa.
Coeficientes de correlacion de pearson y spearman
1. REPUBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA EDUCACION SUPERIOR
INSTITUTO UNIVERSITARIO POLITECNICO SANTIAGO MARINO
SEDE BARCELONA
ESTADISTICA ZV
BACHILLER:
VALERIA GIL, CI: 22.652.265
BARCELONA, 27 DE JULIO DE 2016
2. Coeficiente de correlación de Pearson
El coeficiente de correlación de Pearson es una medida de la relación lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de
Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson
como un índice que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población;
el coeficiente de correlación de Pearson se simboliza con la letra , siendo la
expresión que nos permite calcularlo:
3. Coeficiente de correlación de Pearson
Donde:
es la covarianza de ( X , Y )
es la desviacion tipica de la variable X
es la desviacion tipica de la variable Y
De manera análoga podemos calcular este coeficiente sobre un
estadistico mentrual, denotado como a:
4. Uso del coeficiente de correlación de Pearson
Permite predecir el valor de una variable dado un valor determinado de la
otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas estudiando
el método conocido como correlación.
Dicho cálculo es el primer paso para determinar la relación entre las
variables.
Consiste en la posibilidad de calcular su distribución muestral y así poder
determinar su error típico de estimación.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay
relación lineal entre 2 variables.
Reporta un valor de correlación cercano a 1 como un indicador de que existe
una relación lineal positiva entre las 2 variables.
5. Ventajas y desventajas del
coeficiente de Pearson
Ventajas
El valor del coeficiente de correlación es
independiente de cualquier unidad usada para
medir variable.
Mientras mas grande sea la muestra mas exacta
será la estimación.
Posibilidad de calcular su distribución muestral y
así poder determinar su error típico de estimación.
Desventajas
Requiere supuestos
acerca de la naturaleza
o formas de las
poblaciones afectadas.
Requiere que las dos
variables hayan ido
medidas hasta un nivel
cuantitativo continuo y
que la distribución de
ambas sea semejante a
la de la curva normal.
8. uso de enfoques Pearson a problemas
estadísticos.
En la perspectiva de Pearson, para establecer el nivel de significación
estadística habría que atender al impacto de cada tipo de error en el
objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es
preferible minimizar.
Pearson llamo alfa al error tipo I y beta al error tipo II; a partir de este
último tipo de error, introdujeron el concepto de “poder de una
prueba estadística”, el cual se refiere a su capacidad para evitar el
error tipo II, y está definido por 1-beta, y en estrecha relación con éste
se ha desarrollado el concepto de “tamaño del efecto” que algunos
han propuesto como sustituto de los valores p en los informes de
investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T de
Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de
correlación de Pearson, simbolizado por r. Usos de Enfoques de
Pearson a Problemas Estadísticos
9. Coeficiente de correlacion
de Spearman
Es una medida de la correlación entre dos variables aleatorias
continuas. Este coeficiente es una medida de asociación lineal
que utiliza los rangos, números de orden, de cada grupo de
sujetos y compara dichos rangos.
La interpretación de coeficiente de Spearman es igual que la del
coeficiente de correlación de Pearson. El estadístico ρ viene
dado por la expresión:
10. Coeficiente de correlacion de Spearman
Donde D es la diferencia entre los correspondientes estadísticos
de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora
de ordenarlos, aunque si éstos son pocos, se puede ignorar tal
circunstancia.
Para muestras mayores de 20 observaciones, podemos utilizar
la siguiente aproximación a la distribución t de Student
11. Usos del coeficiente de
correlacion de Spearman
Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala
ordinal, es decir, de forma que las puntuaciones que las
representan puedan ser colocadas en dos series ordenadas.
A veces, este coeficiente es denominado por la letra griega ρs
(rho), aunque cuando nos situamos en el contexto de la
Estadística Descriptiva se emplea la notación rs
La fórmula de cálculo para rs puede derivarse de la utilizada
en el caso de rxy; bastaría aplicar el coeficiente de correlación
de Pearson a dos series de puntuaciones ordinales, compuestas
cada una de ellas por los n primeros números naturales
12. Uso del coeficiente de
correlacion de Spearman
partir de un conjunto de n puntuaciones, la fórmula que
permite el cálculo de la correlación entre dos variables X e Y,
medidas al menos en escala ordinal, es la siguiente:
Donde d es la distancia existente entre los puestos que
ocupan las puntuaciones correspondientes a un sujeto i
cuando estas puntuaciones han sido ordenadas para X y para
Y.
13. Ventajas y desventajas del
coeficiente de Spearman
Ventajas
No esta afectada por los
cambios en las unidades de
medida.
Al ser una técnica no
parámetra, es libre de
distribución probabilística.
Desventajas
Es recomendable usarlo cuando los
datos presentan valores extremos,
ya que dichos valores afectan
mucho el coeficiente de correlación
de Pearson, o ante distribuciones no
normales.
r no debe ser utilizado para decir
algo sobre la relación entre causa y
efecto.
15. Usos de Enfoques de Spearman a Problemas
Estadísticos
Una generalización del coeficiente de Spearman es útil en la situación en
la cual hay tres o más condiciones, varios individuos son observados en
cada una de ellas, y predecimos que las observaciones tendrán un orden
en particular. Por ejemplo, un conjunto de individuos pueden tener tres
oportunidades para intentar cierta tarea, y predecimos que su habilidad
mejorará de intento en intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para
series de datos en los que existan valores extremos, pues si calculamos
la correlación de Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de
Spearman se encuentra entre los valores de -1 y 1. La significación
estadística de un coeficiente debe tenerse en cuenta conjuntamente con
la relevancia clínica del fenómeno que se estudia.