Análisis de la Implementación de los Servicios Locales de Educación Pública p...
Coeficiente de correlacion de pearson y spearman
1. INSTITUTO UNIVERSITARIO SANTIAGO MARIÑO
INGENIERÍA INDUSTRIAL
SECCIÓN: YV
COEFICIENTES DE CORRELACION DE PEARSON
Y SPEARMAN.
Prof. Ramón Aray KelvinCeballos:25.388.294
Barcelona, Febrero de 2016
2. Coeficiente de Correlación de Pearson
El Coeficiente de Correlación de Pearson es una medida de la relación lineal
entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las
variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación de
dos variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias x e y sobre
una población; el coeficiente de correlación de Pearson se simboliza con la
letra , siendo la expresión que nos permite calcularlo:
3. USO:
Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos es que las dos variables que se comparan
deben observarse o medirse de manera independiente para eliminar cualquier resultado
sesgado.
Para cantidades grandes de información, el calculo puede ser tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay
relación linear entre las dos variables. Reporta un valor de correlación cercano al 1
como indicador de que existe una relación linear positiva entre las dos variables. Un
valor mayor a cero que se acerque a 1 da como resultado una mayor correlación
positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de que hay una relación
linear negativa entre las dos variables.
Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos
particulares. El valor de correlación es esencialmente un valor arbitrario que debe
aplicarse de acuerdo con las variables que se comparan.
Determina la importancia de los resultados. Esto se logra con el uso del coeficiente
de correlación, grados de libertad y una tabla de valores críticos del coeficiente de
correlación. Los grados de libertad se calculan como el número de las dos
observaciones menos 2.
4. Ventajas y Desventajas del Coeficiente de
Pearson
Ventajas:
El valor del coeficiente de
correlación es independiente de
cualquier unidad usada para
medir variables.
Mientras mas grande sea la
muestra mas exacta será la
estimación.
Cuando en el fenómeno
estudiado las dos variables son
cuantitativas se usa el
coeficiente de correlaciones de
Pearson.
Desventajas:
Requiere supuestos acerca de la
naturaleza o formas de las
poblaciones afectadas.
Requiere que las dos variables
hayan ido medidas hasta un
nivel cuantitativo continuo y
que la distribución de ambas
sea semejante a la de la curva
normal.
Cuando las variables X e Y son
independientes, el numerador se
anula y el coeficiente de
correlación poblacional tiene el
valor cero.
6. Coeficiente de Correlación de Spearman
El Coeficiente de Correlación de Spearman, ρ (rho) es una medida de la
correlación (la asociación o interdependencia) entre dos variables aleatorias
continuas. Para calcular ρ, los datos son ordenados y reemplazados por su
respectivo orden.
El estadístico ρ viene dado por la expresión:
7. Coeficiente de Correlación de Spearman
La interpretación de coeficiente de Spearman es igual que la del coeficiente
de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero, significa no correlación pero no
independencia.
La correlación estimada entre X e Y se halla calculando el coeficiente de
correlación de Pearson para el conjunto de rangos apareados.
La correlación de Spearman puede ser calculada con la fórmula de Pearson,
si antes hemos transformado las puntuaciones en rangos.
8. Uso:
A partir de un conjunto de n puntuaciones, la formula que permite el calculo
de la correlación entre dos variables X e Y, medidas al menos en escala
ordinal, es la siguiente:
P=0 No hay correlación
P≠ 0 Hay correlación
Donde d es la distancia existente entre los puestos que ocupan las
puntuaciones correspondientes a un sujeto i cuando estas puntuaciones
han sido ordenadas para X y para Y.
El coeficiente de correlación de Spearman se encuentra siempre
comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1.
Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y
para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir,
al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le
corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.
9. Ventajas y Desventajas del Coeficiente de
Spearman
Ventajas:
No esta afectada por los cambios
en las unidades de medida.
Al ser una técnica no parámetra, es
libre de distribución probabilística.
La manifestación de una relación
causa-efecto es posible sólo a
través de la comprensión de la
relación natural que existe entre las
variable y no debe manifestarse
sólo por la existencia de una fuerte
correlación (1, 5).
Desventajas:
Es recomendable usarlo cuando los
datos presentan valores extremos,
ya que dichos valores afectan
mucho el coeficiente de correlación
de Pearson, o ante distribuciones no
normales.
r no debe ser utilizado para decir
algo sobre la relación entre causa y
efecto.
11. Usos de Enfoques de Pearson a Problemas
Estadísticos
En la perspectiva de Pearson, para establecer el nivel de significación estadística
habría que atender al impacto de cada tipo de error en el objetivo del investigador, y
a partir de ahí se decidiría cuál de ellos es preferible minimizar.
Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo
de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se
refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en
estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que
algunos han propuesto como sustituto de los valores p en los informes de
investigación científica.
Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la
prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson,
simbolizado por r.
12. Usos de Enfoques de Spearman a Problemas
Estadísticos
Una generalización del coeficiente de Spearman es útil en la situación en la
cual hay tres o más condiciones, varios individuos son observados en cada una
de ellas, y predecimos que las observaciones tendrán un orden en particular.
Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para
intentar cierta tarea, y predecimos que su habilidad mejorará de intento en
intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para series
de datos en los que existan valores extremos, pues si calculamos la correlación
de Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se
encuentra entre los valores de -1 y 1.
La significación estadística de un coeficiente debe tenerse en cuenta
conjuntamente con la relevancia clínica del fenómeno que se estudia.
13. Bibliografía
Internet
Correlación en Wikipedia (español):
http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre
variables cuantitativas.
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitati
vas2.pdf Correlation en Wikipedia (inglés).
http://personal.us.es/vararey/adatos2/correlacion.pdf.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_P
earson.
http://www.monografias.com/trabajos93/muestreo-correlaciones-
contingencias-y-pearson/muestreo-correlaciones-contingencias-y-
pearson2.shtml