medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
1. Coeficientes de
correlación de Pearson
y de Spearman
Republica Bolivariana de Venezuela
Ministerio del Poder Popular Para la Educación
I.U.P. Santiago Mariño
Estadística I
Sección: YV
Bachiller:
Celeste Cedeño
Barcelona 10 de Febrero de 2016
2. Coeficiente de correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
Entonces se puede decir que el coeficiente de correlación de Pearson como un índice que puede utilizarse
para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables
aleatorias X y Y sobre una población; el coeficiente de
correlación de Pearson se simboliza con la letra Px,y, y
la formula es:
: Es la covarianza de (X Y)
: Es la desviación típica de la variable X
: Es la desviación típica de la variable Y
3. Ventajas y desventajas del Coeficiente
de correlación de Pearson
Ventajas:
El valor del coeficiente de correlación es independiente de
cualquier unidad usada para medir variables.
Mientras mas grande sea la muestra mas exacta será la
estimación.
Desventajas:
Requiere supuestos acerca de la naturaleza o
formas de las poblaciones afectadas.
Requiere que las dos variables hayan sido medidas
hasta un nivel cuantitativo continuo, y que la
distribución de ambas sea semejante a la de la curva
normal.
4. Coeficiente de correlación de Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho)
es una medida de la correlación (la asociación o interdependencia)
entre dos variables aleatorias continuas. Para calcular ρ, los datos
son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la
hora de ordenarlos, aunque si éstos son pocos, se puede
ignorar tal circunstancia
Para muestras mayores de 20 observaciones,
podemos utilizar la siguiente aproximación a
la distribución t de Student
La interpretación de coeficiente de
Spearman es igual que la
del coeficiente de Pearson.de
Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o
positivas respectivamente, 0 cero,
significa no correlación pero no
independencia.
5. Coeficiente de correlación de Spearman
Una generalización del coeficiente de Spearman es útil en la situación en la
cual hay tres o más condiciones, varios individuos son observados en cada una
de ellas, y predecimos que las observaciones tendrán un orden en particular.Por
ejemplo, un conjunto de individuos pueden tener tres oportunidades para
intentar cierta tarea, y predecimos que su habilidad mejorará de intento en
intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para
series de datos en los que existan valores extremos, pues si calculamos la
correlación de Pearson, los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se
encuentra entre los valores de -1 y 1. La significación estadística de un
coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del
fenómeno que se estudia.
6. Ventajas y desventajas del Coeficiente
de correlación de Spearman
Desventajas:
Es recomendable usarlo cuando los datos presentan
valores extremos, ya que dichos valores afectan mucho
el coeficiente de correlación de Pearson, o ante
distribuciones no normales.
r no debe ser utilizado para decir algo sobre la relación
entre causa y efecto.
Ventajas:
No esta afectada por los cambios en las unidades de
medida.
Al ser una técnica no parámetra, es libre de
distribución probabilística.
7. Ejercicios de correlación de
Pearson
Se desea saber la relación existente entre el rendimiento expresado por la
calificación final obtenida durante el curso de en la asignatura Medicina
Interna en la carrera de Medicina, y la cantidad de horas dedicadas al mes, en
el estudio sistemático (extrainstitucional) de dicha asignatura
Se seleccionó una muestra de 34 estudiantes, de clases de Medicina
La data incluye las calificaciones definitivas de la asignatura Medicina Interna
y los registros individuales del número de horas que dedican al estudio
sistemático de dicha asignatura:
Notas
Definitivas
Horas de
Estudios
9 18
7 19
9 32
8 25
9 22
7 30
6 20
8 18
8 25
5 28
7 19
9 23
6 24
6 19
6 30
8 32
9 21
6 24
8 28
7 29
8 21
7 23
9 26
8 30
8 22
9 31
10 24
5 27
9 29
6 18
6 19
9 22
8 28
9 23
8. Ejercicios de correlación de
Pearson
Media Desviación
típica
N
Horas 24.38 4.438 34
Nota_Def 7.62 1.349 34
Una vez ingresados los datos se obtuvieron
los siguientes resultados
Este gráfico muestra una dispersión con recta de
tendencia positiva ascendente, pero con una muy
débil correlación evidenciada adicionalmente en la
Tabla 2
Tabla 2
9. Ejercicios de correlación de
Pearson
Tabla 2 - Correlación de Pearson
Notas
Definitivas
Horas de
Estudios
Notas
Definitivas
Pearson
Correlation
1 ,096
Sig. (2-tailed) ,589
N 34 34
Horas de
Estudios
Pearson
Correlation
,096 1
Sig. (2-tailed) ,589
N 34 34
En este análisis el número de horas de estudio no se relacionó con
las calificaciones obtenidas (r=0.096; p=0.589), Investigaciones
realizadas al respecto consideran el rendimiento académico
multifactorial (Coeficiente Intelectual, motivacional, ambiental,
socio-económico-cultural, etc.). Se deben estudiar otras variables
e integrarlas para contrastar este resultado.
10. Ejercicios de correlación de Spearman
La tabla muestra el rango u orden obtenido en la primera evaluación (X) y el
rango o puesto obtenido en la segunda evaluación (Y) de 8 estudiantes
universitarios en la asignatura de Estadística. Calcular el coeficiente de
correlación por rangos de Spearman.
Estudiante X Y
Dyana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Mathías 5 6
Josué 6 2
Anita 7 8
Lucía 8 7
11. Ejercicios de correlación de Spearman
Se aplica la formula:
Por lo tanto existe una
correlación positiva
moderada entre la primera y
segunda evaluación de los 8
estudiantes
Para calcular el coeficiente de correlación por
rangos de Spearman de se llena la siguiente tabla: