1. Republica bolivariana de Venezuela
Ministerio del poder popular para la educación
I.U.P.S.M
Profesor: Alumno:
Pedro Beltrán Wilfredo Sifontes
2. El coeficiente de correlación de Spearman, ρ (rho) es una medida
de la correlación (la asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados
por su respectivo orden.
El coeficiente de correlación de Pearson es una medida de la relación lineal
entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las
variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación de
dos variables siempre y cuando ambas sean cuantitativas.
Ejemplos de diagramas de
dispersión con diferentes valores
del coeficiente de correlación (ρ)
3. Karl Pearson nace el 27 de marzo de 1857 en Londres.
Hijo de una familia acomodada, estudia en la
University College School y posteriormente en
Cambridge especializándose en matemáticas.
En 1888 se convierte en profesor de matemáticas y geometría
en el Gresham College donde colabora en estudios de
biometría y estudios sobre la teoría evolucionaria.
Pearson siempre será recordado por sus teorías positivistas
radicales, su investigación estadística en materia de biología
y por ser el fundador de la bioestadística.
Muere en Londres, el 27 de abril de 1936.
4. La covariación es el grado de concordancia de las posiciones relativas de los
datos de dos variables. En consecuencia el coeficiente de correlación de Pearson
opera con puntuaciones tipificadas (que miden posiciones relativas) y se define:
El fundamento del coeficiente de Pearson es el siguiente:
Cuanto más intensa sea la concordancia (en sentido directo o inverso) de las
posiciones relativas de los datos en las dos variables, el producto del numerador
toma mayor valor (en sentido absoluto). Si la concordancia es exacta, el numerador
es igual a N (o a -N), y el índice toma un valor igual a 1 (o -1).
Ejemplo 1 (Máxima covariación positiva) Observa que los datos tipificados (expresados como
puntuaciones z) en las dos columnas de la derecha
tienen los mismos valores en ambas variables, dado
que las posiciones relativas son las mismas en las
variables X e Y.
5. Si obtenemos los productos de los valores tipificados para cada caso, el resultado es:
El cociente de dividir la suma de
productos (5) por N (hay que tener en
cuenta que N es el número de casos, NO
el número de datos) es igual a 1:
6. Charles Edward Spearman
(Londres, 1863 - 1945)
Psicólogo británico que
destacó por sus estudios
sobre la inteligencia y las
aptitudes humanas.
Fue profesor de mente y
lógica en el University
College de Londres.
Realizó importantes
aportes a
la psicología y a
la estadística,
desarrollando
el Análisis Factorial.
El coeficiente de correlación de Spearman se rige por las reglas de la correlación simple de Pearson, y las
mediciones de este índice corresponden de + 1 a - 1, pasando por el cero, donde este último significa no
correlación entre las variables estudiadas, mientras que los dos primeros denotan la correlación máxima.
La ecuación utilizada en este procedimiento, cuando en el ordenamiento de los rangos de las observaciones no hay
datos empatados o ligados, es la siguiente:
Donde:
rs = coeficiente de correlación de Spearman.
d2 = diferencias existentes entre los rangos de las dos variables, elevadas al
cuadrado.
N = tamaño de la muestra expresada en parejas de rangos de las variables.
S = sumatoria.
7. Desventajas
Los coeficientes de correlación más utilizados sólo miden una relación lineal.
Por lo tanto, es perfectamente posible que, si bien existe una fuerte relación no
lineal entre las variables, r está cerca de 0 o igual a 0
Hay que tener cuidado al interpretar el
valor de 'r'. Por ejemplo, se podría
calcular 'r' entre el número de calzado
y la inteligencia de las personas, la
altura y los ingresos.
Cualquiera sea el valor de 'r', no tiene
sentido y por lo tanto es llamado
correlación de oportunidad o sin
sentido.
Sin embargo, el mismo valor de 'r
no nos dice si X influencia a Y o al
revés. La correlación estadística no
debe ser la herramienta principal
para estudiar la causalidad,
por el problema con las terceras
variables.
8. La siguiente tabla muestra el rango u orden obtenido en la primera evaluación (X) y el rango o puesto
obtenido en la segunda evaluación (Y) de 8 estudiantes universitarios en la asignatura de Estadística.
Calcular el coeficiente de correlación por rangos de Spearman.
Estudiante X Y
Dyana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Mathías 5 6
Josué 6 2
Anita 7 8
Lucía 8 7
Se aplica la fórmula:
9. Por lo tanto existe una correlación positiva moderada entre la primera y segunda evaluación de los 8
estudiantes.
En Excel se calcula de la siguiente manera:
a) Se inserta la función COEF.DE.CORREL y pulsar en Aceptar. En el cuadro de argumentos de la función, en el
recuadro de la Matriz 1 seleccionar las celdas de X, y en el recuadro de la Matriz 2 seleccionar las celdas de Y. Pulsar
en Aceptar