2. • Esta fórmula representa al coeficiente de correlaciónpor rangos de
Spearman:
• Donde:
• N = Número de casos
• ΣD²= Sumatoria de la diferencia de los rangos elevada al cuadrado.
3. • Ejemplo
Los datos brutos usados en este ejemplo se ven debajo.
CI HORAS DE TV A
LA SEMANA
106 7
86 0
100 28
100 50
99 28
103 28
97 20
113 12
113 7
110 17
El primer paso es ordenar los datos de la primera columna.
Se agregan dos columnas 'orden(i)' y 'orden(t)'
Para el orden i, se corresponderán con el número de fila del
cuadro, para 99, orden(i) =3 ya que ocupa el 3.er lugar,
ordenado de menor a mayor para el orden t, se debe hacer
lo mismo pero ordenando por 'Horas de TV a la semana',
para no hacer otro cuadro, la secuencia ordenada quedaría
T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }
para este caso, el orden sería para cada
elemento, respectivamente:
orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }
4. sin embargo, el valor de orden está dado por el valor promedio de sus posiciones, así para:
7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5
• 28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8
• 50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10
• Después, se crean dos columnas más, una columna "d" que muestra las diferencias entre las dos columnas de orden y, otra columna "d2".
Esta última es sólo la columna "d" al cuadrado.
• Después de realizar todo esto con los datos del ejemplo, se debería acabar con algo como lo siguiente:
CI (i)
Horas de
TV a la
semana (t)
orden(i) orden(t) d d2
86 0 1 1 0 0
97 20 2 6 4 16
99 28 3 8 5 25
100 50 4.5 10 5.5 30.25
100 28 4.5 8 3.5 12.25
103 28 6 8 2 4
106 7 7 2.5 4.5 20.25
110 17 8 5 3 9
113 7 9.5 2.5 7 49
113 12 9.5 4 5.5 30.25
Los valores de la columna
d2 pueden ser sumados para
averiguar El valor de n
es 10. Así que esos valores
pueden ser sustituidos en la
fórmula.
5. VENTAJAS
No esta afectada por los
cambios en las unidades de
medida
Es una técnica que no requiere
parámetros, es libre de
distribución probabilistica
DESVENTAJAS
Se tiene que considerar la
existencia de datos idénticos a la
hora de ordenarlos
0 cero, significa no correlacion
pero no independencia
No debe ser utilizado para decir
algo de la relación entre causa y
efecto
6. • El coeficiente de correlación de Pearson es un índice que mide elgrado de
variación entre distintas variables relacionadaslinealmente
• Esta fórmula representa al coeficiente de correlación de Pearson:
• Donde:
• σxy = Covarianza de X,Y
• σx= Desviación típica de la variable X
• σy =Desviación típica de la variable Y
7. • Ejemplo ilustrativo:
• Con los datos sobre las temperaturas en dos días diferentes en una
ciudad, determinar el tipo de correlación que existe entre ellas
mediante el coeficiente de PEARSON
X 18 17 15 16 14 12 9 15 16 14 16 18 SX =180
Y 13 15 14 13 9 10 8 13 12 13 10 8 SY= 138
Solución:
Se calcula la media aritmética
8. • Se llena la siguiente tabla:
Se aplica la fórmula:
9. VENTAJAS
El valor del coeficiente de
correlacion es independiente de
cualquier unidad usada para
medir variables. Mientras mas
grande sea la muestra mas
exacta será la estimación
DESVENTAJAS
Requiere supuestos acerca de la
naturaleza o formas de las
poblaciones afectadas
Requiere que las dos variables
hayan sido medidas hasta un
nivel cuantitativo continuo y que
la distribución de ambas sea
semejante a la curva normal
10. • El signo indica la dirección de la correlación.
• Los valores cercanos a 1 nos indican una correlación muy buena y los
cercanos a cero una correlación mínima o nula.
11. • Coeficiente Interpretación
• 0 Relación nula
• 0–0,2 Relación muy baja
• 0,2–0,4 Relación baja
• 0,4–0,6 Relación moderada
• 0,6–0,8 Relación alta
• 0,8 - 1Relación muy alta
• 1 Relación perfecta
12. • Cuando el signo es positivo
• Refleja una correlación directa.
• Mientras mas altos sean los valores dela
variable independiente mas altosserán
los de la variable dependiente.
• Cuando el signo es negativo Refleja una
correlación inversa.
• Mientras más altos sean los valores dela
variable independiente mas bajosserán
los de la variable dependiente.
13. • Coeficiente de correlación de Pearson:
• Paramétrico
• Permite medir la correlación o asociación entre dos variablescuando se
trabaja con variables numéricas con distribución normal.
• Es calculado en función de las varianzas y la covarianza entre ambas variables
• Coeficiente de correlación de Spearman:
• No Paramétrico.
• Es un coeficiente que permite medir la correlación o asociaciónentre dos
variables cuando las mediciones se realizan en una escalaordinal, o cuando no
existe distribución normal.
• Se calcula en base a una serie de rangos asignados.