ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
Presentación michelle ramirez . Coeficiente de correlacion pearson y sperman
1. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Lámina 1 de 16
Elaborado por: Michelle
Ramírez
C.I 25.272.215
Coeficientes de correlación de
Pearson y Sperman
Temas
1. Coeficientes de correlación de Pearson y de Sperman (definición)
2. Como determinar el uso de los coeficientes de correlación de Pearson
y de Sperman (interpretación)
3. Ventajas y desventajas de los coeficientes de correlación de Pearson y
de Sperman.
4. Aplicación de enfoques Pearson y enfoque Sperman en problemas
estadísticos.
2. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Lámina 2 de 16
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(Definición)
Es una medida de la relación lineal entre dos variables
aleatorias cuantitativas. También se define el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación
de dos variables siempre y cuando ambas sean cuantitativas. A diferencia de
la covarianza, la correlación de Pearson es independiente de la escala de
medida de las variables.
Los coeficientes de correlación son medidas que indican la situación
relativa de los mismos sucesos respecto a las dos variables, es decir, son la
expresión numérica que nos indica el grado de relación existente entre las 2
variables y en qué medida se relacionan
Coeficientes de correlación de Pearson
3. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(interpretación)
El valor del índice de correlación varía en el intervalo [-1,1]:
1. Si r = 1, existe una correlación positiva perfecta. El índice indica una
dependencia total entre las dos variables denominada relación directa:
cuando una de ellas aumenta, la otra también lo hace en proporción
constante.
2. Si 0 < r < 1, existe una correlación positiva.
3. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que
las variables son independientes: pueden existir todavía relaciones no
lineales entre las dos variables.
4. Si -1 < r < 0, existe una correlación negativa
Coeficientes de correlación de Pearson Lámina 3 de 16
4. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(interpretación)
5. Si r = -1, existe una correlación negativa perfecta. El índice indica una
dependencia total entre las dos variables llamada relación inversa: cuando
una de ellas aumenta, la otra disminuye en proporción constante
La interpretación del coeficiente de correlación en términos de
proporción de variabilidad compartida o explicada se refiere al coeficiente de
determinación. Dicho coeficiente se define como el cuadrado del coeficiente de
correlación; esto es, dada dos variable X e Y, hace referencia a , y se
entiende como una proporción de variabilidades.
Por ejemplo, si la correlación entre inteligencia y rendimiento
académico es de 0.8, significa que 0.82 = 0.64 es la proporción de varianza
compartida entre ambas variables
Coeficientes de correlación de Pearson Lámina 4 de 16
5. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(interpretación)
Puede interpretarse como que un 64% del rendimiento académico es
debido a la inteligencia, o bien, y esto es más exacto si hemos de ser estrictos,
que inteligencia y rendimiento académico comparten un 64% de elementos, o
lo que es lo mismo, tanto la inteligencia como el rendimiento ponen en juego un
64% de habilidades comunes.
En estas circunstancias, si tomamos como variable dependiente o a
explicar el rendimiento académico y elegimos la inteligencia como variable
predictiva o explicativa, tendremos que tal variable da cuenta de un 64% de la
variabilidad en rendimiento. Queda, por ello, 1-0.64=0.36, un 36% del
rendimiento que queda sin explicar. A este valor (0.36) se le denomina
coeficiente de no determinación o coeficiente de alienación, y se define como
1−
Coeficientes de correlación de Pearson Lámina 5 de 16
6. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
Coeficientes de correlación de Pearson
(Ventajas)
1. El valor del coeficiente de correlación es independiente de cualquier unidad
usada para medir variables
2. Mientras mas grande sea la muestra mas exacta será la estimación.
3. Una ventaja de este coeficiente consiste en la posibilidad de calcular su
distribución muestral y así poder determinar su error típico de estimación
(Desventajas)
1. Requiere supuestos acerca de la naturaleza o formas de las poblaciones
afectadas.
2. Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante a la de
la curva normal.
3. Permite predecir el valor de una variable dado un valor determinado de la
otra variable.
Lámina 6 de 16
7. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(Desventajas)
3. Permite predecir el valor de una variable dado un valor determinado de la
otra variable.
4. Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
.
Coeficientes de correlación de Pearson Lámina 7 de 16
8. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(Usos de enfoque en problemas estadísticos)
El coeficiente de correlación de Pearson (r) se mide en una escala de
0 a 1, tanto en dirección positiva como negativa. Un valor de “0” indica que no
hay relación lineal entre las variables. Un valor de “1” o “–1” indica,
respectivamente, una correlación positiva perfecta o negativa perfecta entre
dos variables. Normalmente, el valor de se ubicará en alguna parte entre 0 y 1
o entre 0 y –1.
En las ciencias sociales en general y en educación en particular,
donde la mayoría de las variables son simultáneamente afectadas por una gran
multitud factores, una correlación positiva de 0,7 o una correlación negativa de
–0,7 se considera muy fuerte. (Por último, tenga en mente el coeficiente de
Pearson mide sólo relaciones lineales entre variables, y no es útil para medir
relaciones que no son lineales.)
Coeficientes de correlación de Pearson Lámina 8 de 16
9. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(Usos de enfoque en problemas estadísticos)
Nótese que una correlación negativa no es menos fuerte que una
correlación positiva. Así, por ejemplo, un de 0,5 es tan ‘grande’ o fuerte como
un de –0,5. Los signos positivos y negativos sólo indican si el valor de una
variable aumenta o disminuye, respectivamente, con el aumento en el valor de
la otra variable.
Coeficientes de correlación de Pearson Lámina 9 de 16
10. (Usos de enfoque en problemas estadísticos)
Como usted sabe, cuando los aumentos (disminuciones) de una
variable producen aumentos (disminuciones) en la otra, la relación es positiva.
Es negativa cuando los aumentos (disminuciones) de una variable producen
disminuciones (aumentos) en la otra.
Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
Coeficientes de correlación de Pearson Lámina 10 de
16
11. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(Definición)
Este coeficiente se emplea cuando una o ambas escalas de medidas
de las variables son ordinales, es decir, cuando una o ambas escalas de
medida son posiciones. Ejemplo: Orden de llegada en una carrera y peso de
los atletas. Se calcula aplicando la siguiente ecuación:
Donde:
Coeficiente de correlación por rangos
d = diferencia entre los rangos
n = numero de datos
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Coeficientes de correlación de Sperman Lámina 11 de
16
12. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(interpretación)
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos
asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlación pero no independencia. La tau de Kendall es un coeficiente de
correlación por rangos, inversiones entre dos ordenaciones de una distribución
normal bi-variante.
Una generalización del coeficiente de Spearman es útil en la situación
en la cual hay tres o más condiciones, varios individuos son observados en
cada una de ellas, y predecimos que las observaciones tendrán un orden en
particular
Coeficientes de correlación de Sperman Lámina 12 de
16
13. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(interpretación)
Por ejemplo, un conjunto de individuos pueden tener tres
oportunidades para intentar cierta tarea, y predecimos que su habilidad
mejorará de intento en intento. Un test de la significación de la tendencia entre
las condiciones en esta situación fue desarrollado por E. B. Page y
normalmente suele conocerse como Page's trend test para alternativas
ordenadas.
(Ventajas)
1. No está afectada por los cambios en las unidades de medida.
2. Al ser una técnica no parámetra, es libre de distribución probabilística.
3. El coeficiente de Spearman es útil en la situación en la cual hay tres o más
condiciones
Coeficientes de correlación de Sperman Lámina 13 de
16
14. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
Coeficientes de correlación de Sperman
(Desventajas)
1. Es recomendable usarlo cuando los datos presentan valores extremos, ya
que dichos valores afectan mucho el coeficiente de correlación de Pearson,
o ante distribuciones no normales.
2. no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
3. Para aplicar el coeficiente de correlación de Spearman se requiere que las
variables estén medidas al menos en escala ordinal, es decir; de forma que
las puntuaciones que la representan puedan ser colocadas en dos series
ordenadas.
4. A veces, este coeficiente es denominado por la letra griega ρs (rho),
aunque cuando nos situamos en el contexto de la Estadística Descriptiva se
emplea la notación rs. Usos del Coeficiente de correlación de Spearman
Lámina 14 de
16
15. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
Coeficientes de correlación de Sperman
(Usos de enfoque en problemas estadísticos)
La aproximación moderna al problema de averiguar si un valor
observado de ρ es significativamente diferente de cero (siempre tendremos -
1 ≤ ρ ≤ 1) a traves del coeficientes de correlación de Sperman es calcular la
probabilidad de que sea mayor o igual que el ρ esperado, dada la hipótesis
nula, utilizando un test de permutación. Esta aproximación es casi siempre
superior a los métodos tradicionales, a no ser que el conjunto de datos sea tan
grande que la potencia informática no sea suficiente para generar
permutaciones (poco probable con la informática moderna), o a no ser que sea
difícil crear un algoritmo para crear permutaciones que sean lógicas bajo la
hipótesis nula en el caso particular de que se trate (aunque normalmente estos
algoritmos no ofrecen dificultad).
Lámina 15 de
16
16. Instituto Universitario Politécnico Santiago
Mariño
ingeniería en Mtto. Mecánico
Elaborado por: Michelle
Ramírez
C.I 25.272.215
(Usos de enfoque en problemas estadísticos)
Aunque el test de permutación es a menudo trivial para cualquiera
con recursos informáticos y experiencia en programación, todavía se usan
ampliamente los métodos tradicionales para obtener significación. La
aproximación más básica es comparar el ρ observado con tablas publicadas
para varios niveles de significación. Es una solución simple si la significación
sólo necesita saberse dentro de cierto rango, o ser menor de un determinado
valor, mientras haya tablas disponibles que especifiquen los rangos adecuados.
Más abajo hay una referencia a una tabla semejante. Sin embargo, generar
estas tablas es computacionalmente intensivo y a lo largo de los años se han
usado complicados trucos matemáticos para generar tablas para tamaños de
muestra cada vez mayores, de modo que no es práctico para la mayoría
extender las tablas existentes.
Coeficientes de correlación de Sperman Lámina 16 de
16