Republica Bolivariana de Venezuela
Ministerio Del Poder Popular para la Educacion Superior
I.U.P. «Santiago Mariño»
Coeficientes de correlación
De Pearson y Spearman
Profesor :
Ramón Aray
Bachiller:
Manuel Chivico
C.I.:25.428.384
Coeficiente de correlación de Pearson
• El coeficiente de correlación de Pearson es una medida de la
relación lineal entre dos variables aleatorias cuantitativas. A
diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
• De manera menos formal, podemos definir el coeficiente de
correlación de Pearson como un índice que puede utilizarse
para medir el grado de relación de dos variables siempre y
cuando ambas sean cuantitativas.
Coeficiente de correlación de Pearson
• En el caso de que se esté estudiando dos variables aleatorias X y Y sobre
una población; el coeficiente de correlación de Pearson se simboliza con la
letra P(x) , Y` siendo la expresión que nos permite calcularlo.
Donde
De manera análoga podemos calcular este coeficiente sobre un estadístico
muestral, denotado como Rxy a:
Interpretación del coeficiente
intelectual de Pearson
• El valor del índice de correlación varía en el intervalo [-1,1]:
• Si r = 1, existe una correlación positiva perfecta. El índice indica una
dependencia total entre las dos variables denominada relación
directa: cuando una de ellas aumenta, la otra también lo hace en
proporción constante.
• Si 0 < r < 1, existe una correlación positiva.
• Si r = 0, no existe relación lineal. Pero esto no necesariamente
implica que las variables son independientes: pueden existir todavía
relaciones no lineales entre las dos variables.
• Si -1 < r < 0, existe una correlación negativa.
• Si r = -1, existe una correlación negativa perfecta. El índice indica
una dependencia total entre las dos variables llamada relación
inversa: cuando una de ellas aumenta, la otra disminuye en
proporción constante.
Correlación de Pearson
• Una correlación de +1 significa que existe una relación lineal
directa perfecta (positiva) entre las dos variables. Es decir, las
puntuaciones bajas de la primera variable (X) se asocian con
las puntuaciones bajas de la segunda variable (Y), mientras las
puntuaciones altas de X se asocian con los valores altos de la
variable Y.
Correlación de Pearson
• Una correlación de -1 significa que existe una relación lineal inversa
perfecta (negativa) entre las dos variables. Lo que significa que las
puntuaciones bajas en X se asocian con los valores altos en Y, mientras las
puntuaciones altas en X se asocian con los valores bajos en Y.
• Una correlación de 0 se interpreta como la no existencia de una relación
lineal entre las dos variables estudiadas.
Usos del coeficiente de Pearson
• Permite predecir el valor de un valor dado
determinado de la otra variable
• Se trata de valorar la asociación de dos
variables cuantitativas estudiando el método
conocido como correlación
• Consiste en la posibilidad de calcular su
distribución muestral y asi poder determinar
su error típico de estimación
Desventajas y ventajas del coeficiente
de correlación de Pearson
• Ventajas
• El valor del coeficientes de correlación es independiente de
cualquier unidad usada para medir variables
• Mientras mas grande sea la muestra mas exacta se la estimación
• Desventajas
• Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la de distribución de ambas sea
semejante a la de la curva
• Requiere supuestos acerca de la naturaleza o formas de
poblaciones afectadas
Ejercicio de Pearson
• Se va investigar si el rendimiento obtenido en la asignatura Medicina
Interna, tiende a repetirse en otras cuatro asignaturas (Cirugía General,
Ginecología y Obstetricia, Pediatría y Anatomía Patológica). En este
estudio se utilizó las calificaciones definitivas en Medicina Interna del
ejercicio anterior con los registros de las calificaciones de cada una de las
asignaturas nombradas. Determinar la asociación entre los pares en total
cuatro correlaciones.
Tabla1: Calificaciones de la
asignatura Medicina Interna,
Cirugía General, Ginecología y
Obstetricia, Pediatría, y Anatomía
Patológica:
Ejercicio de Pearson
• Una vez ingresados todos los datos en el Programa SPSS, con los siguientes, se
obtuvo el siguiente resultado:
• Conclusión:1.-La asignatura medicina Interna se correlacionó positivamente con
las calificaciones de la asignatura cirugía general por lo cual las mayores
calificaciones en medicina Interna se asocian con un buen rendimiento académico
en la asignatura cirugía general.
• r=0.599; p=0.000
Ejercicio de Pearson
• 2.-La asignatura medicina Interna no se correlacionó con las calificaciones de la
asignatura ginecología y obstetricia es decir, no hubo asociación entre las mayores
calificaciones en medicina interna con el alto o bajo rendimiento académico en la
asignatura ginecología y obstetricia.
r=0.24 p=0.156
• 3.-La asignatura Medicina Interna no se correlacionó (prácticamente nula) con las
calificaciones de la asignatura pediatría es decir las calificaciones en Medicina
Internan predicen en este grupo de estudiantes el alto o bajo rendimiento
académico en la asignatura Pediatría.
r=0.096 p=0.156
• 4.-La asignatura medicina interna se correlacionó positivamente con las
calificaciones de la asignatura anatomía patológica es decir, las mayores
calificaciones en medicina interna se asoció con un buen rendimiento académico
en la asignatura anatomía patológica.
r=0.365 p=0.034
Correlación de Spearman
• el coeficiente de correlación de Spearman, ρ (rho) es una medida de la
correlación (la asociación o interdependencia) entre dos variables aleatorias
continuas. Para calcular ρ, los datos son ordenados y reemplazados por su
respectivo orden.
El estadístico ρ viene dado por la expresión:
• Donde D es la diferencia entre los correspondientes estadísticos de orden de x
- y. N es el número de parejas.
• Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
• Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
• La interpretación de coeficiente de Spearman es igual que la del coeficiente de
correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero, significa no correlación pero no
independencia
Correlación de Spearman
• El valor del coeficiente puede variar de -1 a +1. Mientras
mayor sea el valor absoluto del coeficiente, más fuerte será la
relación lineal entre las variables. Un valor absoluto de 1
indica una relación perfecta y un valor de cero indica ausencia
de relación. El hecho de que un valor intermedio se interprete
como débil, moderado o fuerte depende de sus metas y
requisitos.
Usos de la correlación de Spearman
• Para aplicar la correlación de Spearman se
requiere que las variables estén medidas al
menos en la escala ordinal , es decir de forma
que las puntaciones que las representan puedan
ser colocadas en dos series ordenadas.
• A veces este coeficiente es denominado por la
letra griega (rho) aunque cuando nos situamos en
el contexto de la estadística descriptiva se
emplea la notación RS
Desventajas y ventajas del método de
correlación de Spearman
• Desventajas
• Es recomendable usarlo cuando los datos presentan valores extremos , ya
que dichos valores afectan mucho el coeficiente de correlación de Pearson
, o ante distribuciones no normales.
• R no debe ser utilizado para decir algo sobre la relación causa y efecto
• Ventajas
• No es afectadas por los cambios en las unidades de medida.
• Al ser una técnica que no tiene parámetros , es libre de distribución
probabilística
Ejercicio de Spearman
La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en
las asignaturas de Matemática y Estadística. Calcular el coeficiente de
correlación por rangos de Spearman y realizar el diagrama de dispersión.
Ejercicio de Spearman
• Solución:
• Para calcular el coeficiente de correlación por rangos de Spearman se procede a clasificar u ordenar los datos en
rangos (X para Matemática y Y para Estadística) tomando en cuenta las siguientes observaciones:
• En la asignatura de Matemática se observa:
• - Dyana tiene la más alta calificación, ocupando el primer puesto, por lo que su rango es 1
• - Elizabeth ocupa el segundo puesto, por lo que su rango es 2
• - Mario se encuentra ubicado en el tercer lugar, por lo que su rango es 3
• - Orlando y Mathías ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmética de 4 y 5 que da
por resultado 4,5
• - Josué y Anita ocupan el sexto y séptimo lugar, por lo que su rango es la media aritmética de 6 y 7 que da por
resultado 6,5
• - Lucía se encuentra ubicada en el octavo lugar, por lo que su rango es 8
• En la asignatura de Estadística se observa:
• - Mario tiene la más alta calificación, ocupando el primer puesto, por lo que su rango es 1
• - Orlando y Lucía ocupan el segundo y tercer puesto, por lo que su rango es la media aritmética de 2 y 3 que da
por resultado 2,5
• - Dyana y Mathías ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmética de 4 y 5 que da por
resultado 4,5
• - Josué se encuentra ubicado en el sexto lugar, por lo que su rango es 6
• - Elizabeth y Anita ocupan el séptimo y octavo lugar, por lo que su rango es la media aritmética de 7 y 8 que da por
resultado 7,5
Ejercicio de Spearman
• Los rangos X y Y se presentan en la
siguiente tabla:
• Aplicando la fórmula se obtiene:
Ejercicio de Spearman
• Por lo tanto existe una correlación positiva muy baja
• El diagrama de dispersión hecho en Graph se muestra
en la siguiente figura:
Webgrafia
• espanol.yahoo.com
• www.wikipedia.org
• www.monografias.com

Pearson y spearman Estadistica

  • 1.
    Republica Bolivariana deVenezuela Ministerio Del Poder Popular para la Educacion Superior I.U.P. «Santiago Mariño» Coeficientes de correlación De Pearson y Spearman Profesor : Ramón Aray Bachiller: Manuel Chivico C.I.:25.428.384
  • 2.
    Coeficiente de correlaciónde Pearson • El coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. • De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
  • 3.
    Coeficiente de correlaciónde Pearson • En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra P(x) , Y` siendo la expresión que nos permite calcularlo. Donde De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado como Rxy a:
  • 4.
    Interpretación del coeficiente intelectualde Pearson • El valor del índice de correlación varía en el intervalo [-1,1]: • Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante. • Si 0 < r < 1, existe una correlación positiva. • Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables. • Si -1 < r < 0, existe una correlación negativa. • Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.
  • 5.
    Correlación de Pearson •Una correlación de +1 significa que existe una relación lineal directa perfecta (positiva) entre las dos variables. Es decir, las puntuaciones bajas de la primera variable (X) se asocian con las puntuaciones bajas de la segunda variable (Y), mientras las puntuaciones altas de X se asocian con los valores altos de la variable Y.
  • 6.
    Correlación de Pearson •Una correlación de -1 significa que existe una relación lineal inversa perfecta (negativa) entre las dos variables. Lo que significa que las puntuaciones bajas en X se asocian con los valores altos en Y, mientras las puntuaciones altas en X se asocian con los valores bajos en Y. • Una correlación de 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas.
  • 7.
    Usos del coeficientede Pearson • Permite predecir el valor de un valor dado determinado de la otra variable • Se trata de valorar la asociación de dos variables cuantitativas estudiando el método conocido como correlación • Consiste en la posibilidad de calcular su distribución muestral y asi poder determinar su error típico de estimación
  • 8.
    Desventajas y ventajasdel coeficiente de correlación de Pearson • Ventajas • El valor del coeficientes de correlación es independiente de cualquier unidad usada para medir variables • Mientras mas grande sea la muestra mas exacta se la estimación • Desventajas • Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la de distribución de ambas sea semejante a la de la curva • Requiere supuestos acerca de la naturaleza o formas de poblaciones afectadas
  • 9.
    Ejercicio de Pearson •Se va investigar si el rendimiento obtenido en la asignatura Medicina Interna, tiende a repetirse en otras cuatro asignaturas (Cirugía General, Ginecología y Obstetricia, Pediatría y Anatomía Patológica). En este estudio se utilizó las calificaciones definitivas en Medicina Interna del ejercicio anterior con los registros de las calificaciones de cada una de las asignaturas nombradas. Determinar la asociación entre los pares en total cuatro correlaciones. Tabla1: Calificaciones de la asignatura Medicina Interna, Cirugía General, Ginecología y Obstetricia, Pediatría, y Anatomía Patológica:
  • 10.
    Ejercicio de Pearson •Una vez ingresados todos los datos en el Programa SPSS, con los siguientes, se obtuvo el siguiente resultado: • Conclusión:1.-La asignatura medicina Interna se correlacionó positivamente con las calificaciones de la asignatura cirugía general por lo cual las mayores calificaciones en medicina Interna se asocian con un buen rendimiento académico en la asignatura cirugía general. • r=0.599; p=0.000
  • 11.
    Ejercicio de Pearson •2.-La asignatura medicina Interna no se correlacionó con las calificaciones de la asignatura ginecología y obstetricia es decir, no hubo asociación entre las mayores calificaciones en medicina interna con el alto o bajo rendimiento académico en la asignatura ginecología y obstetricia. r=0.24 p=0.156 • 3.-La asignatura Medicina Interna no se correlacionó (prácticamente nula) con las calificaciones de la asignatura pediatría es decir las calificaciones en Medicina Internan predicen en este grupo de estudiantes el alto o bajo rendimiento académico en la asignatura Pediatría. r=0.096 p=0.156 • 4.-La asignatura medicina interna se correlacionó positivamente con las calificaciones de la asignatura anatomía patológica es decir, las mayores calificaciones en medicina interna se asoció con un buen rendimiento académico en la asignatura anatomía patológica. r=0.365 p=0.034
  • 12.
    Correlación de Spearman •el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden. El estadístico ρ viene dado por la expresión: • Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas. • Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia • Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student • La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia
  • 13.
    Correlación de Spearman •El valor del coeficiente puede variar de -1 a +1. Mientras mayor sea el valor absoluto del coeficiente, más fuerte será la relación lineal entre las variables. Un valor absoluto de 1 indica una relación perfecta y un valor de cero indica ausencia de relación. El hecho de que un valor intermedio se interprete como débil, moderado o fuerte depende de sus metas y requisitos.
  • 14.
    Usos de lacorrelación de Spearman • Para aplicar la correlación de Spearman se requiere que las variables estén medidas al menos en la escala ordinal , es decir de forma que las puntaciones que las representan puedan ser colocadas en dos series ordenadas. • A veces este coeficiente es denominado por la letra griega (rho) aunque cuando nos situamos en el contexto de la estadística descriptiva se emplea la notación RS
  • 15.
    Desventajas y ventajasdel método de correlación de Spearman • Desventajas • Es recomendable usarlo cuando los datos presentan valores extremos , ya que dichos valores afectan mucho el coeficiente de correlación de Pearson , o ante distribuciones no normales. • R no debe ser utilizado para decir algo sobre la relación causa y efecto • Ventajas • No es afectadas por los cambios en las unidades de medida. • Al ser una técnica que no tiene parámetros , es libre de distribución probabilística
  • 16.
    Ejercicio de Spearman Lasiguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las asignaturas de Matemática y Estadística. Calcular el coeficiente de correlación por rangos de Spearman y realizar el diagrama de dispersión.
  • 17.
    Ejercicio de Spearman •Solución: • Para calcular el coeficiente de correlación por rangos de Spearman se procede a clasificar u ordenar los datos en rangos (X para Matemática y Y para Estadística) tomando en cuenta las siguientes observaciones: • En la asignatura de Matemática se observa: • - Dyana tiene la más alta calificación, ocupando el primer puesto, por lo que su rango es 1 • - Elizabeth ocupa el segundo puesto, por lo que su rango es 2 • - Mario se encuentra ubicado en el tercer lugar, por lo que su rango es 3 • - Orlando y Mathías ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmética de 4 y 5 que da por resultado 4,5 • - Josué y Anita ocupan el sexto y séptimo lugar, por lo que su rango es la media aritmética de 6 y 7 que da por resultado 6,5 • - Lucía se encuentra ubicada en el octavo lugar, por lo que su rango es 8 • En la asignatura de Estadística se observa: • - Mario tiene la más alta calificación, ocupando el primer puesto, por lo que su rango es 1 • - Orlando y Lucía ocupan el segundo y tercer puesto, por lo que su rango es la media aritmética de 2 y 3 que da por resultado 2,5 • - Dyana y Mathías ocupan el cuarto y quinto puesto, por lo que su rango es la media aritmética de 4 y 5 que da por resultado 4,5 • - Josué se encuentra ubicado en el sexto lugar, por lo que su rango es 6 • - Elizabeth y Anita ocupan el séptimo y octavo lugar, por lo que su rango es la media aritmética de 7 y 8 que da por resultado 7,5
  • 18.
    Ejercicio de Spearman •Los rangos X y Y se presentan en la siguiente tabla: • Aplicando la fórmula se obtiene:
  • 19.
    Ejercicio de Spearman •Por lo tanto existe una correlación positiva muy baja • El diagrama de dispersión hecho en Graph se muestra en la siguiente figura:
  • 20.