República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
I.U.P “Santiago Mariño”.
Sede Barcelona.
Profesor:
Pedro Beltrán.
Bna, Julio del 2016.
El coeficiente de correlación
de Pearson.
 Normalmente denotado como "r", es un valor estadístico que
mide la relación linear entre dos variables. Los rangos de valor
van de +1 a -1, lo que indica una perfecta relación linear positiva
y negativa respectivamente entre ambas variables. El cálculo del
coeficiente de correlación normalmente se realiza
con programas de estadística, como SPSS y SAS, para dar los
valores posibles más precisos en estudios científicos. Su
interpretación y uso varía de acuerdo con el contexto y propósito
del respectivo estudio en donde se calcula.
Instrucciones:
 Identifica el dependiente variable que se probará entre dos observaciones
derivadas independientemente. Uno de los requisitos del coeficiente de
correlación de Pearson es que las dos variables que se comparan deben
observarse o medirse de manera independiente para eliminar cualquier
resultado sesgado.
 Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de
información, el calculo puede ser tedioso. Además de los varios programas
de estadística, muchas calculadoras científicas pueden calcular el valor.
 Reporta un valor de correlación cercano a 0 como un indicador de que no hay
relación linear entre las dos variables. Conforme el coeficiente de correlación
se acerque al 0, los valores se vuelven menos correlacionados, lo que
identifica las variables que no pueden ser relacionadas entre sí.
 Reporta un valor de correlación cercano al 1 como indicador de que existe
una relación linear positiva entre las dos variables. Un valor mayor a cero que
se acerque a 1 da como resultado una mayor correlación positiva entre la
información. Conforme una variable aumenta cierta cantidad, la otra aumenta
en cantidad correspondiente. La interpretación debe determinarse de acuerdo
con el contexto del estudio.
Instrucciones:
 Reporta un valor de correlación cercano a -1 como indicador de que hay
una relación linear negativa entre las dos variables. Conforme el
coeficiente se acerca a -1, las variables se vuelven negativamente más
correlacionadas, lo que indica que conforme una variable aumenta, la
variable disminuye por una cantidad correspondiente. La interpretación,
de nuevo, debe determinarse de acuerdo con el contexto del estudio.
 Interpreta el coeficiente de correlación de acuerdo con el contexto de los
datos particulares. El valor de correlación es esencialmente un valor
arbitrario que debe aplicarse de acuerdo con las variables que se
comparan. Por ejemplo, un valor r de 0.912 indica una relación linear
positiva muy fuerte entre las dos variables. En un estudio donde se
comparan dos variables que normalmente se identifican como
relacionadas, estos resultados dan evidencia de que una variable puede
afectar de manera positiva a la otra, lo que resulta un caso para mayor
investigación entre las dos. Sin embargo, el mismo valor r en un estudio
que compara dos variables donde está probado que tienen una relación
linear positiva puede identificar un error en la información u otros
problemas potenciales en el diseño experimental. Por ello, es importante
entender el contexto de la información cuando se reporta e interpreta el
coeficiente de correlación de Pearson.
Instrucciones:
 Determina la importancia de los resultados. Esto se logra con el uso del
coeficiente de correlación, grados de libertad y una tabla de valores
críticos del coeficiente de correlación. Los grados de libertad se calculan
como el número de las dos observaciones menos 2. Con este valor,
identifica el valor crítico correspondiente en la tabla de correlación para
una prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de
confiabilidad respectivamente. Compara el valor crítico al coeficiente de
correlación previamente calculado. Si el coeficiente de correlación es
mayor, los resultados son importantes.
Dada dos variables, la correlación permite hacer estimaciones del valor de
una de ellas conociendo el valor de la otra variable.
Los coeficientes de correlación son medidas que indican la situación
relativa de los mismos sucesos respecto a las dos variables, es decir, son
la expresión numérica que nos indica el grado de relación existente entre
las 2 variables y en qué medida se relacionan. Son números que varían
entre los límites +1 y -1. Su magnitud indica el grado de asociación entre
las variables; el valor r = 0 indica que no existe relación entre las
variables; los valores ( 1 son indicadores de una correlación perfecta
positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer
o decrecer X, decrece o crece Y).
Para interpretar el coeficiente de correlación utilizamos la
siguiente escala:
Valor Significado
-1 Correlación negativa grande y
perfecta.
-0,9 a -0,99 Correlación negativa muy alta.
-0,7 a -0,89 Correlación negativa alta.
-0,4 a -0,69 Correlación negativa moderada.
-0,2 a -0,39 Correlación negativa baja.
-0,01 a -0,19 Correlación negativa muy baja.
0 Correlación nula.
0,01 a 0,19 Correlación positiva muy baja.
0,2 a 0,39 Correlación positiva baja.
0,4 a 0,69 Correlación positiva moderada.
0,7 a 0,89 Correlación positiva alta.
0,9 a 0,99 Correlación positiva muy alta.
1 Correlación positiva grande y
perfecta.
Para datos no agrupados se calcula aplicando la siguiente
ecuación:
Para datos agrupados, el coeficiente de Correlación de Pearson
se calcula aplicando la siguiente fórmula:
Ejemplo:
El calculo de coeficiente de correlación (r) entre peso y
talla de 20 niños varones se muestra. La covarianza, que en este
ejemplo es el producto de peso (kg) por talla (cm), para que no
tenga dimensión y sea un coeficiente, se divide por la desviación
típica de X (talla) y por la desviación típica de Y (peso) con lo que
obtenemos el coeficiente de correlación de Pearson que en este
caso es de 0.885 e indica una importante correlación entre las
dos variables. Es evidente que el hecho de que la correlación sea
fuerte no implica causalidad.
Si elevamos al cuadrado el coeficiente de correlación
obtendremos el coeficiente de determinación (r2=0.783) que nos
indica que el 78.3% de la variabilidad en el peso se explica por la
talla del niño. Por lo tanto existen otras variables que modifican y
explican la variabilidad del peso de estos niños. La introducción
de más variable con técnicas de análisis multivariado nos
permitirá identificar la importancia de que otras variables pueden
tener sobre el peso.
•Coeficiente de correlación de Spearman.
Es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas. Para calcular ρ,
los datos son ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden
de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación pero no independencia. La tau de Kendall es un
coeficiente de correlación por rangos, inversiones entre dos ordenaciones
de una distribución normal bivariante.
Ejemplo:
Los datos brutos usados en este ejemplo se ven debajo.
CI Horas de tv a la semana.
106 7
86 0
100 28
100 50
99 28
103 28
97 20
113 12
113 7
110 17
El primer paso es ordenar los datos de la primera columna. Se
agregan dos columnas 'orden(i)' y 'orden(t)‘
Para el orden i, se corresponderán con el numero de fila del cuadro,
para 99, orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a
mayor.
Para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de
TV a la semana', para no hacer otro cuadro, la secuencia ordenada
quedaría…
T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }
Para este caso, el orden sería para cada elemento, respectivamente:
orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }
Sin embargo, el valor de orden esta dado por el valor promedio de sus
posiciones, así para:
7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5
28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8
50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10
Después, se crean dos columnas más, una columna "d" que muestra
las diferencias entre las dos columnas de orden y, otra columna "d2".
Esta última es sólo la columna "d" al cuadrado.
Después de realizar todo esto con los datos del ejemplo, se debería
acabar con algo como lo siguiente:
Nótese como el número de orden de los valores que son idénticos es
la media de los números de orden que les corresponderían si no lo
fueran.
CI H.
sem.
Orden (i) Orden (t) d d2
106 7 1 1 0 0
86 0 2 6 4 16
100 28 3 8 5 25
100 50 4.5 10 5.5 30.25
99 28 4.5 8 3.5 12.25
103 28 6 8 2 4
97 20 7 2.5 4.5 20.25
113 12 8 5 3 9
113 7 9.5 2.5 7 49
110 17 9.5 4 5.5 30.25
Los valores de la columna d2 pueden ser sumados para averiguar
El valor de n es 10. Así que esos valores pueden ser sustituidos en la
fórmula.
De lo que resulta
¿Cuándo utilizar la prueba de correlación de rangos de Spearman?
El coeficiente de correlación no debe utilizarse para comparar dos
métodos que intentan medir el mismo evento, como por ejemplo dos
instrumentos que miden la saturación de oxígeno en sangre. El
coeficiente de correlación mide el grado de asociación entre dos
cantidades, pero no mira el nivel de acuerdo o concordancia. Si los
instrumentos de medida miden sistemáticamente cantidades
diferentes uno del otro, la correlación puede ser 1 y su concordancia
ser nula . El coeficiente de correlación de Spearman es recomendable
utilizarlo cuando los datos presentan valores extremos, ya que dichos
valores afectan mucho el coeficiente de correlación de Pearson, o
ante distribuciones no normales. No está afectada por los cambios en
las unidades de medida.
Bibliografía.
http://www.monografias.com/trabajos85/coeficiente-
correlacion-karl-pearson/coeficiente-correlacion-karl-
pearson.shtml
http://www.ehowenespanol.com/coeficiente-
correlacion-pearson-como_84118/
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%
C3%B3n_de_Spearman
http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1
729-519X2009000200017

Correlación PEARSON

  • 1.
    República Bolivariana deVenezuela Ministerio del Poder Popular para la Educación I.U.P “Santiago Mariño”. Sede Barcelona. Profesor: Pedro Beltrán. Bna, Julio del 2016.
  • 2.
    El coeficiente decorrelación de Pearson.  Normalmente denotado como "r", es un valor estadístico que mide la relación linear entre dos variables. Los rangos de valor van de +1 a -1, lo que indica una perfecta relación linear positiva y negativa respectivamente entre ambas variables. El cálculo del coeficiente de correlación normalmente se realiza con programas de estadística, como SPSS y SAS, para dar los valores posibles más precisos en estudios científicos. Su interpretación y uso varía de acuerdo con el contexto y propósito del respectivo estudio en donde se calcula.
  • 3.
    Instrucciones:  Identifica eldependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos del coeficiente de correlación de Pearson es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.  Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de información, el calculo puede ser tedioso. Además de los varios programas de estadística, muchas calculadoras científicas pueden calcular el valor.  Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables. Conforme el coeficiente de correlación se acerque al 0, los valores se vuelven menos correlacionados, lo que identifica las variables que no pueden ser relacionadas entre sí.  Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. Conforme una variable aumenta cierta cantidad, la otra aumenta en cantidad correspondiente. La interpretación debe determinarse de acuerdo con el contexto del estudio.
  • 4.
    Instrucciones:  Reporta unvalor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables. Conforme el coeficiente se acerca a -1, las variables se vuelven negativamente más correlacionadas, lo que indica que conforme una variable aumenta, la variable disminuye por una cantidad correspondiente. La interpretación, de nuevo, debe determinarse de acuerdo con el contexto del estudio.  Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan. Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy fuerte entre las dos variables. En un estudio donde se comparan dos variables que normalmente se identifican como relacionadas, estos resultados dan evidencia de que una variable puede afectar de manera positiva a la otra, lo que resulta un caso para mayor investigación entre las dos. Sin embargo, el mismo valor r en un estudio que compara dos variables donde está probado que tienen una relación linear positiva puede identificar un error en la información u otros problemas potenciales en el diseño experimental. Por ello, es importante entender el contexto de la información cuando se reporta e interpreta el coeficiente de correlación de Pearson.
  • 5.
    Instrucciones:  Determina laimportancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el número de las dos observaciones menos 2. Con este valor, identifica el valor crítico correspondiente en la tabla de correlación para una prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad respectivamente. Compara el valor crítico al coeficiente de correlación previamente calculado. Si el coeficiente de correlación es mayor, los resultados son importantes. Dada dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable. Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites +1 y -1. Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación entre las variables; los valores ( 1 son indicadores de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).
  • 7.
    Para interpretar elcoeficiente de correlación utilizamos la siguiente escala: Valor Significado -1 Correlación negativa grande y perfecta. -0,9 a -0,99 Correlación negativa muy alta. -0,7 a -0,89 Correlación negativa alta. -0,4 a -0,69 Correlación negativa moderada. -0,2 a -0,39 Correlación negativa baja. -0,01 a -0,19 Correlación negativa muy baja. 0 Correlación nula. 0,01 a 0,19 Correlación positiva muy baja. 0,2 a 0,39 Correlación positiva baja. 0,4 a 0,69 Correlación positiva moderada. 0,7 a 0,89 Correlación positiva alta. 0,9 a 0,99 Correlación positiva muy alta. 1 Correlación positiva grande y perfecta.
  • 8.
    Para datos noagrupados se calcula aplicando la siguiente ecuación: Para datos agrupados, el coeficiente de Correlación de Pearson se calcula aplicando la siguiente fórmula:
  • 9.
    Ejemplo: El calculo decoeficiente de correlación (r) entre peso y talla de 20 niños varones se muestra. La covarianza, que en este ejemplo es el producto de peso (kg) por talla (cm), para que no tenga dimensión y sea un coeficiente, se divide por la desviación típica de X (talla) y por la desviación típica de Y (peso) con lo que obtenemos el coeficiente de correlación de Pearson que en este caso es de 0.885 e indica una importante correlación entre las dos variables. Es evidente que el hecho de que la correlación sea fuerte no implica causalidad. Si elevamos al cuadrado el coeficiente de correlación obtendremos el coeficiente de determinación (r2=0.783) que nos indica que el 78.3% de la variabilidad en el peso se explica por la talla del niño. Por lo tanto existen otras variables que modifican y explican la variabilidad del peso de estos niños. La introducción de más variable con técnicas de análisis multivariado nos permitirá identificar la importancia de que otras variables pueden tener sobre el peso.
  • 12.
    •Coeficiente de correlaciónde Spearman. Es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden. El estadístico ρ viene dado por la expresión: donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas. Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
  • 13.
    Ejemplo: Los datos brutosusados en este ejemplo se ven debajo. CI Horas de tv a la semana. 106 7 86 0 100 28 100 50 99 28 103 28 97 20 113 12 113 7 110 17
  • 14.
    El primer pasoes ordenar los datos de la primera columna. Se agregan dos columnas 'orden(i)' y 'orden(t)‘ Para el orden i, se corresponderán con el numero de fila del cuadro, para 99, orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a mayor. Para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de TV a la semana', para no hacer otro cuadro, la secuencia ordenada quedaría… T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 } Para este caso, el orden sería para cada elemento, respectivamente: orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 } Sin embargo, el valor de orden esta dado por el valor promedio de sus posiciones, así para: 7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5 28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8 50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10 Después, se crean dos columnas más, una columna "d" que muestra las diferencias entre las dos columnas de orden y, otra columna "d2". Esta última es sólo la columna "d" al cuadrado.
  • 15.
    Después de realizartodo esto con los datos del ejemplo, se debería acabar con algo como lo siguiente: Nótese como el número de orden de los valores que son idénticos es la media de los números de orden que les corresponderían si no lo fueran. CI H. sem. Orden (i) Orden (t) d d2 106 7 1 1 0 0 86 0 2 6 4 16 100 28 3 8 5 25 100 50 4.5 10 5.5 30.25 99 28 4.5 8 3.5 12.25 103 28 6 8 2 4 97 20 7 2.5 4.5 20.25 113 12 8 5 3 9 113 7 9.5 2.5 7 49 110 17 9.5 4 5.5 30.25
  • 16.
    Los valores dela columna d2 pueden ser sumados para averiguar El valor de n es 10. Así que esos valores pueden ser sustituidos en la fórmula. De lo que resulta ¿Cuándo utilizar la prueba de correlación de rangos de Spearman? El coeficiente de correlación no debe utilizarse para comparar dos métodos que intentan medir el mismo evento, como por ejemplo dos instrumentos que miden la saturación de oxígeno en sangre. El coeficiente de correlación mide el grado de asociación entre dos cantidades, pero no mira el nivel de acuerdo o concordancia. Si los instrumentos de medida miden sistemáticamente cantidades diferentes uno del otro, la correlación puede ser 1 y su concordancia ser nula . El coeficiente de correlación de Spearman es recomendable utilizarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales. No está afectada por los cambios en las unidades de medida.
  • 17.