En estadística, el coeficiente de correlación de Pearson es una medida
de la relación lineal entre dos variables aleatorias cuantitativas. A
diferencia de la covarianza, la correlación de Pearson es independiente
de la escala de medida de las variables.
En el caso de que se esté estudiando
dos variables aleatorias X y Y sobre
una población; el coeficiente de
correlación de Pearson se simboliza
con la letra, siendo la expresión que
nos permite calcularlo:
Un coeficiente de correlación se dice que es
significativo si se puede afirmar, con una cierta
probabilidad, que es diferente de cero. Más
estrictamente, en términos estadísticos, preguntarse
por la significación de un cierto coeficiente de
correlación no es otra cosa que preguntarse por la
probabilidad de que tal coeficiente proceda de una
población cuyo valor sea de cero.
En consecuencia, dado un cierto coeficiente
de correlación rxy obtenido en una
determinada muestra se trata de comprobar
si dicho coeficiente es posible que se
encuentre dentro de la distribución maestral
especificada por la Hipótesis nula
En la perspectiva de Pearson, para establecer el nivel de
significación habría que tener en cuenta algunos aspecto
de que lleven a lugar a errores que conlleven a
investigador tomar como objetos al cual se puedan
minimizar lo mas que se pueda.
Pearson llamo alfa al error que se podría considerar tipo 1
y beta al que se podría tomar en cuenta como error tipo
2,siendo estos quienes introdujeron el “poder de la prueba
estadística”.
Las pruebas mas claras serian las paramétricas y usadas
como la T de student, la prueba F, llamada así en honor de
Fisher y es por esto que es simbolizado con esta letra.
 El valor es independiente de
cualquier unidad usada para medir
variables.
 Mientras mas grande es la muestra,
mas grande es la estimación.
 Requiere supuestos acerca de
la naturaleza o formas de las
poblaciones afectadas.
 Requiere que las dos variables hayan
sido hasta un nivel cuantitativo
continuo y que la división de ambas
sea semejante a la de la curva
normal.
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una
medida de la correlación (la asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados
por su respectivo orden.
Donde D es la diferencia entre los correspondientes estadísticos
de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la
hora de ordenarlos, aunque si éstos son pocos, se puede ignorar
tal circunstancia
El coeficiente de correlación de Spearman es menos sensible
que el de Pearson para los valores muy lejos de lo esperado. En
este ejemplo: Pearson
= 0.30706 Spearman = 0.76270
La aproximación moderna al problema de averiguar si un valor observado de ρ es
significativamente diferente de cero (siempre tendremos -1 ≤ ρ ≤ 1) es calcular la
probabilidad de que sea mayor o igual que el ρ esperado, dada la hipótesis nula, utilizando
un test de permutación. Esta aproximación es casi siempre superior a los métodos
tradicionales, a no ser que el conjunto de datos sea tan grande que la potencia informática
no sea suficiente para generar permutaciones (poco probable con la informática moderna),
o a no ser que sea difícil crear un algoritmo para crear permutaciones que sean lógicas
bajo la hipótesis nula en el caso particular de que se trate (aunque normalmente estos
algoritmos no ofrecen dificultad).
 Una gran ventaja seria que su distribución es muestral por
lo cual se puede calcular su error estándar de estimación.
 No esta afectada por los cambios en las unidades de
medida.
 Es recomendables usarlo cuando los datos
presentan valores extremos, ya que dichos valores
extremos, ya que dichos valores afectan mucho
 Al ser una técnica no paramétrica, es libre de distribución
probabilística.
 Requiere supuestos acerca de la naturaleza o formas de las
poblaciones afectadas.
 Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante
a la curva normal.
 El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los
valores -1 y 1.
 Cuando todos los sujetos se sitúan en el mismo puesto para la variable x y para la variable y,
el valor de Rs ES 1.Si se ocupan de valores opuestos ,es decir; al primer sujeto en x le
corresponde el ultimo lugar en y, el segundo en x le corresponde el penúltimo en Y etc.
Entonces el valor de rs -1.
Una generalización del coeficiente de Spearman es útil en situación en la cual poseemos mas
de tres condiciones, varios individuos cada vez que predecimos las observaciones el orden que
tendrán en particular.
El coeficiente de correlación de rangos de Spearman de utilizarse para series de datos en la
que existan valores extremos, pues si calculamos la correlación de Pearson los resultados se
verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se encuentran entre
los valores de -1 y 1.
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables
son ordinales, es decir, cuando una o ambas escalas de medidas son posiciones.
Ejemplo: orden de llegada en una carrera y peso de los atletas.
Se calcula aplicando:
Nota: Los datos hay que traducirlos y tratar de
ordenarlos en rangos. A los puntajes mas elevados
le asignamos el rango 1 al 2 y el siguiente.
Luego se aplica la siguiente formula:
xi yi Xi,yi xi2 yi2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
Las notas de 12 alumnos en la clase de física y matemática son los siguientes:
Matemáticas Física
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10
Hallar el coeficiente de
relación de la distribución e
interpretarlo.
72 60 431 504 380
 Hallamos las medidas aritméticas  Calculamos la covarianza
 Calculamos las desviaciones
típicas
 Aplicamos la formula de coeficiente de
correlación lineal
Nota: Al ser el coeficiente de
relación positivo, es directo el
coeficiente
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de
Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente de
correlación de Pearson. Oscila entre
-1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlación pero no independencia. La tau de Kenda l es un coeficiente
de correlación por rangos, inversiones entre dos ordenaciones de una distribución
normal bivariante.
 (http://web.archive.org/web/http://www.psico.uniovi.es/Dpto_Psicolo
gia/metodos/tu tor.6/fcope.html) en el Departamento de Psicología de
la Universidad de Oviedo.
 Weisstein, Eric W. «Correlation Coefficient»
(http://mathworld.wolfram.com/CorrelationCoefficient.html). En
 Weisstein, Eric W. MathWorld (en inglés). Wolfram Research.
 https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Sp
earman
 https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pe
arson
 http://www.uv.es/webgid/Descriptiva/31_coeficiente_de_
pearson.html

Coeficiente de pearson y spearman (estadistica)

  • 2.
    En estadística, elcoeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra, siendo la expresión que nos permite calcularlo:
  • 3.
    Un coeficiente decorrelación se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos, preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una población cuyo valor sea de cero. En consecuencia, dado un cierto coeficiente de correlación rxy obtenido en una determinada muestra se trata de comprobar si dicho coeficiente es posible que se encuentre dentro de la distribución maestral especificada por la Hipótesis nula
  • 4.
    En la perspectivade Pearson, para establecer el nivel de significación habría que tener en cuenta algunos aspecto de que lleven a lugar a errores que conlleven a investigador tomar como objetos al cual se puedan minimizar lo mas que se pueda. Pearson llamo alfa al error que se podría considerar tipo 1 y beta al que se podría tomar en cuenta como error tipo 2,siendo estos quienes introdujeron el “poder de la prueba estadística”. Las pruebas mas claras serian las paramétricas y usadas como la T de student, la prueba F, llamada así en honor de Fisher y es por esto que es simbolizado con esta letra.
  • 6.
     El valores independiente de cualquier unidad usada para medir variables.  Mientras mas grande es la muestra, mas grande es la estimación.
  • 7.
     Requiere supuestosacerca de la naturaleza o formas de las poblaciones afectadas.  Requiere que las dos variables hayan sido hasta un nivel cuantitativo continuo y que la división de ambas sea semejante a la de la curva normal.
  • 8.
    En estadística, elcoeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden. Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas. Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este ejemplo: Pearson = 0.30706 Spearman = 0.76270
  • 9.
    La aproximación modernaal problema de averiguar si un valor observado de ρ es significativamente diferente de cero (siempre tendremos -1 ≤ ρ ≤ 1) es calcular la probabilidad de que sea mayor o igual que el ρ esperado, dada la hipótesis nula, utilizando un test de permutación. Esta aproximación es casi siempre superior a los métodos tradicionales, a no ser que el conjunto de datos sea tan grande que la potencia informática no sea suficiente para generar permutaciones (poco probable con la informática moderna), o a no ser que sea difícil crear un algoritmo para crear permutaciones que sean lógicas bajo la hipótesis nula en el caso particular de que se trate (aunque normalmente estos algoritmos no ofrecen dificultad).
  • 10.
     Una granventaja seria que su distribución es muestral por lo cual se puede calcular su error estándar de estimación.  No esta afectada por los cambios en las unidades de medida.  Es recomendables usarlo cuando los datos presentan valores extremos, ya que dichos valores extremos, ya que dichos valores afectan mucho  Al ser una técnica no paramétrica, es libre de distribución probabilística.
  • 11.
     Requiere supuestosacerca de la naturaleza o formas de las poblaciones afectadas.  Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la curva normal.
  • 13.
     El coeficientede correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1.  Cuando todos los sujetos se sitúan en el mismo puesto para la variable x y para la variable y, el valor de Rs ES 1.Si se ocupan de valores opuestos ,es decir; al primer sujeto en x le corresponde el ultimo lugar en y, el segundo en x le corresponde el penúltimo en Y etc. Entonces el valor de rs -1.
  • 14.
    Una generalización delcoeficiente de Spearman es útil en situación en la cual poseemos mas de tres condiciones, varios individuos cada vez que predecimos las observaciones el orden que tendrán en particular. El coeficiente de correlación de rangos de Spearman de utilizarse para series de datos en la que existan valores extremos, pues si calculamos la correlación de Pearson los resultados se verán afectados. La interpretación del resultado del coeficiente de correlación de Spearman se encuentran entre los valores de -1 y 1.
  • 15.
    Este coeficiente seemplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o ambas escalas de medidas son posiciones. Ejemplo: orden de llegada en una carrera y peso de los atletas. Se calcula aplicando: Nota: Los datos hay que traducirlos y tratar de ordenarlos en rangos. A los puntajes mas elevados le asignamos el rango 1 al 2 y el siguiente. Luego se aplica la siguiente formula:
  • 16.
    xi yi Xi,yixi2 yi2 2 1 2 4 1 3 3 9 9 9 4 2 8 16 4 4 4 16 16 16 5 4 20 25 16 6 4 24 36 16 6 6 36 36 36 7 4 28 49 16 7 6 42 49 36 8 7 56 64 49 10 9 90 100 81 10 10 100 100 100 Las notas de 12 alumnos en la clase de física y matemática son los siguientes: Matemáticas Física 2 1 3 3 4 2 4 4 5 4 6 4 6 6 7 4 7 6 8 7 10 9 10 10 Hallar el coeficiente de relación de la distribución e interpretarlo. 72 60 431 504 380
  • 17.
     Hallamos lasmedidas aritméticas  Calculamos la covarianza  Calculamos las desviaciones típicas  Aplicamos la formula de coeficiente de correlación lineal Nota: Al ser el coeficiente de relación positivo, es directo el coeficiente
  • 18.
    Para muestras mayoresde 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kenda l es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
  • 19.
     (http://web.archive.org/web/http://www.psico.uniovi.es/Dpto_Psicolo gia/metodos/tu tor.6/fcope.html)en el Departamento de Psicología de la Universidad de Oviedo.  Weisstein, Eric W. «Correlation Coefficient» (http://mathworld.wolfram.com/CorrelationCoefficient.html). En  Weisstein, Eric W. MathWorld (en inglés). Wolfram Research.  https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Sp earman  https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pe arson  http://www.uv.es/webgid/Descriptiva/31_coeficiente_de_ pearson.html