COEFICIENTES DE
CORRELACION DE PEARSON Y
DE SPEARMAN
YOHEN BRAVO
CI: 12787587
SECCION: MV
•COMO DETERMINAR EL USO DE LOS
COEFICIENTES DE CORRELACION DE
PEARSON Y DE SPEARMAN
En estadística, el coeficiente de
correlación de Spearman, ρ (rho)
es una medida de la correlación (la
asociación o interdependencia)
entre dos variables aleatorias
continuas. Para calcular ρ, los datos
son ordenados y reemplazados por
su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los
correspondientes estadísticos de orden de x -
y.N es el número de parejas.
Se tiene que considerar la existencia de datos
idénticos a la hora de ordenarlos, aunque si éstos
son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones.
podemos utilizar la siguiente aproximación a
la distribución t de Student
La interpretación de coeficiente de Spearman es
igual que la del coeficiente de correlación de
Pearson. Oscila entre -1 y +1, indicándonos
asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación
pero no independencia. La tau de Kendall es un
coeficiente de correlación por rangos, inversiones
entre dos ordenaciones de una distribución normal
bivariante.
•DESVENTAJAS Y VENTAJAS
DE LOS COEFICIENTES DE
CORRELACION DE PEARSON
Y DE SPEARMAN
DESVENTAJAS
• Los coeficientes de correlación más utilizados sólo miden una relación
lineal. Por lo tanto, es perfectamente posible que, si bien existe una
fuerte relación no lineal entre las variables, r está cerca de 0 o igual a 0. En
tal caso, un diagrama de dispersión puede indicar aproximadamente la
existencia o no de una relación no lineal.
• Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría
calcular 'r' entre el número de calzado y la inteligencia de las personas, la
altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo
tanto es llamado correlación de oportunidad o sin sentido.
• 'R' no debe ser utilizado para decir algo sobre la relación entre causa y
efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos concluir
que las variables X e Y están relacionadas. Sin embargo, el mismo valor de
'r no nos dice si X influencia a Y o al revés. La correlación estadística no
debe ser la herramienta principal para estudiar la causalidad, por el
problema con las terceras variables.
VENTAJAS
• El coeficiente de Spearman es no paramétrico, (es decir,
es libre de distribución probabilística). Permite medir la
correlación o asociación entre dos variables cuando las
mediciones se realizan en una escala ordinal, o cuando
no existe distribución normal. Se calcula en base a una
serie de rangos asignados. Los supuestos son menos
estrictos. Es robusto a la presencia de outsiders (es decir
permite ciertos desvíos del patrón normal). La
manifestación de una relación causa-efecto es posible
sólo a través de la comprensión de la relación natural que
existe entre las variable y no debe manifestarse sólo por
la existencia de una fuerte correlación.
APLICAR USOS DE ENFOQUES PEARSON Y SPEARMAN A
PROBLEMAS ESTADISTICOS
• USOS: Para aplicar el coeficiente de correlación de Spearman se
requiere que las variables estén medidas al menos en escala ordinal,
es decir, de forma que las puntuaciones que las representan puedan
ser colocadas en dos series ordenadas. A veces, este coeficiente es
denominado por la letra griega ρs (rho), aunque cuando nos situamos
en el contexto de la Estadística Descriptiva se emplea la notación rs
La fórmula de cálculo para rs puede derivarse de la utilizada en el
caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a
dos series de puntuaciones ordinales, compuestas cada una de ellas
por la n primeros números naturales A partir de un conjunto de n
puntuaciones
• la fórmula que permite el cálculo de la correlación entre dos
variables X e Y, medidas al menos en escala ordinal, es la
siguiente: Donde d es la distancia existente entre los
puestos que ocupan las puntuaciones correspondientes a un
sujeto i cuando estas puntuaciones han sido ordenadas para
X y para Y. El coeficiente de correlación de Spearman se
encuentra siempre comprendido entre los valores -1 y 1. Es
decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el
mismo puesto para la variable X y para la variable Y, el valor
de rs es 1. Si ocupan valores opuestos, es decir, al primer
sujeto en X le corresponde el último lugar en Y, al segundo
en X le corresponde el penúltimo en Y, etc., entonces el valor
de rs es -1.
BIOGRAFIAS
• WIKIPEDIA
• DOCUMENT.MX
• SLIDESHARE

Presentacion pearson y spearman

  • 1.
    COEFICIENTES DE CORRELACION DEPEARSON Y DE SPEARMAN YOHEN BRAVO CI: 12787587 SECCION: MV
  • 2.
    •COMO DETERMINAR ELUSO DE LOS COEFICIENTES DE CORRELACION DE PEARSON Y DE SPEARMAN
  • 3.
    En estadística, elcoeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.
  • 4.
    El estadístico ρviene dado por la expresión: donde D es la diferencia entre los correspondientes estadísticos de orden de x - y.N es el número de parejas. Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia Para muestras mayores de 20 observaciones.
  • 5.
    podemos utilizar lasiguiente aproximación a la distribución t de Student La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
  • 6.
    •DESVENTAJAS Y VENTAJAS DELOS COEFICIENTES DE CORRELACION DE PEARSON Y DE SPEARMAN
  • 7.
    DESVENTAJAS • Los coeficientesde correlación más utilizados sólo miden una relación lineal. Por lo tanto, es perfectamente posible que, si bien existe una fuerte relación no lineal entre las variables, r está cerca de 0 o igual a 0. En tal caso, un diagrama de dispersión puede indicar aproximadamente la existencia o no de una relación no lineal. • Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría calcular 'r' entre el número de calzado y la inteligencia de las personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlación de oportunidad o sin sentido. • 'R' no debe ser utilizado para decir algo sobre la relación entre causa y efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos concluir que las variables X e Y están relacionadas. Sin embargo, el mismo valor de 'r no nos dice si X influencia a Y o al revés. La correlación estadística no debe ser la herramienta principal para estudiar la causalidad, por el problema con las terceras variables.
  • 8.
    VENTAJAS • El coeficientede Spearman es no paramétrico, (es decir, es libre de distribución probabilística). Permite medir la correlación o asociación entre dos variables cuando las mediciones se realizan en una escala ordinal, o cuando no existe distribución normal. Se calcula en base a una serie de rangos asignados. Los supuestos son menos estrictos. Es robusto a la presencia de outsiders (es decir permite ciertos desvíos del patrón normal). La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación.
  • 9.
    APLICAR USOS DEENFOQUES PEARSON Y SPEARMAN A PROBLEMAS ESTADISTICOS • USOS: Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas. A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n primeros números naturales A partir de un conjunto de n puntuaciones
  • 10.
    • la fórmulaque permite el cálculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente: Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y. El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.
  • 11.