El documento explica el coeficiente de correlación de Pearson y Spearman. El coeficiente de Pearson mide la relación lineal entre dos variables cuantitativas, calculando la covarianza dividida por las desviaciones estándar. El coeficiente de Spearman se usa para variables ordinales, ordenando los datos y reemplazando por su orden. Ambos coeficientes oscilan entre -1 y 1, indicando correlaciones negativas o positivas.
2. Coeficiente De
Correlacion De Pearson
Es un índice estadístico que mide la relación lineal entre dos
variables cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de
medida de las variables. El cálculo del coeficiente de
correlación lineal se realiza dividiendo la covarianza por el
producto de las desviaciones estándar de ambas variables:
r=Sxy
Sx.Sy
3. Permite predecir el valor de una variable dado un valor
determinado de la otra variable. Se trata de valorar la asociación
entre dos variables cuantitativas estudiando el método conocido
como correlación. Dicho cálculo es el primer paso para determinar
la relación entre las variables.
Nota : Si dos variables son independiente estarán
incorrelacionadas aunque el resultado recíproco no es
necesariamente cierto.
4. Si r > 0 Hay correlación positiva: las dos variables se
correlacionan en sentido directo. A valores altos de una le
corresponden valores altos de la otra e igualmente con los
valores bajos. Cuánto más próximo a +1 esté el coeficiente
de correlación más patente será esta covariación.
5. Si r < 0 Hay correlación negativa : las dos variables se
correlacionan en sentido inverso. A valores altos de una de
ellas le suelen corresponder valor bajos de la otra y
viceversa. Cuánto más próximo a -1 esté el coeficiente de
correlación más patente será esta covariación extrema.
6. Pasos Para El Calculo
Halamos la media aritmética
Calculamos la covarianza
Calculamos la desviación típica
Aplicamos la formula del coeficiente de correlación
lineal.
7. Uso Del Coeficiente De
Correlación De Pearson
Identifica el dependiente variable que se probará entre dos
observaciones derivadas independientemente. Uno de los requisitos
es que las dos variables que se comparan deben observarse o
medirse de manera independiente para eliminar cualquier resultado
sesgado.
Para cantidades grandes de información, el calculo puede ser
tedioso.
Reporta un valor de correlación cercano a 0 como un indicador de
que no hay relación linear entre las dos variables.
Reporta un valor de correlación cercano al 1 como indicador de que
existe una relación linear positiva entre las dos variables. Un valor
mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información.
8. Uso Del Coeficiente De
Correlación De Pearson
Reporta un valor de correlación cercano a -1 como indicador de que
hay una relación linear negativa entre las dos variables.
Interpreta el coeficiente de correlación de acuerdo con el contexto
de los datos particulares. El valor de correlación es esencialmente
un valor arbitrario que debe aplicarse de acuerdo con las variables
que se comparan.
Determina la importancia de los resultados. Esto se logra con el uso
del coeficiente de correlación, grados de libertad y una tabla de
valores críticos del coeficiente de correlación. Los grados de libertad
se calculan como el número de las dos observaciones menos 2.
9. Ventaja y Desventajas
Ventajas Desventajas
Cuando en el fenómeno
estudiado las dos variables son
cuantitativas se usa el
coeficiente de correlaciones de
Pearson.
Dada dos variables, permite
hacer estimaciones del valor de
una de ellas conociendo el
valor de la otra variable
El coeficiente de Pearson es
paramétrico
Permite medir la correlación o
asociación entre dos variables
cuando se trabaja con variables
numéricas con distribución
normal.
El valor 0 representa falta de
correlación.
El valor 0 representa falta de
correlación.
En cambio una correlación
nula no implica la
independencia de variables.
Conforme el coeficiente de
correlación se acerque al 0, los
valores se vuelven menos
correlacionados, lo que
identifica las variables que no
pueden ser relacionadas entre
sí.
10. Aplicar usos de enfoques Pearson
a problemas estadísticos
Identifica el dependiente variable que se probará entre dos observaciones
derivadas independientemente
Uno de los requisitos es que las dos variables que se comparan deben
observarse o medirse de manera independiente para eliminar cualquier
resultado sesgado
Para cantidades grandes de información, el calculo puede ser tedioso
Reporta un valor de correlación cercano a 0 como un indicador de que no
hay relación linear entre las dos variables.
Reporta un valor de correlación cercano al 1 como indicador de que existe
una relación linear positiva entre las dos variables.
Un valor mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información.
Reporta un valor de correlación cercano a -1 como indicador de que hay una
relación linear negativa entre las dos variables.
Interpreta el coeficiente de correlación de acuerdo con el contexto de los
datos particulares.
11. Coeficiente De Correlacion
De Spearman
el coeficiente de correlación de Spearman, ρ (rho) es una medida de la
correlación (la asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son ordenados y
reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos
de orden de x - y.N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora
de ordenarlos, aunque si éstos son pocos, se puede ignorar tal
circunstancia
12. Coeficiente De
Correlacion De Spearman
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente de
correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones
negativas o positivas respectivamente, 0 cero, significa no correlación pero no
independencia. La tau de Kendall es un coeficiente de correlación por rangos,
inversiones entre dos ordenaciones de una distribución normal bivariante.
13. Uso Del Coeficiente De
Correlación De Spearman
Para aplicar la correlación de Spearman se requiere que al menos las
variables estén medidas en al menos escala ordinal, es decir, de forma que
las puntuaciones que la representan puedan ser colocadas en dos series
ordenadas.
Una generalización del coeficiente de Spearman es útil en la situación en la
cual hay tres o más condiciones, varios individuos son observados en cada
una de ellas, y predecimos que las observaciones tendrán un orden en
particular. Por ejemplo, un conjunto de individuos pueden tener tres
oportunidades para intentar cierta tarea, y predecimos que su habilidad
mejorará de intento en intento.
La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de
rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de
puntuaciones ordinales, compuestas cada una de ellas por los n primeros
números naturales.
14. Propiedades del coeficiente
de correlación de Spearman
Cuando todos los sujetos se sitúan en el mismo puesto para la
variable X y para la variable Y, el valor de rs es 1. Si ocupan valores
opuestos, es decir, al primer sujeto en X le corresponde el último
lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc.,
entonces el valor de rs es -1.
Si calculamos el coeficiente de correlación de Pearson entre dos
variables X e Y, y el coeficiente de correlación de Spearman para
las mismas puntuaciones pero transformadas en rangos, ambos
coeficientes se aproximan en valor según aumenta el número de
sujetos n.
15. Ventaja y Desventaja
La manifestación de una relación
causa-efecto es posible sólo a través
de la comprensión de la relación
natural que existe entre las variable
y no debe manifestarse sólo por la
existencia de una fuerte
correlación (1, 5).
Al ser Spearman una técnica no
paramétrica es libre de
distribución probabilística (2, 5,
9). 2. Los supuestos son menos
estrictos.
La tau de Kendall es un coeficiente
de correlación por rangos,
inversiones entre dos ordenaciones
de una distribución normal
bivariante. Aplicar usos de
enfoques Pearson y enfoque
Sperman a problemas estadísticos.
Hay que tener cuidado al
interpretar el valor de 'r'. Por
ejemplo, se podría calcular 'r' entre
el número de calzado y la
inteligencia de las personas, la
altura y los ingresos. Cualquiera
sea el valor de 'r', no tiene sentido y
por lo tanto es llamado correlación
de oportunidad o sin sentido.
16. Aplicar usos de enfoques
Spearman a problemas
estadísticos
Para aplicar el coeficiente de correlación de Spearman se requiere que las variables
estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones
que las representan puedan ser colocadas en dos series ordenadas. A veces, este
coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos
situamos en el contexto de la Estadística Descriptiva se emplea la notación rs La
fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy;
bastaría aplicar el coeficiente de correlación de Pearson a dos series de
puntuaciones ordinales, compuestas cada una de ellas por la n primeros números
naturales.
A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la
correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la
siguiente: Donde d es la distancia existente entre los puestos que ocupan las
puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido
ordenadas para X y para Y. El coeficiente de correlación de Spearman se encuentra
siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los
sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor
de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde
el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc.,
entonces el valor de rs es -1.w