1. Coeficientes de correlación
Pearson y Spearman
Republica Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
I.U.P «Santiago Mariño»
Barcelona, edo. Anzoátegui
Realizado por: Jaimes Garnica Leidy
C.I: 25 921 484
2. Como determinar el uso de los coeficientes de
correlación de Pearson y Sperman
Un coeficiente de correlación, mide el grado de relación o asociación existente
generalmente entre dos variables aleatorias.
Coeficiente de correlación de Pearson
Tiene como objetivo medir la fuerza o grado de asociación entre dos variables
aleatorias cuantitativas que poseen una distribución normal bivariada conjunta. El
coeficiente se define por la siguiente fórmula:
Cuando ρ=+ la relación es directa entre las variables. Si ρ=- la relación es inversa
y si ρ= 0 son independientes. Dicho coeficiente se puede expresar en términos de su
estadístico como:
3. El coeficiente de correlación de Pearson es la media geométrica entre las
pendientes de los modelos de regresión lineal simple Y/X, X/Y así:
donde:
βo = intercepto del modelo.
β1= pendiente del modelo, cambio esperado en y por unidad de cambio en x
Por el método de los mínimos cuadrados ordinarios Ahora Xi = βo ′ + β1 ′ Yi + εi ′
4. • Permite predecir el valor de una variable dado un valor determinado de la otra variable.
• Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método
conocido como correlación. Dicho cálculo es el primer paso para determinar la relación
entre las variables.
• Consiste en la posibilidad de calcular su distribución muestral y así poder determinar
su error típico de estimación.
• Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación
lineal entre 2 variables.
• Reporta un valor de correlación cercano a 1 como un indicador de que existe una
relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1
da como resultado una mayor correlación positiva entre la información.
Usos
5. Ventajas Desventajas
• El valor del coeficiente de correlación
es independiente de cualquier unidad
usada para medir variables.
• Mientras mas grande sea la muestra
mas exacta será la estimación.
• Puede utilizarse para medir el grado de
relación de dos variables siempre y
cuando ambas sean cuantitativas.
• Su magnitud indica el grado de
asociación entre las variables
• Error que se comete para la medida.
• Cuanto mayor número de pares o de
personas es más fiable.
• No refleja cambios en los patrones de
compra conforme pasa el tiempo.
• Requiere supuestos acerca de la
naturaleza o formas de las poblaciones
afectadas
• Requiere que las dos variables hayan
ido medidas hasta un nivel
cuantitativo continuo y que la
distribución de ambas sea semejante a
la de la curva normal.
6. Coeficiente de correlación de Spearman
El coeficiente de correlación de Spearman es un coeficiente no paramétrico
alternativo al coeficiente de correlación de Pearson. Charles Spearman contribuyó al
análisis del factor, a la teoría de la inteligencia, elaboró una prueba de la teoría mental.
Se define el coeficiente de correlación de rangos de Spearman como el coeficiente
de correlación lineal entre los rangos Ri(x) y Ri(y), en la fórmula de Pearson se reemplaza
Xi por Ri(x) y Yi por Ri (y) quedando:
Por lo tanto el coeficiente de correlación de Spearman resulta como:
7. La interpretación de coeficiente de Spearman es igual que la del coeficiente de
correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall
es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una
distribución normal bivariante.
• Para aplicar la correlación de Spearman se requiere que al menos las variables estén
medidas en al menos escala ordinal, es decir, de forma que las puntuaciones que la
representan puedan ser colocadas en dos series ordenadas.
• Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres
o más condiciones, varios individuos son observados en cada una de ellas, y predecimos
que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de
individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que
su habilidad mejorará de intento en intento.
• El coeficiente de correlación de Spearman es recomendable utilizarlo cuando los datos
presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de
correlación de Pearson, o ante distribuciones no normales. No está afectada por los
cambios en las unidades de medida.
Usos
8. • Este coeficiente es una medida de asociación lineal que utiliza los rangos, números de
orden, de cada grupo de sujetos y compara dichos rangos. Existen dos métodos para
calcular el coeficiente de correlación de los rangos: uno, señalado por Spearman y otro,
por Kendall. El r de Spearman llamado también rho de Spearman es más fácil de
calcular que el de Kendall.
Ventajas
• Al ser Spearman una técnica no
paramétrica es libre de distribución
probabilística
• Los supuestos son menos estrictos. Es
robusto a la presencia de outliers (es
decir permite ciertos desvíos del
patrón normal). La manifestación de
una relación causa-efecto es posible
sólo a través de la comprensión de la
relación natural que existe entre las
variable y no debe manifestarse sólo
por la existencia de una fuerte
correlación
Desventajas
• Es recomendable usarlo cuando los
datos presentan valores extremos, ya
que dichos valores afectan mucho el
coeficiente de correlación de Pearson,
o ante distribuciones no normales. r
no debe ser utilizado para decir algo
sobre la relación entre causa y efecto.
9. Ejemplo del Coeficiente de correlación de Pearson
La siguiente tabla representa las notas en Algebra y Física de estudiantes
elegidos al azar:
De los datos se tiene que:
𝑥 = 798 𝑦 = 819 n=10 𝑥𝑦 = 66045 𝑥2
= 64722 𝑦2
= 67675
10. Determine la recta de regresión de y sobre x
Para determinar las constantes, tenemos:
Luego, el sistema de ecuaciones que debemos resolver es el siguiente:
Luego reemplazando en a1 en: se tiene que:
11. Por lo tanto, la ecuación de la recta de regresión de y sobre x es:
Y=29.23 + 0.66x
Determine el centroide ( 𝑥, 𝑦)
Luego el centroide es ( 𝑥, 𝑦) = (79.8, 81.9)
Halle el coeficiente de correlación