Introducción
Es una medidaque indica la fuerza y la dirección de una relación lineal entre dos
variables cuantitativas. En otras palabras, te dice hasta qué punto dos conjuntos
de datos varían juntos de manera consistente.
¿Qué es la correlación?
Relación, no causalidad: La correlación no implica causalidad. Que dos variables
estén correlacionadas significa que tienden a moverse juntas, pero no
necesariamente que una cause la otra. Podría haber otros factores en juego o
simplemente ser una coincidencia.
A MAYOR HORAS DE ESTUDIO MEJOR CALIFICACIÓN
VARIABLE 1 VARIABLE 2
3.
Fuerza de larelación: La fuerza de la correlación se mide mediante un valor
llamado coeficiente de correlación, que generalmente se representa con la letra
'r' (para muestras) o la letra griega 'ρ' (rho, para poblaciones). Este coeficiente
varía entre -1 y +1:
Cercano a +1: Indica una correlación positiva fuerte. A medida que una
variable aumenta, la otra también tiende a aumentar de manera consistente.
Cercano a -1: Indica una correlación negativa fuerte. A medida que una
variable aumenta, la otra tiende a disminuir de manera consistente.
Cercano a 0: Indica una correlación débil o nula. No hay una tendencia
lineal clara entre las dos variables.
Introducción
A MAYOR HORAS DE ESTUDIO MEJOR CALIFICACIÓN
VARIABLE 1 VARIABLE 2
4.
A MAYOR HORASDE ESTUDIO MEJOR CALIFICACIÓN
Dirección de la relación: El signo del coeficiente de correlación indica la
dirección de la relación:
Positivo (+): Las variables se mueven en la misma dirección.
Negativo (-): Las variables se mueven en direcciones opuestas.
Introducción
¿CÓMO SE CALCULA? Existen diferentes métodos para calcular la correlación,
siendo el coeficiente de correlación de Pearson el más común para variables
cuantitativas.
Horas de estudio semanales: Calificación numérica:
“Más estudio se asocia
con mejor calificación.” PEARSON
5.
Spearman Pearson
Tipos dedatos
Variables ordinales o cuantitavias que no cumplan con
los supuestos necesarios para la prueba de Pearson.
Variables cuantitativas continuas con escalas de
intervalo o razon.
Naturaleza de la
relacion
Evalua la fuerza y direccion de una relacion
monotonica.
Mide la fuerza y direccion de una relacion lineal
entre 2 variables.
Supuestos No requiere supuestos de distribucion especificos.
Basado en las covarianzas y desviaciones
estándar de las variables
Calculo Se basa en los rangos de los datos.
Utiliza las covarianzas y las desviaciones
estandar de 2 variables.
Sensibilidad a
Outliers
Es menos sensible a los outliers por trabajar con
rangos.
Es más sensible a los valores atipicos (outliers)
por trabajar con los valores reales de los datos..
Utilidad
Cuando tus datos son ordinales, cuando sospechas que
la relación no es lineal pero sí monotónica, o cuando
los datos cuantitativos no cumplen con los supuestos
necesarios para la prueba de Pearson.
Cuando esperas una relación lineal entre dos
variables cuantitativas que cumplen con los
supuestos de normalidad.
Diferencias entre Spearman y
Pearson
Una relación monotónica
significa que a medida que una
variable aumenta, la otra tiende a
aumentar o disminuir de manera
consistente
Los outliers son los valores
atipicos los cuales son valores
fuera de lugar o desviados.
6.
Coeficientes de correlaciónde Pearson
Oscila entre -1 y +1
Valor menor a 0: Indica que existe una
correlación negativa.
Cuánto más se acerca a -1, mayor es la fuerza
de esa relación invertida.
Cuando es exactamente -1, eso significa que
tienen una correlación negativa perfecta.
Valor mayor que 0: Indica que existe una
correlación positiva.
Cuánto más cerca de +1, más alta es su
asociación.
Un valor exacto de +1 indicaría una relación
lineal positiva perfecta.
Un correlación de 0 o aproximada, indica
que no hay relación lineal entre las dos
variables.
7.
Ejemplo
Los dos gráficosmuestran relaciones lineales entre dos variables. La primera tiene
un coeficiente de correlación de +1, indicando una relación lineal perfecta y positiva.
La segunda tiene un coeficiente de correlación de -1, indicando también una
relación lineal total, pero negativa, de sentido inverso.
8.
En el primerode los dos siguientes ejemplos podemos comprobar que la nube de puntos
está bastante más dispersa, con un coeficiente de correlación de -0,31. Intuitivamente nos
damos cuenta de que la correlación es baja, a pesar de que se apunta una ligera tendencia
de correlación negativa. En el caso de la derecha, la dispersión es total y se ve
perfectamente que se trata de dos variables no correlacionadas. Su coeficiente, valor “r”
es de -0,05.
Ejemplo
9.
Entre 0 y0,10: correlación inexistente
Entre 0,10 y 0,29: correlación débil
Entre 0,30 y 0,50: correlación moderada
Entre 0,50 y 1,00: correlación fuerte
Coeficientes de correlación de Pearson
Criterios
10.
Ejemplo 1: Correlaciónde Spearman
Corredor Posición final Tiempo(Segundos)
A
B
C
D
E
1º
2º
3º
4º
5º
50
53
58
62
65
Observar si hay relación entre la posición final en una carrera y el tiempo que
cada participante tardó.
11.
Asignar rangos:
Posición: 1a 5 (ordinal).
Tiempo: se ordena de menor a mayor y también se asignan rangos del
1 al 5.
Calcular las diferencias de rangos
Como los rangos coinciden(Los corredores que llegaron en mejor posición
1º, 2º, 3º... también tuvieron menos tiempo 50s, 53s, 58s..., en ese mismo
orden)todas las diferencias son 0.
Aplicar la fórmula de Spearman
Resultado esperado
Correlación perfecta positiva (ρ=1)
Interpretación: A mejor posición (1°), menor tiempo (más rápido). Los
rangos suben o bajan de manera paralela.
12.
Ejemplo 2:Correlación deKendall
Cliente Satisfacción
Probabilidad de
recomendar
A
B
C
D
E
Muy satisfecho (5)
Satisfecho (4)
Neutral (3)
Insatisfecho (2)
Muy insatisfecho (1)
Muy alta (5)
Alta (4)
Media (3)
Baja (2)
Muy baja (1)
Queremos analizar si el nivel de satisfacción de un cliente se relaciona con su
probabilidad de recomendar un producto.
13.
Asignamos rangos ordinalesa ambas variables
(ya están asignados como del 1 al 5).
Contamos pares concordantes y discordantes
Concordante: si un cliente con mayor satisfacción también tiene
mayor probabilidad de recomendar.
Discordante: si no coinciden los órdenes.
Aplicamos fórmula de Kendall (τ):
τ=N° de pares concordantes)−(N° de pares discordantes)
________________________________________________________________
Total de pares posiblrs
En este caso, todos los pares son concordantes → τ = 1
Resultado esperado
Correlación de Kendall = 1, relación positiva perfecta entre satisfacción y
recomendación.
14.
¿Cuáles son lasdiferencias entre los coeficientes de correlación de Pearson y Spearman? (2024, 17 mayo).
www.linkedin.com. https://es.linkedin.com/advice/0/what-differences-between-pearson-spearman-correlation-
ynykc?lang=es&lang=es
MarianyelisMendoza. (2015, 7 julio). Correlacion de Pearson y Spearman [Diapositivas]. SlideShare.
https://es.slideshare.net/MarianyelisMendoza/correlacion-de-pearson-y-spearman-50275209
Una comparación de los métodos de correlación de Pearson y Spearman - Minitab. (2024). (C) Minitab, LLC. All
Rights Reserved. 2024. https://support.minitab.com/es-mx/minitab/help-and-how-to/statistics/basic-
statistics/supporting-topics/correlation-and-covariance/a-comparison-of-the-pearson-and-spearman-correlation-
methods/#:~:text=Los%20coeficientes%20de%20correlaci%C3%B3n%20de%20Pearson%20solo%20miden%20relac
iones%20lineales,coeficientes%20de%20correlaci%C3%B3n%20sean%200.
¿Qué es el coeficiente de correlación de Pearson? (2019). iMec. Recuperado 20 de abril de 2025, de
https://www.cimec.es/coeficiente-correlacion-pearson/
Referencias
15.
1. ¿Cuál delas siguientes afirmaciones describe mejor una correlación de
Spearman?
a) Evalúa relaciones lineales entre variables continuas.
b) Se basa en los valores reales de las variables.
c) Evalúa relaciones monótonas usando rangos.
d) Solo se aplica a variables nominales.
2. ¿Cuál es una ventaja de la correlación de Spearman frente a la de
Pearson?
a) Es más precisa con variables normales.
b) Es más sensible a valores extremos.
c) No requiere supuestos de distribución específicos.
d) Se usa solo cuando hay causalidad entre variables.
16.
3. ¿Qué valordel coeficiente de correlación indica una correlación positiva
fuerte?
a) 0
b) -0.8
c) 0.2
d) 0.9
4.La correlación de Pearson se basa en los rangos de los datos.
Verdadero o Falso
5. Si tus datos son ordinales y sospechas que la relación entre variables
no es lineal pero sí monotónica, ¿qué tipo de correlación deberías usar y
por qué?