Este documento describe los pasos para analizar la relación entre dos variables cuantitativas, altura y peso, en un conjunto de datos. Primero, se determina si las variables siguen una distribución normal a través de gráficos y pruebas estadísticas. Luego, se elige la prueba de correlación apropiada (Spearman por no ser normales) y se calculan los coeficientes para medir la fuerza y tipo de relación entre las variables. Los resultados muestran una correlación positiva y buena entre altura y peso.
1. SEMINARIO 8: Análisis
bivariado con variables
cuantitativas.
Normalidad y linealidad.
Diagrama de dispersión.
Coeficientes de correlación de
Pearson y Rho de Spearman
2. Ejercicio:
• Determina si existe relación entre las
variables altura y peso del fichero de
datos “activos en salud” y si existe
determina cómo de fuerte es.
3. 1º ¿Ante qué nos encontramos?
• En primer lugar comprobamos que se trata de
dos variables cuantitativas.
• El ejercicio pide una correlación.
• Por tanto debemos de emplear para
su análisis y relación la
Correlación de Pearson o Rho de Spearman.
• Para averiguar cual de las dos debemos de aplicar hemos de tener en
cuenta una serie de características entre las variables.
• Se trata de un análisis de dos variables, es decir, bivariada.
• Sabiendo que la correlación es el grado o fuerza de relación entre
dos variables.
4. 2º ¿Qué prueba debemos de usar?
• Tenemos que tener en cuenta si se puede usar
una prueba paramétrica o no paramétrica:
PRUEBAS
PARAMÉTRICAS
PRUEBAS NO
PARAMÉTRICAS
Para estimar un parámetro
•con al menos una
variable cuantitativa
• las variables siguen una
distribución normal
–Si se comparan dos
muestras
»Homocedasticidad ó
igualdad de las
varianzas
PEARSON
Cuando los datos se han
recogido con escala
nominal u ordinal
–No implican
suposición de
normalidad
–Son menos sensibles, son
más robustos, que los test
paramétricas
SPEARMAN
5. 2º ¿Qué prueba debemos de usar?
• En definitiva, según si las variables siguen o no
una distribución normal emplearemos una
prueba u otra:
• Si sigue una DISTRIBUCIÓN NORMAL
usaremos PEARSON.
• Si NO sigue una DISTRIBUCIÓN NORMAL
usaremos por tanto SPEARMAN.
6. 3º Comprobar la normalidad de los datos.
• Para ello vamos a emplear dos métodos
diferentes. En este caso ambos para asegurarnos
de que nuestras observaciones son correctas:
• A) MÉTODOS GRÁFICOS (histogramas, Box-
plot y gráfico QQ).
• B) PRUEBAS DE NORMALIDAD (Siendo el test
de Shapiro Wilk el más usado)
7. a) Métodos gráficos: PESO (En R)
GRÁFICO QQ:
Seleccionamos la variable peso Y
DISTRIBUCIÓN NORMAL.
10. a) Métodos gráficos: PESO
• Podemos observar que no sigue
una distribución normal.
Distribución
normal
Distribución del
peso
11. b) Pruebas de normalidad: PESO
No sigue una
distribución normal
12. a) Métodos gráficos: ALTURA
Observamos que tampoco se sigue
una distribución normal
13. b) Pruebas de normalidad: ALTURA
• No sigue una distribución normal.
14. 4º Elegir la prueba en base a lo que
hemos observado
• Ninguna de las variables sigue una distribución
normal, por tanto es NO PARAMÉTRICA y
aplicamos Rho de Spearman.
15. 5º Ver el tipo de relación y cómo de
fuerte es:
• Se trata de ver la regresión (tipo de relación entre
ambas variables) y la
• Correlación ( si existe una relación fuerte y cómo es).
• Para ello:
• A) Estudiamos la linealidad entre las variables.
• B) Obtenemos los coeficientes de correlación.
17. A partir del diagrama obtenido no podemos
determinar que existe relación entre ambas
variables, debemos de obtener los datos
numéricos
No se aprecia con
suficiente
claridad, mejor
comparar con los
resultados
numéricos
19. 6º Interpretar los resultados de la
prueba
• Los valores se sitúan en torno a -1 y 1. Valores cercanos
al -1 nos muestran correlación negativa, los cercanos al
1 positiva; pero los que son igual a 0 no tienen
correlación.
• Hay una correlación buena.
0.622