Este documento presenta un seminario sobre el análisis bivariado de variables cuantitativas utilizando R Commander. El seminario examina la relación entre las variables de peso y altura en un conjunto de datos, comprobando primero la normalidad de las variables y luego estudiando el tipo y fuerza de cualquier relación mediante gráficos de dispersión y coeficientes de correlación. Los resultados muestran que las variables de peso y altura no siguen una distribución normal y que no existe una relación fuerte entre ellas.
2. Introducción
En este seminario, continuamos dando un paso más a lo aprendido
anteriormente.
Como ya vimos en el seminario pasado R Commander nos permite
realizar operaciones y conocer si existe relación entre variables y la
fortaleza de esta relación. Esta vez, vamos ha realizarlo pero
referido a variables cuantitativas.
Las pruebas que vamos a aplicar cuando dos variables son
cuantitativas es la Coeficientes de correlación de Pearson y Rho
Spearman pero para ello tenemos que comprobar antes:
Normalidad
Linealidad
4. Recordamos que lo primero que debemos hacer cada vez que entremos en R Commander es siempre:
1º) Establecer el directorio de trabajo (la carpeta de trabajo).
2º) Cargar los datos con los que vamos a trabajar, en este caso, de nuevo trabajamos con “activossalud”.
1º
2º
5. Nosotros queremos saber la existencia de relación entre las variables “peso” y “altura”. Para ello debemos saber
que tipo de test tenemos que utilizar (paramétrico o no paramétrico) debemos comprobar la normalidad de las
variables.
Comenzamos comprobando la normalidad de la variable “peso”: Gráficas Gráfica de comparación de
cuantiles seleccionamos la variable (comprobamos que en estadísticos esté seleccionado la distribución
normal)
6. -3 -2 -1 0 1 2 3
406080100120
norm quantiles
peso
158
259
Tras realizar los pasos anteriores,
nos aparecerá este diagrama de
dispersión de la variable “peso”.
Podemos observar como muchos
puntos de la variable se salen de los
intervalos de confianza (líneas
discontinuas), por tanto, decimos
que esta variable no sigue una
distribución normal.
7. -3 -2 -1 0 1 2 3
1.51.61.71.81.92.0
norm quantiles
altura
259
103
Ahora realizamos de nuevo los
mismos pasos, pero elegimos la
variable “altura”.
Nos aparecerá el diagrama de
dispersión de la izquierda. En él
podemos observar como hay
puntos que se salen de los
intervalos de confianza, por tanto,
decimos que la variable “altura” no
sigue una distribución normal.
En resumen, ninguna de las dos
variables (“peso” y “altura”) sigue
una distribución normal. En este
caso tendremos que utilizar un test
no paramétrico: Rho Spearman.
8. Sabiendo que las variables no siguen una distribución normal, ahora
podemos empezar a estudiar:
1. El tipo de relación (regresión) que hay entre ellas.
2. La fortaleza de dicha relación en caso de que hubiera
(correlación).
9. 1º) ESTUDIO DELTIPO DE RELACIÓN (REGRESIÓN):
Gráficas Diagrama de dispersión… elegimos variables “peso” y “altura”
*En opciones: elegimos “línea de mínimos cuadrados”
10. 40 60 80 100 120
1.51.61.71.81.92.0
peso
altura
Como podemos observar, las
puntuaciones se alejan de la línea
mínimos cuadrados, sobre todo a
medida que aumenta. Por tanto,
decimos que las variables no
están relacionadas.
11. 2º) ESTUDIAMOS LA FUERZA DE LA RELACIÓN EN CASO DE QUE HUBIERA (CORRELACIÓN)
Estadísticos Resúmenes Matriz de correlaciones Elegir las dos variables
* En opciones: marcamos “Coeficiente de Pearson” ya que son variables cuantitativas que no siguen la
distribución normal
12. Tras los datos obtenidos por el Coeficiente de Correlación de Pearson que sería 0’6311292, concluimos que la
fuerza de relación entre nuestras dos variables es positiva débil (coeficiente de Pearson va de 0-1). Según la
escala de fortaleza, se considera que dos variables están relacionadas cuando el valor está por encima de 0’8 y
nuestro valor es menor, así que, nuestras variables “peso” y “altura” no están relacionadas.
COEFICIENTE DE CORRELACIÓN DE PEARSON: