Este documento describe los pasos para determinar si existe una relación entre las variables "altura" y "peso" y cuán fuerte es dicha relación. Se concluye que ambas variables no siguen una distribución normal y que existe una relación positiva entre ellas, es decir, a mayor altura mayor peso. El coeficiente de correlación de Spearman entre las variables es de 0.6224, lo que confirma una buena relación positiva entre la altura y el peso.
3. Paso 1: Abriremos el programa R y cargaremos el archivo con el que queremos trabajar, que en este
caso es “activossalud”. Seleccionaremos en la barra superior la opción “Datos”, y posteriormente
“Cargar conjunto de datos”.
5. Hemos elegido las variables “altura” y “peso”.
El procedimiento que debemos seguir es el siguiente:
1º) Determinar el nivel de medición de las variables y el número de variables a analizar.
Debemos identificar la naturaleza de las variables. En este caso, ambas son variables cuantitativas, es
decir, adoptan valores numéricos y, por tanto, se pueden realizar operaciones aritméticas con ella.
2º) Tenemos que comprobar si estas variables siguen una distribución normal o no.
Para ello, optaremos por un método gráfico, el gráfico QQ, aunque también sería válida la prueba de
Kolmogorov-Smirnov, puesto que en nuestra muestra el número de individuos es superior a 50.
También podríamos comprobar la normalidad de las variables mediante histogramas.
3º) Seleccionar la prueba estadística más adecuada.
4º) Finalmente, verificar si hay relación entre las variables o, de lo contrario, no.
6. Paso 3: Seleccionamos en la pantalla de R commander, en la barra superior, la opción “Gráficas”, y
posteriormente “Gráficas de comparación de cuantiles”.
10. De este gráfico podemos deducir que la
variable “altura” no presenta una
distribución normal. Puesto que hay una
parte de los puntos que no se encuentran
dentro del intervalo de confianza.
11. Paso 7: Realizamos lo mismo, pero en este caso, para la variable “peso”, y
obtenemos el siguiente gráfico q-q.
12. De este gráfico podemos deducir que la
variable “peso” tampoco presenta una
distribución normal. Puesto que hay una
parte de los puntos que no se encuentran
dentro del intervalo de confianza.
13. Paso 8: Seleccionaremos la prueba estadística más adecuada.
Dado que ninguna de las dos variables
presenta una distribución normal,
pasaremos a realizar el test Rho de
Spearman con el fin de comprobar si existe
alguna relación entre ellas y estudiar la
linealidad de estas variables.
14. Paso 9: Seleccionamos en la barra superior “Gráficas” y posteriormente
“Diagrama de dispersión”.
18. Una vez obtenido el diagrama de dispersión,
podemos afirmar que existe cierta relación entre
ambas variables, ya que hay una distribución
regular de los puntos alrededor de la línea de
mínimos cuadrados (pendiente de la línea).
Ambas variables tiene una relación positiva, es
decir, a medida que aumenta el valor de la
variable “x” (altura), aumenta la variable “y”
(peso), a mayor altura, mayor peso.
19. Paso 13: Ahora estudiaremos la fuerza de relación que existe entre ambas variables, a través de los
coeficientes de relación. En este caso, estas variables no son normales, por lo tanto optaremos
por el coeficiente Rho de Spearman.
21. Paso 15: Obtenemos los siguientes datos.
Los valores del coeficiente de correlación van de 0 a 1,
(siendo 0 ausencia de relación y 1 relación perfecta).
El resultado del test Rho de Spearman es 0’6224114,
por lo que se confirma la información proporcionada
por el diagrama, hay buena relación entre ambas
variables.