2. INTRODUCCIÓN.
Como ya pudimos ver en el seminario anterior, R Commander es
capaz de realizar ciertas operaciones que permiten conocer la
asociación entre variables. En esta ocasión, vamos un paso más
lejos, vamos a realizar el siguiente ejercicio sobre relación y
fuerza de la relación entre variables.
La actividad a realizar es:
Determinar si existe relación y como de fuerte es entre las
variables altura y peso del archivo “activossalud.Rdata.
La actividad vamos a realizarla a través de gráficas y pruebas
estadísticas, tales como el coeficiente de correlación de Pearson
y el Rho de Spearman.
3. Relación y fuerza de relación
entre variables.
1ª TAREA DEL SEMINARIO VIII.
4. 1. Antes que nada primero debemos abrir R Commander. Una vez dentro, lo primero de todo es
especificar el directorio de trabajo.
Para ello, pulsamos sobre “Fichero” y
luego sobre “Cambiar directorio de
trabajo”.
En nuestro caso, he elegido la
carpeta “ESTADISTICA SEMINARIO
8”.
5. 2. Una vez identificado el directorio de trabajo, vamos a cargar el archivo con nuestro
conjunto de variables. Para ello, pulsamos sobre “datos” y posteriormente sobre “Cargar
conjunto de datos”.
Nos aparecerá esta ventana,
elegimos el archivo
“activossalud.Rdata”.
6. 3. Nuestro objetivo es observar si las variables “Peso” y “Altura” presentan relación entre
ellas. Para saber si utilizaremos el test paramétrico o el no paramétrico deberemos testar la
normalidad de las variables.
Primero, vamos a comprobar la normalidad de la variable “Peso”. Para ello, pulsamos en
“Gráficas” y luego sobre “gráfica de comparación de cuartiles”.
Elegimos la variable “Peso” y en opciones elegimos distribución normal y pulsamos aceptar.
7. Una vez realizado lo anterior, nos aparecerá la gráfica de comparación de cuartiles de la variable
“Peso”.
Como podemos observar,
muchas puntuaciones de la
variables “peso” se salen
de los intervalos de
confianza (lineas
discontinuas de la gráfica),
por tanto, podemos
considerar que esta
variable no lleva una
distribución normal.
8. Ahora, vamos a comprobar la normalidad de la variable “altura”. Para ello, pulsamos en
“Gráficas” y luego sobre “gráfica de comparación de cuartiles”.
Elegimos la variable “Altura” y en opciones elegimos distribución normal y pulsamos aceptar.
9. Una vez realizado lo anterior, nos aparecerá la gráfica de comparación de cuartiles de la
variable “Altura”.
Como podemos
observar, muchas
puntuaciones de la
variables “altura” se
salen de los intervalos
de confianza (líneas
discontinuas de la
gráfica), por tanto,
podemos considerar
que esta variable no
lleva una distribución
normal.
10. Como ninguna de las dos variables presenta una distribución normal, debemos utilizar un test
no paramétrico: en nuestro caso el Rho de Spearman.
4. Una vez conocido la prueba a utilizar debemos estudiar: tipo de relación y fuerza de relación.
A) QUE TIPO DE RELACIÓN (REGRESIÓN) HAY ENTRE ELLAS: Para ello, pulsamos sobre
“gráficas” y luego sobre “Diagramas de dispersión”.
Una vez hecho lo anterior, elegimos ambas variables y en
opciones elegimos la “Línea de mínimos cuadrados”.
11. Realizado lo anterior, obtendremos la gráfica de relación entre las variables “peso” y
“altura”.
Como podemos observar
al principio parece haber
cierta relación (muchas
puntuaciones se acercan
a la línea de mínimos
cuadrados), pero a
medida que aumentan los
valores no existe relación
entre el peso y la altura
(puntuaciones muy
alejadas de la línea de
mínimos cuadrados).
POR TANTO, NO EXISTE
RELACIÓN ENTRE LAS
VARIABLES.
12. B) COMO DE FUERTE ES DICHA RELACIÓN EN CASO DE QUE LA HUBIERA (CORRELACIÓN).
Primero, pulsamos sobre “Estadisticos”, luego
“resúmenes” y posteriormente sobre “Matriz de
correlaciones”.
Una vez realizado lo anterior, nos
aparecerá la siguiente ventana, donde
deberemos elegir ambas variables.
Además, deberemos elegir el
“coeficiente de Spearman” porque son
dos variables cuantitativas cuya
distribucion no sigue la normalidad.
13. Realizados los pasos previos, nos aparecerá en la tabla de salida de R commander, los
resultados sobre el coeficiente de Spearman de ambas variables:
Conclusión: El coeficiente de Spearman varia entre 0 y 1, siendo 1 máxima fuerza de correlación y 0
ninguna relación. Como podemos observar el coeficiente de Spearman entre la variable “Peso” y la
variable “Altura” es 0,62224114, por lo que presentaria una fuerza de correlación positiva débil. Para que
se considere que las variables están relacionadas debe tener un valo mayor a 0,8, como no es mayor,
indica que no están relacionadas.