Este documento presenta un análisis bivariado de datos sobre estilos de vida y actividad física de 290 estudiantes de enfermería. Se analizan las posibles asociaciones entre las variables "sexo" y "consumo de fruta", y entre "altura" y "peso". Los resultados muestran que no hay asociación entre el sexo y el consumo de fruta, pero sí una fuerte correlación positiva entre la altura y el peso de los estudiantes. El documento concluye resaltando la importancia de promover hábitos alimenticios y de vida sal
1. 1
TAREA5. ANÁLISIS BIVARIADO
1. INTRODUCCION
La estadística inferencial es un tipo de estadística más analítica. Se divide en la teoría de la
probabilidad y el contraste de la hipótesis,siendo esto utilizado para determinar que hipótesis de
las establecidas es la correcta, estableciéndose una relación entre las distintas variables para
poder determinar conclusiones en la realidad.
También se entiende la estadística de estimación de parámetro que pretender inferir en la
población a partir de lo que ocurre en la muestra.
2. OBJETIVO
- General: utilizar la estadística bivariada para establecer la asociación entre dos
variables de nuestro fichero de datos, dando respuesta a hipótesis de investigación
específicas.
- Específicos:
o Queremos conocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y Consumo de fruta (“fruta): “Nunca o casi nunca”,
2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o
más veces a la semana”, 5 “A diario. Para ello y usando el software
“Rcommander”:
a. Describe y representa los datos en una tabla
b. Establece una hipótesis adecuada para el estudio
c. Utiliza la prueba más adecuada para contrastar tu hipótesis
d. Interpreta los resultados
o Determina que si existe relación y como de fuerte es entre las variables “altura”
y “peso”. Para ello y usando el software “Rcommander”:
a. Describe y representa los datos gráficamente
b. Establece una hipótesis adecuada para el estudio
c. Utiliza la prueba más adecuada para contrastar tu hipótesis
d. Interpreta los resultados
3. METODOLOGIA
- Población de estudio: en este caso hemos realizado el estudio sobre 290 estudiantes
de primero de enfermería de la Universidad de Sevilla, centros propios y adscritos, para
conocer sus estilos de vida y activos en salud.
- Variables que se van a analizar:
o Variables incluidas en los análisis y de qué tipo son:
Sexo: es una variable cualitativa dicotómica ya que únicamente tiene
dos opciones (Varon o Mujer)
Fruta: es una variable cualitativa pero que en este caso tiene 5
categorias (“Nunca o casi nunca”, 2- “Menos de una vez por semana”,
3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5
“A diario”)
2. 2
Altura: es una variable cuantitativa
Peso: es una variable cuantitativa
- Análisis de datos:
o Software estadístico utilizado: RStudio y Rcommander.
o Análisis estadísticos que se van a realizar:
He realizado una tabla de contingencia con las dos variables cualitativas
para analizar la asociación entre ellas. En las filas va la variable
independiente y en las columnas van las variables dependientes.
He realizado un testde normalidad para ver si hay normalidad en las
variables altura y peso.
He realizado un diagrama de dispersión para ver la linealidad entre las
variables altura y peso.
He realizado un testde correlación mediante Pearson.
He realizado una matriz de correlación para saber como de fuerte es la
correlación entre las variables.
4. RESULTADOS
En primer lugar tenemos que abrir RStudio. Dentro de RStudio pulsamos en la pestaña
“Packages” y seleccionamos el paquete de Rcommander para que nos lo abra. Una vez abierto
Rcommander pulsamos en “Datos”, “Cargar conjunto de datos” y subimos el archivo de
activosensalud que habremos descargado previamente de la enseñanza virtual.
TAREA 1: QUEREMOS CONOCER SI EXISTE ASOCIACIÓN ENTRE LAS VARIABLES DEL
ARCHIVO “ACTIVOSSALUD.RDATA” “SEXO” Y CONSUMO DE FRUTA (“FRUTA): “NUNCA O
CASI NUNCA”, 2- “MENOS DE UNA VEZ POR SEMANA”, 3-“UNA O DOS VECES A LA
SEMANA”, 4- “TRES O MÁS VECES A LA SEMANA”, 5 “A DIARIO. PARA ELLO Y USANDO EL
SOFTWARE “RCOMMANDER”:
A. DESCRIBE Y REPRESENTA LOS DATOS EN UNA TABLA
B. ESTABLECE UNA HIPÓTESIS ADECUADA PARA EL ESTUDIO
C. UTILIZA LA PRUEBA MÁS ADECUADA PARA CONTRASTAR TU HIPÓTESIS
D. INTERPRETA LOS RESULTADOS
Lo primero que he hecho es realizar una tabla de contingencia de doble entrada con las dos
variables cualitativas que me dice la actividad. Para ello en Rcommander me he dirigido a
“Estadístico”, “Tabla de contingencia” y “Tabla de doble entrada”. Después he elegido en la
variable de fila el sexo y en la variable columna el consumo de fruta.
3. 3
En esta tabla se observa la frecuencia esperada de cada una de las variables y para poder
realizar chi cuadrado será necesario que la frecuencia esperada de sea menor de 5 es menos
del 20%. Si hubiera frecuencias esperadas menores que 5 en más del 20% de las cuadrillas ya
no se podría utilizar y se utilizaría Fisher.
Tras observar esto debemos exponer nuestras dos hipótesis:
- Hipótesis nula: no hay asociación entre las dos variables.
- Hipótesis alternativa: hay asociación entre las dos variables.
Como hemos dicho antes debemos hacer chi cuadrado.
Tras hacer la tabla de contingencia nos salen estos datos, en los que observamos un grado de
libertad de 4 y una chi cuadrado de 7.6036 (al ser tan grande significa que hay mucha diferencia
entre la FO y la FE). Con esta chi cuadrado, la p que obtenemos es de 0.1072. Este valor es
mayor de 0.05 por lo tanto la hipótesis que elegiremos será la hipótesis nula, es decir, no hay
asociación entre el consumo de fruta y el sexo, es decir, las personas comen fruta
independientemente de si son hombres o mujeres.
TAREA 2: DETERMINA QUE SI EXISTE RELACIÓN Y COMO DE FUERTE ES ENTRE LAS
VARIABLES “ALTURA” Y “PESO”. PARA ELLO Y USANDO EL SOFTWARE “RCOMMANDER”:
A. DESCRIBE Y REPRESENTA LOS DATOS GRÁFICAMENTE
B. ESTABLECE UNA HIPÓTESIS ADECUADA PARA EL ESTUDIO
C. UTILIZA LA PRUEBA MÁS ADECUADA PARA CONTRASTAR TU HIPÓTESIS
D. INTERPRETA LOS RESULTADOS
4. 4
En primer lugar tendremos que presentar nuestras posibles hipótesis:
- Hipótesis nula: no hay correlación entre el peso y la altura
- Hipótesis alternativa: hay correlación entre el peso y la altura.
Al ser dos variables cuantitativas (peso y altura) podremos utilizar la prueba de Spearman, la
cual no requiere ningún requisito para ser utilizada o la prueba de Pearson que requiere que
nuestras variables deban ser lineales (requisito muy importante) y también deben seguir una
distribución normal.
En primer lugar tendremos que ver si hay una distribución normal entre las dos variables y para
ellos vamos a utilizar el test de normalidad mediante Shapiro-Wilk de ambas variables,
estableciendo de nuevo dos hipótesis:
- Hipótesis nula: hay normalidad
- Hipótesis alternativa: no hay normalidad
En primer lugar lo haré de la variable “altura”:
Observamos que la p es muchísimo menor que 0.05 y en estos casos se coge la variable
alternativa, por lo tanto no hay normalidad en la variable altura. Ahora voy a realizar lo mismo
con la variable peso:
Observamos que la p es incluso mucho menor que la p de la variable altura. Por lo tanto, al ser
también menor que 0,05 se confirma que no hay normalidad en la variable peso.
Tras esto, ya sabemos que un requisito para que se lleve a cabo Pearson no se ha cumplido,
pero como no es tan importante vamos a continuar con la linealidad. Para ello debemos darle a
5. 5
“Gráficos”, “Diagrama de dispersión”, poner en el eje Xla variable “altura” y en el eje Y la variable
“peso”.
Con este gráfico afirmamos que hay linealidad entre las variables y también podemos afirmar
que es una linealidad de relación lineal positiva, es decir, contra más aumenta la altura, más
aumenta el peso.
Por lo tanto, al cumplirse de que hay linealidad, se debe utilizar Pearson. Se realiza de la
siguiente forma: “Estadístico”, “Resúmenes” y “Test de correlación”.
6. 6
Observamos con estos datos, que la p es muchísima más pequeña que 0.05 por lo tanto
elegimos la hipótesis alternativa, es decir, que hay correlación entre la variable altura y la
variable peso. Para saber como de fuerte es la correlación realizamos una matriz de correlación
En este caso nos debemos fijar en el número más pequeño que en este caso es 0.6311. Al ser
mayor que 0.5 la correlación es fuerte.
5. CONCLUSION
En el primer caso, al haber obtenido que la hipótesis nula, es decir, la de que no hay relación
entre el sexo y el consumo de fruta, era la correcta debemos hacer hincapié y fomentar estilos de
vida saludables y una alimentación sana en ambos sexos, sin cambiar la intensidad con respecto
al sexo.
En el segundo caso, hemos determinado que la hipótesis alternativa era la correcta, es decir, la
de que hay correlación entre la altura y el peso. Por lo tanto, el peso no dependerá únicamente
de nuestros hábitos alimenticios sino que tambien va a depender del peso.