Trata de un informe ejemplo de como utilizar la estadística bivariada para establecer la asociación entre dos variables de nuestro fichero de datos, dando respuesta a hipótesis de investigación específicas
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Estadistica informe 2
1. Informe estadístico de Estadística bivariada:
Introducción:
La estadística bivariada es aquella que nos va a servir para comparar dos tipos de
variables de manera simultánea, y así poder conocer la existencia de relación entre las
misma o bien corroborar su independencia.
Cuando hablamos de comparación entre variables, puede ser comparando las medias de
muestras independientes, o incluso de muestras apareadas.
Objetivo:
- General:
Utilizar la estadística bivariada para establecer la asociación entre dos variables
de nuestro fichero de datos, dando respuesta a hipótesis de investigación
específicas
-Específicos:
1. Queremos conocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y Consumo de fruta (“fruta): “Nunca o casi nunca”,
2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o
más veces a la semana”, 5 “A diario.
2. Determina que si existe asociación entre las variables “tabaco” y “escalaas”
Metodología:
En este informe nos hemos enfocado en el estudio de los estilos de vida y activos en
salud de los estudiantes de Enfermería de la Universidad de Sevilla, centros propios y
adscritos. Entre todos ellos alumnos, a partir de un muestreo hemos seleccionado a 290
alumnos para realizarle las encuestas, siendo esta la forma en la que hemos recogido los
resultados.
Para realizar este informe hemos optado por 4 variables distinta: Al realizar el primer
objetivo específico hemos escogido la variable “sexo” una variable cualitativa
dicotómica y la variable “Consumo de fruta” que es una variable cualitativa ordinal
2. diferenciadas en “Nunca o casi nunca”, “Menos de una vez por semana”, “Una o dos
veces a la semana”, “Tres o más veces a la semana”, “A diario”
Mientras que para el segundo objetivo específico hemos cogido la variable “Tabaco”
que es una variable cualitativa ordinal cuyas opciones han sido “a diario”, “solo los
fines de semana”, “2 o 3 veces a la semana”, “2 o 3 veces al mes”, “Alguna vez
anual”, “Nunca” y la variable “Escalaas” es cuantitativa discreta, formada sumando la
puntuación obtenida en las siguientes variables: “botellón”, “horarecogida”,
“consumotabaco”, “tabaco”, “cerveza”, “vino”, “combinados”, “hachís”,
“parejassexuales”, “proteccionpreservativo”, “marchaatras”, “pildoradiadespues”,
“fruta”, “verduras”, “embutidos”, “dulces”, “refrescos”, “practicadeporte” y
“horapracticadeportiva”. A más puntuación en la escala, más saludable es la vida de la
persona encuestada (activos en salud).
Para realizar este informe has sido utilizado el software estadístico R en su versión
3.4.2.
Resultados:
Búsqueda de asociación entre variable “sexo” y “frutas”:
Nunca o
casi nunca
Menos de una
vez por semana
Una o dos veces
a la semana
Tres o más veces
a la semana
A diario
Hombre FO =2
Fe=5.62
FO=6
Fe=5.62
FO=10
Fe=11.78
FO=18
Fe=11.60
FO=15
Fe=16.35
51
Mujer FO =30
Fe=26.37
FO=26
Fe=26.37
FO=57
Fe=55.21
FO=48
Fe=39.55
FO=78
Fe=76.64
239
32 32 67 66 93 290
Nuestras hipótesis a tener en cuenta serán nombradas como hipótesis alternativa (H1) e
hipótesis nula (H0).
H1= Hay asociación entre nuestra variables, ya que hay diferencias entre los resultados,
por lo que son dependientes.
3. H0= No hay asociación entre nuestras variables, no hay diferencias entre los resultados,
por lo que son independientes.
En primer lugar tenemos que observar que se cumpla los requisitos precisos para el uso
de Chi-cuadrado: Que sea una variable cualitativa, que no haya valores de frecuencias
esperadas inferiores a 5 y que se traten de muestras independiente.
Como ninguna de nuestras frecuencias esperadas es inferior a 5, no será necesario
agrupar, además se usan variables cualitativas y son muestras independientes al tratarse
de una diferenciación por sexo así que usaremos la prueba no paramétrica Chi-
cuadrado.
Como bien observamos en la prueba Chi-cuadrado de Pearson realizada mediante R, se
obtiene un p-value= 0.1072, como este es superior a nuestro nivel de significación
p=0,05, entonces no podemos rechazar la hipótesis nula, por tanto, se tratan de variables
independientes, donde no hay asociación entre ellas.
Búsqueda de relación entre las variables “tabaco” y “escala”.
En primer lugar vamos a recodificar la variable tabaco en “si”= "diario","fines de
semana","2 o 3 veces semana","2 o 3 veces mes","alguna vez" y no= "nunca".
Vamos a establecer una representación gráfica de las diferencias de escalaas y el tabaco:
4. Vamos a establecer dos hipótesis:
H1: Hay diferencias entre las variables, por lo que hay asociación y, por tanto,
dependencia.
H0: No hay diferencia entre las variables, por lo que no hay asociación y, por tanto, son
independientes.
Como comparamos una variable dicotómica con una cuantitativa, veremos si es posible
usar t de Student, para poder usarla se tiene que cumplir dos requerimientos esenciales,
que haya homocedasticidad y normalidad de la variable cuantitativa, si no cumple la
homocedasticidad necesaria ni tampoco su normalidad, entonces usaremos directamente
el test de Wilcoxon.
-Para comprobar la homocedasticidad comenzaremos con el test de Levene:
Aquí estableceremos dos hipótesis:
H0= No hay diferencia entre las varianzas y, por tanto, hay homocedasticidad.
H1= Hay diferencia entre las varianzas y, por tanto, no hay homocedasticidad.
5. Como observamos nuestra Pr (>F), es superior a 0,05, por lo que cogemos la hipótesis
nula, hay homocedasticidad.
-Para comprobar la normalidad usaremos el Test Shapiro Wilk:
H0= Hay normalidad.
H1= No hay normalidad.
Como observamos la p-value es superior a 0,05, por lo que optamos por la hipótesis
nula, hay normalidad.
Tras comprobar la normalidad y la homocedasticidad usamos el Test de Student:
Como observamos la p-value es inferior a 0,05, por lo que optamos por la hipótesis
alternativa, de ese modo, nos asegura que hay una relación entre las personas que fuman
y no, con respecto al valor “escalaas”. Esta relación es ahora bastante obvia, ya que las
personas que fuman tendrán un valor menor en escalas, algo que significará que la
persona entrevistada tendrá una vida menos saludable.
Conclusiones:
Como observamos en los resultados anteriores, no hay diferencias entre el consumo de
fruta entre hombres y mujeres, por lo que a la hora de hacer programas para que los
alumnos de Enfermería mantengan una dieta equilibrada y aumente el consumo de fruta,
no tendremos que hacer programas diferenciados por sexo, si no realizarlo de manera
conjunta.
6. Por otro lado, vemos como si se encuentra relacionado el consumo de tabaco con la vida
saludable, por lo que para mejorar la calidad de la salud de nuestros estudiantes
deberíamos insistir en gran medida en programas cuyos objetivos sean disminuir el
consumo de tabaco ya que como incluso observamos hay un tanto por ciento, superior
de personas que fuman de las que no, de ahí que impere esta necesidad.