cortes de luz abril 2024 en la provincia de tungurahua
Estadistica 1
1. INFORME SOBRE LOS SEMINARIOS
DE ESTADÍSTICA BIVARIADA
Realizado por: Jesús García Palma
Grupo 4
Subgrupo 16
2. 1.-INTRODUCCIÓN
¿Qué es la estadística bivariada y para que sirve?
La estadística bivariada se encarga del estudio de aquellos sucesos en los que
intervienen simultáneamente DOS variables.
Se utiliza para ver si tienen o no relación ambas variables en el estudio de una muestra o
población en general. Representamos en primer lugar los datos en una tabla de
frecuencias: a cada caso de la muestra le corresponderán dos valores, uno para cada
una de las dos variables.
Ejemplo: si relacionamos la variable “altura” con la variable “peso”, a cada una de las
personas de la muestra/población le asociaremos dos valores (un peso y una altura). Los
pares de valores así formados constituyen la distribución bidimensional
3. 2.-OBJETIVOS
- El objetivo general es: Utilizar la estadística bivariada para establecer la asociación
entre dos variables de nuestro fichero de datos, dando respuesta a hipótesis de
investigación específicas.
- Los objetivos específicos son:
2.1.-Queremos conocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y Practicadeporte (Sí, No). Para ello y usando el software
“Rcommander”.
2.2.-Queremos conocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y Consumo de fruta (“fruta): “Nunca o casi nunca”, 2-
“Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más
veces a la semana”, 5 “A diario. Para ello y usando el software “Rcommander”.
4. 2.1.-Queremosconocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y Practicadeporte(Sí, No). Para ello y usando el software
“Rcommander”:
a)Describe y representa los datos en una tabla:
Vemos que nuestras variables son ambas cualitativas y dicotómicas: “sexo”:
hombre/mujer y “practica de deporte”: si/no. Nuestra muestra es N=291.
Representaremos los datos en una tabla de contingencia de doble entrada utilizando el
software Rcommander:
b) Establece una hipótesis adecuada para el estudio:
-Hipótesis nula: No existe asociación entre el sexo y el consumo de fruta (Pa > 0,05)
-Hipótesis alternativa: Existe asociación entre el sexo y el consumo de fruta (Pa ≤ 0,05)
5. c) Utiliza la prueba más adecuada para contrastar tu hipótesis:
Observamos en nuestra tabla que todas las frecuencias esperadas son >5. Esto quiere
decir que utilizaremos el Test de Chi cuadrado de Pearson,en lugar del Test de Fisher
d) Interpreta los resultados:
Primero, observamos que nuestro grado de libertad es df=1 y nuestro nivel de
significación es igual a 0.05. Observamos la Chi cuadrado que para estos valores
obtenemos una frecuencia esperada de 3,8415. Nuestra frecuencia observada es (X2)=
19.163.
6. Si la frecuencia observada es menor que la frecuencia esperada queda en la región de
aceptación de H0 si rechazamos H0 la probabilidad de equivocarnos es mayor de 0.05
(máximo error dispuestos a aceptar). Por tanto, como nuestra frecuencia observada es
mayor que la esperada (19.163>3,8415), aceptaremos la hipótesis alternativa (H1) y
rechazamos la hipótesis nula (H0). Recordamos:
-Hipótesis nula: No existe asociación entre el sexo y el consumo de fruta (Pα > 0.05)
-Hipótesis alternativa: Existe asociación entre el sexo y el consumo de fruta (P α ≤
0.05)
La conclusión es que si EXISTE ASOCIACION ENTRE LAS VARIABLES “SEXO” Y
“PRÁCTICA DE DEPORTE”.
7. 2.2.-Queremosconocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y Consumo de fruta (“fruta):“Nunca o casi nunca”, 2- “Menos
de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la
semana”, 5 “Adiario. Para ello y usando el software “Rcommander”:
a)Describe y representa los datos en una tabla:
Las variables de nuestro estudio son “sexo” y “consumo de fruta”,siendo variables
cualitativas. En el caso de la variable “sexo”, se trata de una variable cualitativa
dicotómica, ya que tiene dos categorías: hombre o mujer. Sin embargo, la variable
“consumo de fruta” tiene más de dos categorías. Para poder realizar la asociación entre
las dos variables, tendremos que dicotomizar la variable “consumo de fruta” utilizando el
software Rcommander y seguidamente Chi cuadrado.
La tabla de nuestra muestra es N=291, realizaremos una tabla de frecuencias:
8. b)Establece una hipótesis adecuada para el estudio:
-Hipótesis nula: No existe asociación entre el sexo y el consumo de fruta (Pα > 0.05)
-Hipótesis alternativa: Existe asociación entre el sexo y el consumo de fruta (P α ≤
0.05)
c) Utiliza la prueba más adecuada para contrastar tu hipótesis:
Como nuestras variables “sexo” y “consumo de fruta” son variables independientes,
cualitativas y dicotómicas, comprobamos si podemos usar Chi cuadrado. Todas nuestras
frecuencias esperadas deberán ser mayores que 5:
Como todas nuestras frecuencias esperadas son >5, usaremos el Test de Chi cuadrado
de Pearson.
9. d)Interpreta los resultados:
En primer lugar, observamos que nuestro grado de libertad es df=1 y nuestro nivel de
significación es igual a 0.05. Observamos en la tabla Chi cuadrado que para estos
valores obtenemos una frecuencia esperada de 3,8415. Nuestra frecuencia observada
es (X2)= 3,1893.
Si la frecuencia observada es menor que la frecuencia esperada queda en la región de
aceptación de H0 si rechazamos H0 la probabilidad de equivocarnos es mayor de 0.05
(máximo error dispuestos a aceptar). Por tanto, como nuestra frecuencia observada es menor
que la esperada (3,1893< 3,8415), aceptaremos la hipótesis nula (H0) y rechazamos la
hipótesis alternativa (H1). Además, nuestro p-valor es >0.05 (0.07412). Recordamos:
-Hipótesis nula: No existe asociación entre el sexo y el consumo de fruta (Pa > 0,05)
-Hipótesis alternativa: Existe asociación entre el sexo y el consumo de fruta (Pa ≤ 0,05)
Concluimos que NO HAY ASOCIACION ENTRE LAS VARIABLES “SEXO” Y “CONSUMO DE
FRUTA”.
10. 3.-METODOLOGIA
3.1.-Población de estudio. Muestra
El fichero estadístico “estadística-tics” contiene los datos de las encuestas realizadas a
291 estudiantes de 1º de Enfermería de la Universidad de Sevilla, centros propios y
adscritos. El fin es conocer sus estilos de vida y comportamientos de activos en salud.
3.2.-Variables a analizar:
-Variables incluidas en los análisis y de qué tipo son:
2.1“Sexo”(mujer/hombre) y “Práctica de deporte”(si/no). Ambas son cualitativas
dicotómicas.
2.2“Sexo”(mujer/hombre) y “Consumo de fruta”: esta variable tenía más de dos
categorías, pero para su estudio la hemos dicotomizado. De manera que en la tabla de
contingencia ambas son cualitativas y dicotómicas.
-Cómo se han recogido los datos para cada variable incluida en el análisis (para ello se
puede usar el documento en el que describe el fichero de datos “activossalud.RData”/”
estadistica_tics”).
11. El software estadístico utilizado es R (Rcommander) en el fichero de datos
“activossalud.RData”/”estadística_tics”. Como hemos dicho en el apartado anterior: El
fichero estadístico “estadística_tics” contiene los datos de las encuestas realizadas a 291
estudiantes de 1º de Enfermería de la Universidad de Sevilla, centros propios y
adscritos. El fin es conocer sus estilos de vida y comportamientos de activos en salud.
3.3.-Análisis de datos:
-Software estadístico utilizado:
El software estadístico utilizado es “Rcommander” que nos facilita el uso del software
“R”, que solamente funciona a través de comandos.
-Análisis estadísticos que se van a realizar
Los análisis estadísticos analizados, en nuestro caso, podrían haber sido dos: el Test de
Chi cuadrado de Pearson o el Test de Fisher. En ambos objetivos específicos hemos
utilizado el Test de Chi Cuadrado de Pearson dado que nuestras frecuencias esperadas
eran en ambos casos >5.
13. 5.-CONCLUSIONES
A) SI HAY ASOCIACION ENTRE LAS VARIABLES “SEXO” Y “PRÁCTICA DE
DEPORTE”.
B) NO HAY ASOCIACION ENTRE LAS VARIABLES “SEXO” Y “CONSUMO DE
FRUTA”.