Seminario 7: Análisis bivariado con variables cualitativas.
1. Seminario 7: Análisis bivariado
con variables cualitativas.
Ana Mª Macho Torres
Subgrupo 3
2. Ejercicio 1:
• Si queremos conocer si existe asociación entre el consumo de tabaco
y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a
1750 mujeres no fumadoras y encontramos que:
• – De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
• – De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al
nacer.
• 1. Representa los datos en un tabla de contingencia indicando las frecuencias
observadas y porcentajes.
• 2. Establece una hipótesis adecuada para el estudio.
• 3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis.
• 4. Calcula la odds ratio.
• 5. Repite el ejercicio con R Commander ¿Los resultados son los mismos?.
• 6. Sube los resultados al blog
3. 1-. Representa los datos en un tabla de contingencia indicando
las frecuencias observadas y porcentajes.
FRECUENCIA
OBSERVADAS
Niño PESO
BAJO
Niño PESO
NORMAL
TOTAL
Fumadoras 43 207 250
NO fumadoras 105 1645 1750
TOTAL 148 1852 2000
% Niño PESO
BAJO
Niño PESO
NORMAL
TOTAL
Fumadoras 17,2% 82,2% 100%
NO fumadoras 6% 94% 100%
4. 2-. Establece una hipótesis adecuada para el estudio.
Antes de poder establecer las hipótesis para el estudio,
necesitamos tener una pregunta de investigación. En este
caso sería:
-¿Influye que la madre sea o no fumadora en el peso del
hijo?
A partir de esto:
Hipótesis nula: Que la madre sea o no fumadora no
influye en el peso del hijo.
Hipótesis alternativa: Que la madre sea o no
fumadora influye en el peso del hijo.
5. 3-. Utiliza la prueba de CHI CUADRADO para realizar el
contraste de hipótesis.
• En primer lugar, calculamos las frecuencias esperadas:
• X1=(250×148)÷2000= 18’5
• X2=(250×1852)÷2000= 231’5
• X3=(1750×148)÷2000= 129’5
• X4=(1750×1852)÷2000= 162’5
• En segundo lugar, aplicamos la fórmula de CHI CUADRADO:
χ²=∑(fo-fe)÷fe = ((43-18’5)²÷18’5)+((207-231’5)²÷ 231’5) + ((105-
129’5)²÷129’5)+((1645-1620’5)²÷1620’5)= 40’04
• Seguidamente, calculamos el grado de libertad:
Grado de libertad= (f-1)×(c-1)= (2-1)×(2-1)= 1
6. • Una vez obtenidos estos datos, comparamos el valor teórico de la
CHI CUADRADO con el valor calculado por nosotros.
• Para ello, debemos buscar el valor teórico en la siguiente tabla, a
partir del valor del GL.
7. • • Chi cuadrado en la tabla teórica: 3,84
• • Chi cuadrado en los datos observados: 40,04
• R= El valor de Chi Cuadrado en los datos observados es
40,03, siendo mayor que el resultado de las tablas, 3,84.
40,03>3,84
• Por lo tanto, aceptamos la hipótesis alternativa y esto
quiere decir que existen diferencias estadísticamente
significativas o lo que es lo mismo, estas diferencias no
son debidas al azar.
• H1: Existe relación entre el peso de los recién nacidos y que la
madre sea fumadora.
8. 4.- Calcula la Odds Ratio.
• Odds Ratio (OR) = a·d/ c·b
La Odds Ratio permite cuantificar la importancia/fuerza de
la asociación entre dos variables.
OR= (43÷207)÷(105÷1645)= 3’5
Por lo tanto como el resultado es >1 podemos decir que la
presencia del factor exposición (tabaco) se asocia a mayor
ocurrencia del evento (nacen niños con bajo peso).
11. • R= Si aceptamos la hipótesis alternativa cometemos un
error de 2,483e-10,mucho menor del que nosotros
estábamos dispuestos a asumir (0,05).
• Por lo que se acepta la hipótesis alternativa (al igual que
dijimos anteriormente)
• En lo referente al valor de la Odds ratio, hemos obtenido
el mismo que al hacerlo con la fórmula (3,2515).
12. Ejercicio 2:
• Siguiendo todos los pasos anteriores establece y
describe si existe asociación entre las variables
del archivo “activossalud.Rdata” sexo y:
• – Practicadeporte (Sí, No)
• – Fruta: 1- “Nunca o casi nunca”, 2- “Menos de
una vez por semana”, 3-“Una o dos veces a la
semana”, 4- “Tres o más veces a la semana”, 5
“A diario”
13. A.-
• Formulamos una pregunta de investigación a
partir de estas variables que vamos a estudiar:
¿Hay alguna relación entre el sexo y la práctica de
deportiva?
• A partir de nuestra pregunta de investigación
formulamos:
-H Nula: No existen diferencias en las horas de práctica
deportiva entre hombres y mujeres.
-H alternativa: Existen diferencias en las horas de
práctica deportiva entre hombres y mujeres.
14. El p-valor obtenido en la Chi Cuadrado es
de 1,2e-05.
Esto nos muestra el error que
cometeríamos si aceptamos la hipótesis
alternativa es 1,2e-05<0,05. Por lo tanto,
aceptamos la hipótesis alternativa que dice
que existen diferencias en las horas de
práctica deportiva entre hombres y
mujeres.
La Odds ratio es 0,2048, inferior a 1 lo
que significa que la presencia del factor
de exposición se asocia a menor
ocurrencia del evento, es decir que ser
hombre implica una práctica deportiva
menor ,
Esta afirmación es contraria a lo que
habíamos obtenido anteriormente. Sin
embargo, si nos fijamos en el intervalo de
confianza de la Odds ratio, este se
encuentra entre 0,0838 y 0,450, es decir,
no se encuentra incluido el 1 y por lo
tanto se rechaza la Odds ratio, siguiendo
con la hipótesis alternativa.
15. B.-
• ¿Hay relación entre el sexo y la ingesta de fruta?
H0: No existe relación entre el sexo y comer fruta.
H1: Sí existe una relación entre el sexo y la ingesta de
fruta.
Observamos el valor de p-valor, 0,1072>0,05, esto nos permite aceptar la hipótesis
alternativa, ya que el error que cometeríamos si la aceptáramos es menor del que
hemos asumido (0,05).
H1: Si existe relación entre el sexo y la ingesta de frutas.