2. EJERCICIO 1
Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al
nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y
encontramos que:
De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer
De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer
A) Representa los datos en un tabla de contingencia indicando las frecuencias
observadas y porcentajes
Madres
fumadoras
Madres no
fumadoras
Total
Hijos con
bajo peso
43 105 148
Hijos con
peso normal
207 1645 1852
Total 250 1750 2000
Madres
fumadoras
Madres no
fumadoras
Hijos con
bajo peso
17,2% 6%
Hijos con
peso normal
82,8% 94%
3. Observando ambas tablas a simple vista, nos damos cuenta de que el porcentaje de hijos con peso bajo
es mayor si las madres son fumadoras. Esto nos hace pensar que el hábito del tabaco de la madre
influirá en el peso del niño, luego pasamos al segundo apartado del ejercicio:
B) Establece una hipótesis adecuada para el estudio
H0: El hábito del tabaquismo en las madres no influye en el peso de sus hijos al nacer
(establece que no hay diferencia, que hay igualdad)
H1: El hábito del tabaquismo en las madres influye en el peso de sus hijos al nacer
C) Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis
La prueba de chi-cuadrado se utiliza para comprobar si la diferencia en los datos que observamos es
debida al azar (aceptamos la Ho) o es debida a algo más, por ejemplo una asociación entre las variables
que estudiamos (rechazamos la H0 y aceptamos la H1). Para empezar a calcular chi cuadrado,
hallaremos los valores esperados:
Madres
fumadoras
Madres no
fumadoras
Total
Hijos con
bajo peso
43
250 𝑥 148
2000
105
1750 𝑥 148
2000
148
Hijos con
peso normal
207
250 𝑥 1852
2000
1645
1750 𝑥 1852
2000
1852
Total 250 1750 2000
Madres
fumadoras
Madres no
fumadoras
Hijos con
bajo peso
18,5% 129,5%
Hijos con
peso normal
231,5% 1620,5%
4. Después, aplicaremos la fórmula de chi-cuadrado:
𝑋2=
(𝑓𝑟𝑒𝑐𝑢𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠−𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠)2
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠
=
(43−18,5)2
18
,
5 +
(207−231,5)2
231
,
5 +
(105−129,5)2
129
,
5 +
(1645−1620,5)2
1620
,
5 = 32,45 + 2,59 + 4,64 + 0,37 = 40,05
A continuación calculamos el grado de libertad, que será…
GL = (F-1)(C-1) = (2-1)(2-1)= 1
… y buscaremos el valor teórico en la tabla de chi-cuadrado (atendiendo a un margen de error de 0,05)
5. Teóricamente, chi-cuadrado nos da un valor de 3,84, pero el valor real calculado
mediante la fórmula es 40,05. ¿Qué significa esto?
Si Chi cuadrado en los datos es mayor que la teórica, quiere decir que la
diferencia entre nuestros datos NO es debida al azar, luego aceptamos la
hipótesis alternativa, H1: el hábito del tabaquismo en las madres influirá en el
peso de sus hijos al nacer
6. D) Calcula la odds ratio
La odds ratio permite cuantificar la importancia/fuerza de la asociación entre dos variables, y como en
este caso, puede acompañar al resultado de la prueba chi-cuadrado.
Odds ratio sería el cociente entre la odds de expuestos a la categoría de riesgo de la variable de riesgo
que tienen el carácter estudiado y los expuestos a la categoría de riesgo de la variable de riesgo que NO
tienen el carácter estudiado.
En nuestro caso, veamos de nuevo nuestra tabla de contingencia:
Mujeres
fumadoras
Mujeres no
fumadoras
Hijos con
bajo peso
43 105
Hijos con
peso normal
207 1645
Así pues, suponiendo que fumar es un factor de riesgo, nuestra odds ratio sería:
a) Para hijos con bajo peso: OR=
43/207
105/1645
=
43 𝑥 1645
105 𝑥 207
= 3,25
7. Teniendo en cuenta que…
OR=1 indica que no hay asociación (independencia)
OR>1 la presencia del factor de exposición se asocia a mayor ocurrencia del evento
OR <1 la presencia del factor de exposición se asocia a menor ocurrencia del evento
… y que el resultado de nuestra OR fue de 3,25, podemos decir que la presencia del factor
fumar se asocia a mayor ocurrencia de hijos con bajo peso, o lo que es lo mismo,
aceptamos la hipótesis alternativa.
8. E) Repite el ejercicio con R Commander. ¿Los resultados son los mismos?
En primer lugar, vamos a crear nuestra famosa tabla de contingencia:
Marcamos esta opción para calcular odd ratio
9. Este es el resultado que nos da R Commander:
Como podemos ver, al comparar chi obtenido en datos (X- squared = 40,044) y chi teórico
(p-value =2,483 𝑥 𝑒−10
), nos sale que el primer valor es mayor, al igual que como
calculamos anteriormente sin R Commander.
Y, como deducimos anteriormente, aceptamos la hipótesis alternativa. Por lo tanto,
tanto como haciendo el ejercicio manualmente como por R Commander obtendremos el
mismo resultado.
En cuanto a la odds ratio, nos da el mismo valor que calculamos manualmente.
10. EJERCICIO 2
Siguiendo todos los pasos anteriores establece y describe si existe asociación entre las
variables del archivo “activossalud.Rdata” sexo y:
a) Practicadeporte (Sí, No)
b) Fruta:
“Nunca o casi nunca”
“Menos de una vez por semana”
“Una o dos veces a la semana”
“Tres o más veces a la semana”
“A diario”
11. Para resolver el apartado a), vamos a comenzar planteando nuestras hipótesis a la pregunta
de investigación: ¿existe relación entre el sexo y la práctica de deporte?
H0: No existe diferencia en la hora de práctica deportiva entre hombres y mujeres
H1: Existe diferencia en la hora de práctica deportiva entre hombres y mujeres
Tras cargar nuestro conjunto de datos en R
Commander, seleccionamos las dos variables
que nos interesan en una tabla de doble
entrada, recordando marcar “Test exacto de
Fisher”
12. La observación de la tabla a simple vista nos hace
pensar que los hombres hacen más deporte que las
mujeres, pero para corroborar esta teoría, usamos
Chi cuadrado:
Con la prueba de Chi- cuadrado comprobamos
con facilidad que la Chi calculada es mayor
que la teórica, luego, como explicamos en el
ejercicio anterior, aceptamos la hipótesis
alternativa (existe diferencia en la hora de
práctica deportiva entre hombres y mujeres),
luego ambas variables ESTÁN RELACIONADAS.
13. No obstante, la odds ratio tiene un valor de 0,2, lo que, al ser menor de 1, significa que la
presencia del factor de exposición (sexo) implica una menor probabilidad de que ocurra el
suceso (hacer deporte). En este caso el sexo que usa R es varón, luego esto no se
corresponde con los datos obtenidos anteriormente
Para decidir qué opción es la correcta, nos fijamos en el intervalo de confianza. En este
caso, el intervalo de confianza no incluye el valor 1, por lo que podemos asegurar que OR
será diferente de 1 y por lo tanto habrá asociación entre ambas variables.
14. Para el apartado b), empezaremos igual que en el anterior. En este caso, nuestra pregunta
de investigación es “¿existe relación entre el sexo y la ingesta de fruta”, y nuestras
hipótesis son:
H0: Existe una relación entre el sexo y la ingesta de fruta
H1: No existe relación entre el sexo y la ingesta de fruta
La metodología en R será la misma que anteriormente:
15. Este apartado es exactamente igual, por lo que lo haremos de la
manera más rápida:
• Chi calculada (7,6036) es mayor que chi teórica (0,1072), luego
aceptaremos la hipótesis alternativa: ambas variables (sexo e
ingesta de fruta) están relacionadas