SEMINARIO 8
ANA ROMERO LOPEZ
GRUPO 16
PRIMERA ACTIVIDAD
Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres
fumadoras y a 1750 mujeres no fumadoras y encontramos que:
- De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
- De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
1. Representa los datos en una tabla de contingencia indicando las frecuencias observadas y porcentajes.
2. Establece una hipótesis adecuada para el estudio.
¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebe con bajo peso al nacer?
Para saber si existe o no asociación entre las dos variables que anteriormente hemos indicado necesitamos fijarnos en la
“p”.
Para saber si es o no dependiente y decidir qué hipótesis aceptar sabemos que:
- Ho: No existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer.
- H1: Sí existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebés.
3. Utiliza la prueba Chi-cuadrado de Pearson para contrastar tu hipótesis.
Para poder llevar a cabo esta prueba, necesitamos para seguir la fórmula las frecuencias esperadas, aquellas que deberían
haberse observado si aceptamos la Ho; y las frecuencias observadas en nuestro estudio.
Tenemos entonces que las frecuencias esperadas serían:
𝐹𝐸11 =
𝑎 + 𝑏 ∗ 𝑎 + 𝑐
𝑛
=
43 + 207 ∗ 43 + 105
2000
= 18,5
𝐹𝐸12 =
𝑏 + 𝑎 ∗ 𝑏 + 𝑑
𝑛
=
207 + 43 ∗ 207 + 1645
2000
= 231,5
𝐹𝐸21 =
𝑐 + 𝑎 ∗ 𝑐 + 𝑑
𝑛
=
105 + 43 ∗ 105 + 1645
2000
= 129,5
𝐹𝐸22 =
𝑑 + 𝑐 ∗ 𝑑 + 𝑏
𝑛
=
1645 + 105 ∗ (1645 + 207)
2000
= 1620,5
Una vez realizado los cálculos lo ponemos en pie en una tabla de frecuencias comparando las observadas y las esperadas.
A continuación, calculamos la Chi-cuadrado mediante la siguiente fórmula:
𝑋2 =
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 2
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠
=
(43 − 18,5)2
18,5
+
(207 − 231,5)2
231,5
+
(105 − 129,5)2
129,5
+
(1645 − 1620,5)2
1620,5
= 40,04436402
Ya conocemos por tanto la X2, es decir, la Chi-cuadrado, por lo que necesitamos saber los grados de libertad. Los grados
de libertad se calculan multiplicando el número de filas menos 1 y el número de columnas menos 1: (Número de filas-
1)*(Número de columnas menos 1), que en este caso al encontrarnos ante una variable con dos variables, dicotómicas,
nos quedaría (2-1)*(2-1)= 1.
Una vez que ya tenemos los datos tanto de la Chi-cuadrado como de los grados de libertad, nos vamos a la tabla de Chi-
cuadrado y conocer cuál es la probabilidad que tendrá asociada nuestra Ho. Nuestra Chi-cuadrado teórica es de 3,84 ya
que el grado de libertad es 1 y nuestra probabilidad es de 0,05.
Teniendo en cuenta lo siguiente:
- Si el Chi-cuadrado real (el que hemos calculado) es menor o igual que la Chi-cuadrado  aceptamos la
hipótesis nula (son independientes las variables)
- Si el Chi-cuadrado real es mayor que la Chi-cuadrado teórica  aceptamos la hipótesis alternativa y por
tanto son dependientes ambas variables.
- Como X2 real es 40,044 > X2 teórica (3,84) nuestra hipótesis nula es FALSA (Ho) y con lo cual, existirá
dependencia o asociación entre el consumo de tabaco y el bajo peso de los bebés al nacer.
3. Calcula la Odds Ratio
𝑂𝑅 =
(𝑎 ∗ 𝑑)
(𝑐 ∗ 𝑏)
=
43 ∗ 1645
105 ∗ 207
= 3,2544
En nuestro caso, la Odds Ratio es mayor a 1, por tanto, OR>1 la presencia de dicho factor se asocia a una mayor
ocurrencia del evento.
Los resultados obtenidos son los mismos en R-Commander
Al ser la p<.05 se confirma
la hipótesis H1 y por lo
tanto que existe relación.
SEGUNDA ACTIVIDAD
Debemos abrir R commander, seleccionar el directorio de trabajo y abrir el conjunto de datos. Una vez cargado el
conjunto de datos vamos a construir una tabla de contingencia. Para ello pulsamos sobre “estadísticos”, luego sobre
“Tablas de contingencia” y finalmente sobre “Tabla de doble entrada…”. La primera tabla es con las variables “sexo” y
“practicadeporte”
La Chi-cuadrado real es de 19,163 que es mayor que nuestra Chi-cuadrado teórica (3,84) por lo que
rechazamos la H0 y aceptamos H1; esto significa que entre las variables “sexo” y “practicadeporte”
existe relación.
A continuación realizamos el mismo proceso pero con las variables “sexo” y “fruta”.
Los resultados son los
mismos que los
obtenidos con las
variables anteriores;
rechazaríamos de
nuevo H0 y aceptamos
H1 por lo que si existe
relación.

Seminario 7 estadistica

  • 1.
    SEMINARIO 8 ANA ROMEROLOPEZ GRUPO 16
  • 2.
  • 3.
    Si queremos conocersi existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que: - De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. - De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer. 1. Representa los datos en una tabla de contingencia indicando las frecuencias observadas y porcentajes.
  • 4.
    2. Establece unahipótesis adecuada para el estudio. ¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebe con bajo peso al nacer? Para saber si existe o no asociación entre las dos variables que anteriormente hemos indicado necesitamos fijarnos en la “p”. Para saber si es o no dependiente y decidir qué hipótesis aceptar sabemos que: - Ho: No existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer. - H1: Sí existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los bebés. 3. Utiliza la prueba Chi-cuadrado de Pearson para contrastar tu hipótesis. Para poder llevar a cabo esta prueba, necesitamos para seguir la fórmula las frecuencias esperadas, aquellas que deberían haberse observado si aceptamos la Ho; y las frecuencias observadas en nuestro estudio. Tenemos entonces que las frecuencias esperadas serían: 𝐹𝐸11 = 𝑎 + 𝑏 ∗ 𝑎 + 𝑐 𝑛 = 43 + 207 ∗ 43 + 105 2000 = 18,5 𝐹𝐸12 = 𝑏 + 𝑎 ∗ 𝑏 + 𝑑 𝑛 = 207 + 43 ∗ 207 + 1645 2000 = 231,5 𝐹𝐸21 = 𝑐 + 𝑎 ∗ 𝑐 + 𝑑 𝑛 = 105 + 43 ∗ 105 + 1645 2000 = 129,5 𝐹𝐸22 = 𝑑 + 𝑐 ∗ 𝑑 + 𝑏 𝑛 = 1645 + 105 ∗ (1645 + 207) 2000 = 1620,5
  • 5.
    Una vez realizadolos cálculos lo ponemos en pie en una tabla de frecuencias comparando las observadas y las esperadas. A continuación, calculamos la Chi-cuadrado mediante la siguiente fórmula: 𝑋2 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 2 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 = (43 − 18,5)2 18,5 + (207 − 231,5)2 231,5 + (105 − 129,5)2 129,5 + (1645 − 1620,5)2 1620,5 = 40,04436402
  • 6.
    Ya conocemos portanto la X2, es decir, la Chi-cuadrado, por lo que necesitamos saber los grados de libertad. Los grados de libertad se calculan multiplicando el número de filas menos 1 y el número de columnas menos 1: (Número de filas- 1)*(Número de columnas menos 1), que en este caso al encontrarnos ante una variable con dos variables, dicotómicas, nos quedaría (2-1)*(2-1)= 1. Una vez que ya tenemos los datos tanto de la Chi-cuadrado como de los grados de libertad, nos vamos a la tabla de Chi- cuadrado y conocer cuál es la probabilidad que tendrá asociada nuestra Ho. Nuestra Chi-cuadrado teórica es de 3,84 ya que el grado de libertad es 1 y nuestra probabilidad es de 0,05. Teniendo en cuenta lo siguiente: - Si el Chi-cuadrado real (el que hemos calculado) es menor o igual que la Chi-cuadrado  aceptamos la hipótesis nula (son independientes las variables) - Si el Chi-cuadrado real es mayor que la Chi-cuadrado teórica  aceptamos la hipótesis alternativa y por tanto son dependientes ambas variables. - Como X2 real es 40,044 > X2 teórica (3,84) nuestra hipótesis nula es FALSA (Ho) y con lo cual, existirá dependencia o asociación entre el consumo de tabaco y el bajo peso de los bebés al nacer.
  • 7.
    3. Calcula laOdds Ratio 𝑂𝑅 = (𝑎 ∗ 𝑑) (𝑐 ∗ 𝑏) = 43 ∗ 1645 105 ∗ 207 = 3,2544 En nuestro caso, la Odds Ratio es mayor a 1, por tanto, OR>1 la presencia de dicho factor se asocia a una mayor ocurrencia del evento. Los resultados obtenidos son los mismos en R-Commander Al ser la p<.05 se confirma la hipótesis H1 y por lo tanto que existe relación.
  • 8.
  • 9.
    Debemos abrir Rcommander, seleccionar el directorio de trabajo y abrir el conjunto de datos. Una vez cargado el conjunto de datos vamos a construir una tabla de contingencia. Para ello pulsamos sobre “estadísticos”, luego sobre “Tablas de contingencia” y finalmente sobre “Tabla de doble entrada…”. La primera tabla es con las variables “sexo” y “practicadeporte”
  • 10.
    La Chi-cuadrado reales de 19,163 que es mayor que nuestra Chi-cuadrado teórica (3,84) por lo que rechazamos la H0 y aceptamos H1; esto significa que entre las variables “sexo” y “practicadeporte” existe relación.
  • 11.
    A continuación realizamosel mismo proceso pero con las variables “sexo” y “fruta”. Los resultados son los mismos que los obtenidos con las variables anteriores; rechazaríamos de nuevo H0 y aceptamos H1 por lo que si existe relación.