SEMINARIO 7
Marta Villanueva Gómez
Estadística y TIC’s
Grupo 16
EJERCICIO 1 PARA EL BLOG.
Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo
peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no
fumadoras y encontramos que:
• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
•
1. Representa los datos en una tabla de contingencia indicando
las frecuencias observadas y los porcentajes.
2. Establece una hipótesis adecuada para el estudio.
La hipótesis para nuestro estudio sería: ¿Existe relación entre el consumo de
tabaco y el tener un hijo con bajo peso?
• Ho: No existe asociación entre el consumo de tabaco y el tener un hijo con
peso bajo.
• H1: Existe asociación entre el consumo de tabaco y el tener hijo con peso
bajo.
•
3. Utiliza la prueba chi cuadrado de Pearson para contrastar tu
hipótesis.
Se calcula mediante la siguiente fórmula:
 
 
Las frecuencias observadas la tenemos en la tabla de contingencia, mientras que
las frecuencias esperadas las tenemos que calcular:
•
• FE11: = 18.5
 
• FE12: = = 231.5
 
• FE21: = 129.5
 
• FE22: = = 1620.5
• Una vez que hemos calculado las frecuencias esperadas, calculamos chi-
cuadrado:
•
•
•
•
• Calculamos el grado de libertad:
(nº filas - 1)·(nº columnas - 1) = (2 – 1) · (2 – 1) = 1
Con el grado de libertad, buscamos la chi cuadrado teórica según el grado de
libertad y para un margen de error del 0,05 (siempre es así, ya que siempre se
trabaja con el valor de confianza del 95%).
•
•
Vemos que la chi-cuadrado teórica es 3,8145 < 40,05, por lo que podemos decir
que rechazamos la hipótesis nula y aceptamos la alternativa à hay asociación
entre el consumo de tabaco y tener un hijo con bajo peso.
4. Calculamos la Odds Ratio
• Como hemos visto que hay asociación, nos dice si esta asociación es fuerte o
no. Se calcula:
= = = 3.254
Como la OR es mayor que 1, quiere decir que la presencia del factor (fumar o
no) se asocia a mayor ocurrencia del evento (bebé con bajo peso).
5. Repite el ejercicio con R Commander.
• Creamos la tabla de contingencia, con los datos anteriores e introducimos los datos.
•
• Seleccionamos en la opción de “Estadísticos”, y señalamos que nos
aparezcan los porcentajes, el test de independencia Chi-cuadrado y el Test
exacto de Fisher.
• Y nos aparecerán los datos.
•
•
•
•
•
•
•
•
Vemos que la odds ratio es muy similar a la
que nos ha dado anteriormente, al igual que
la chi-cuadrado es también prácticamente
igual que la que nos dio en el apartado
anterior
Ejercicio 2Siguiendo todos los pasos anteriores establece y describe si existe asociación
entre las variables del archivo “activossalud.Rdata” sexo y:
• Practicadeporte (Sí, No)
• Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una
o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.
•
1º Paso: Cargamos el conjunto de datos
“activossalud.Rdata”.
 
2º Paso: Hacemos una tabla de contingencia
con la variable sexo y la Practicadeporte
Observando la p-value dada en el chi-cuadrado, como es
P < 0.05, rechazamos la hipótesis nula y afirmamos que las
variables son dependientes.
3º Paso: Crear tabla contingencia con la
variable sexo y fruta
Con el p-value del chi-cuadrado, vemos que P > 0.05, por lo que
aceptamos la hipótesis nula y decimos que las variables son
independientes.

Aa

  • 1.
    SEMINARIO 7 Marta VillanuevaGómez Estadística y TIC’s Grupo 16
  • 2.
    EJERCICIO 1 PARAEL BLOG. Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que: • De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. • De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer. •
  • 3.
    1. Representa losdatos en una tabla de contingencia indicando las frecuencias observadas y los porcentajes.
  • 4.
    2. Establece unahipótesis adecuada para el estudio. La hipótesis para nuestro estudio sería: ¿Existe relación entre el consumo de tabaco y el tener un hijo con bajo peso? • Ho: No existe asociación entre el consumo de tabaco y el tener un hijo con peso bajo. • H1: Existe asociación entre el consumo de tabaco y el tener hijo con peso bajo. •
  • 5.
    3. Utiliza laprueba chi cuadrado de Pearson para contrastar tu hipótesis. Se calcula mediante la siguiente fórmula:     Las frecuencias observadas la tenemos en la tabla de contingencia, mientras que las frecuencias esperadas las tenemos que calcular: •
  • 6.
    • FE11: =18.5   • FE12: = = 231.5   • FE21: = 129.5   • FE22: = = 1620.5
  • 7.
    • Una vezque hemos calculado las frecuencias esperadas, calculamos chi- cuadrado: • • • • • Calculamos el grado de libertad: (nº filas - 1)·(nº columnas - 1) = (2 – 1) · (2 – 1) = 1 Con el grado de libertad, buscamos la chi cuadrado teórica según el grado de libertad y para un margen de error del 0,05 (siempre es así, ya que siempre se trabaja con el valor de confianza del 95%). • •
  • 8.
    Vemos que lachi-cuadrado teórica es 3,8145 < 40,05, por lo que podemos decir que rechazamos la hipótesis nula y aceptamos la alternativa à hay asociación entre el consumo de tabaco y tener un hijo con bajo peso.
  • 9.
    4. Calculamos laOdds Ratio • Como hemos visto que hay asociación, nos dice si esta asociación es fuerte o no. Se calcula: = = = 3.254 Como la OR es mayor que 1, quiere decir que la presencia del factor (fumar o no) se asocia a mayor ocurrencia del evento (bebé con bajo peso).
  • 10.
    5. Repite elejercicio con R Commander. • Creamos la tabla de contingencia, con los datos anteriores e introducimos los datos. •
  • 11.
    • Seleccionamos enla opción de “Estadísticos”, y señalamos que nos aparezcan los porcentajes, el test de independencia Chi-cuadrado y el Test exacto de Fisher.
  • 12.
    • Y nosaparecerán los datos. • • • • • • • • Vemos que la odds ratio es muy similar a la que nos ha dado anteriormente, al igual que la chi-cuadrado es también prácticamente igual que la que nos dio en el apartado anterior
  • 13.
    Ejercicio 2Siguiendo todoslos pasos anteriores establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y: • Practicadeporte (Sí, No) • Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”. •
  • 14.
    1º Paso: Cargamosel conjunto de datos “activossalud.Rdata”.
  • 15.
      2º Paso: Hacemosuna tabla de contingencia con la variable sexo y la Practicadeporte
  • 16.
    Observando la p-valuedada en el chi-cuadrado, como es P < 0.05, rechazamos la hipótesis nula y afirmamos que las variables son dependientes.
  • 17.
    3º Paso: Creartabla contingencia con la variable sexo y fruta
  • 18.
    Con el p-valuedel chi-cuadrado, vemos que P > 0.05, por lo que aceptamos la hipótesis nula y decimos que las variables son independientes.