SEMINARIO 7:
ANÁLISIS BIVARIADO CON VARIABLES
CUALITATIVA (PROPORCIONES)
ALEJANDRA MARTÍN BERNAL
ESTADÍSTICA Y TICs
1º ENFERMERÍA
GRUPO 4; SUBGRUPO 17
ACTIVIDAD 1
Se realiza una encuesta a 2000 mujeres para conocer si existe
asociación entre el consumo de tabaco y el bajo peso al nacer.
Estudiamos a 250 mujeres fumadoras y a 1750 mujeres no
fumadoras, encontrando que:
– De las 250 mujeres fumadoras, 43 tienen un niño con bajo
peso al nacer.
– De las 1750 mujeres no fumadoras, 105 tienen un niño con
bajo peso al nacer.
Para ello, lo realizaremos en varios pasos:
1. Representa los datos en una tabla de contingencia
indicando las frecuencias observadas y porcentajes.
BAJO PESO PESO NORMAL TOTAL
FUMADORAS 43 250-43 = 207 250
% 43/250 X 100= 17’2 82’8 100
NO FUMADORAS 105 1645 1750
% 6 94 100
TOTAL 148 1852 2000
% TOTAL 7’4 92’6 1000
2. Establece una hipótesis adecuada para el
estudio.
Hipótesis nula (H0)= existe independencia entre fumar y tener un bebé con
bajo peso al nacer, por lo que no hay asociación entre dichas variables.
Hipótesis alternativa (H1)= existe dependencia entre fumar y tener un bebé
con bajo peso al nacer por lo tanto, hay asociación entre las variables.
3. Utiliza la prueba chi-cuadrado de Pearson para
contrastar tu hipótesis.
Para contrastar nuestra hipótesis y determinar cual es la que vamos a aceptar y cual a rechazar, realizaremos la
prueba de Chi-cuadrado donde en primer lugar tendremos que calcular las frecuencias esperadas.
Las fórmulas que utilizaremos son las siguientes:
FE11
FE12
FE21
FE22
= (43 + 207) (43 + 105) / 2000 = 18’5
= (43 + 207) (207 + 1645) / 2000 = 231’5
= (105 + 1645) (43 + 105) / 2000 = 129’5
= (105 + 1645) (207 + 1645) / 2000 = 1620’5
Una vez calculados los valores esperados, realizamos Chi-cuadrado:
(43 – 18’5)² / 18’5 = 32’44
(207 – 231’5)² / 231’5 = 2’59
(105 – 129’5)² / 129’5 = 4’63
(1645 – 1620’5)² / 1620’5 = 0’37
χ² = 32’44 + 2’59 + 4’63 + 0’37 = 40’04 (Este será el valor de Chi-cuadrado
observado).
Como el grado de libertad es 1 porque tenemos una tabla de 2x2 y el
valor de significación es 0’05, observamos que el valor de Chi-
cuadrado teórico es 3’8415.
Y como el valor de chi-cuadrado observado es mayor que el teórico (40’04 > 3’8415),
rechazamos la hipótesis nula, quedándonos con la alternativa (H1), por lo que si hay
asociación entre fumar y tener un hijo con bajo peso al nacer.
4. Calcula la odds ratio.
Para calcularla utilizaremos la siguiente fórmula:
OR = (43 X 1645) / (207 X 105) = 70’735/21’735 = 3’254
Observamos que por cada mujer que fuman y tiene hijos con bajo peso, hay 3’254
mujeres que fuman y tienen hijos con bajo peso, por lo tato hay una fuerte asociación
y una mayor probabilidad.
5. Repite el ejercicio con R Commander ¿los
resultados son los mismos?
En primer lugar, pinchamos en la pestaña de “Estadísticos”, seleccionamos “Tablas de
contingencia” y le damos a la opción de “Introducir y analizar una tabla de doble entrada”.
Introducimos las frecuencias en nuestra tabla para interpretar los datos y pinchamos
en la pestaña “Estadísticos” para incluir las frecuencias esperadas y el Test de
independencia de Chi-cuadrado.
Una vez obtenidos los resultados vemos que son prácticamente iguales pues tenemos
que Chi-cuadrado es 40’044 y la Odds ratio es 3’251, por tanto aceptaríamos la H1
habiendo asociación y dependencia entre fumar y tener hijos con bajo peso al nacer.
ACTIVIDAD 2
Siguiendo todos los pasos anteriores establece y describe si existe
asociación entre las variables del archivo “activossalud.Rdata” sexo y:
– Practicadeporte (Sí, No)
– Fruta:
1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos
veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.
En primer lugar, nos descargaremos la base de datos que se
encuentra en el seminario 6 de la profesora.
Lo primero que haremos será cargar el conjunto de datos por lo que pincharemos
en la pestaña “Datos” y a continuación, en “Cargar conjunto de datos”.
PARA CALCULAR SI EXISTE ASOCIACIÓN ENTRE EL
SEXO Y LA PRÁCTICA DEPORTIVA:
Seleccionamos la pestaña “Estadísticos”, seguido de “Tablas de
contingencia” y pinchamos en “Tabla de doble entrada”.
Seleccionamos nuestras dos variables “Sexo” y “ Practicadeporte” y en la pestaña
“Estadísticos” incluimos el “Test de independencia Chi-cuadrado” y le damos también a
“imprimir las frecuencias esperadas” comprobando así que podemos utilizar Chi-
cuadrado y no Fisher.
Nos aparecerá estos resultados:
Chi-cuadrado observado = 19’163 y chi-cuadrado teórico = 3’84 (por el grado de libertad y
el valor de significación)
Como 19’163 > 3’84, nos quedamos con la hipótesis alternativa rechazando así la
nula y esto quiere decir que sí existe asociación entre el sexo y practicar deportes,
es decir, son dependientes.
PARA CALCULAR SI EXISTE ASOCIACIÓN ENTRE EL
SEXO Y LA INGESTA DE FRUTA:
Volvemos a realizar los mismos pasos y elegimos en este caso “sexo” y “fruta” y
volvemos a incluir el “Test de independencia de Chi-cuadrado” e “imprimir
frecuencias esperadas”.
Y estos son los resultados obtenidos:
En este caso, tenemos que el valor de chi-cuadrado observado es 7’603 y que el del
chi-cuadrado teórico (al tener 4 grados de libertad y un valor de significación de 0’05) es 9’487, por lo
que 7’603 < 9’487 y por ello aceptaríamos la hipótesis nula, rechazando la H1 pues se
observa que no existe asociación entre el sexo y comer fruta, es decir, son
independientes.

Seminario 7

  • 1.
    SEMINARIO 7: ANÁLISIS BIVARIADOCON VARIABLES CUALITATIVA (PROPORCIONES) ALEJANDRA MARTÍN BERNAL ESTADÍSTICA Y TICs 1º ENFERMERÍA GRUPO 4; SUBGRUPO 17
  • 2.
  • 3.
    Se realiza unaencuesta a 2000 mujeres para conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer. Estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras, encontrando que: – De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. – De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer. Para ello, lo realizaremos en varios pasos:
  • 4.
    1. Representa losdatos en una tabla de contingencia indicando las frecuencias observadas y porcentajes. BAJO PESO PESO NORMAL TOTAL FUMADORAS 43 250-43 = 207 250 % 43/250 X 100= 17’2 82’8 100 NO FUMADORAS 105 1645 1750 % 6 94 100 TOTAL 148 1852 2000 % TOTAL 7’4 92’6 1000
  • 5.
    2. Establece unahipótesis adecuada para el estudio. Hipótesis nula (H0)= existe independencia entre fumar y tener un bebé con bajo peso al nacer, por lo que no hay asociación entre dichas variables. Hipótesis alternativa (H1)= existe dependencia entre fumar y tener un bebé con bajo peso al nacer por lo tanto, hay asociación entre las variables.
  • 6.
    3. Utiliza laprueba chi-cuadrado de Pearson para contrastar tu hipótesis. Para contrastar nuestra hipótesis y determinar cual es la que vamos a aceptar y cual a rechazar, realizaremos la prueba de Chi-cuadrado donde en primer lugar tendremos que calcular las frecuencias esperadas. Las fórmulas que utilizaremos son las siguientes:
  • 7.
    FE11 FE12 FE21 FE22 = (43 +207) (43 + 105) / 2000 = 18’5 = (43 + 207) (207 + 1645) / 2000 = 231’5 = (105 + 1645) (43 + 105) / 2000 = 129’5 = (105 + 1645) (207 + 1645) / 2000 = 1620’5
  • 8.
    Una vez calculadoslos valores esperados, realizamos Chi-cuadrado: (43 – 18’5)² / 18’5 = 32’44 (207 – 231’5)² / 231’5 = 2’59 (105 – 129’5)² / 129’5 = 4’63 (1645 – 1620’5)² / 1620’5 = 0’37 χ² = 32’44 + 2’59 + 4’63 + 0’37 = 40’04 (Este será el valor de Chi-cuadrado observado).
  • 9.
    Como el gradode libertad es 1 porque tenemos una tabla de 2x2 y el valor de significación es 0’05, observamos que el valor de Chi- cuadrado teórico es 3’8415. Y como el valor de chi-cuadrado observado es mayor que el teórico (40’04 > 3’8415), rechazamos la hipótesis nula, quedándonos con la alternativa (H1), por lo que si hay asociación entre fumar y tener un hijo con bajo peso al nacer.
  • 10.
    4. Calcula laodds ratio. Para calcularla utilizaremos la siguiente fórmula: OR = (43 X 1645) / (207 X 105) = 70’735/21’735 = 3’254 Observamos que por cada mujer que fuman y tiene hijos con bajo peso, hay 3’254 mujeres que fuman y tienen hijos con bajo peso, por lo tato hay una fuerte asociación y una mayor probabilidad.
  • 11.
    5. Repite elejercicio con R Commander ¿los resultados son los mismos? En primer lugar, pinchamos en la pestaña de “Estadísticos”, seleccionamos “Tablas de contingencia” y le damos a la opción de “Introducir y analizar una tabla de doble entrada”.
  • 12.
    Introducimos las frecuenciasen nuestra tabla para interpretar los datos y pinchamos en la pestaña “Estadísticos” para incluir las frecuencias esperadas y el Test de independencia de Chi-cuadrado.
  • 13.
    Una vez obtenidoslos resultados vemos que son prácticamente iguales pues tenemos que Chi-cuadrado es 40’044 y la Odds ratio es 3’251, por tanto aceptaríamos la H1 habiendo asociación y dependencia entre fumar y tener hijos con bajo peso al nacer.
  • 14.
  • 15.
    Siguiendo todos lospasos anteriores establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y: – Practicadeporte (Sí, No) – Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.
  • 16.
    En primer lugar,nos descargaremos la base de datos que se encuentra en el seminario 6 de la profesora.
  • 17.
    Lo primero queharemos será cargar el conjunto de datos por lo que pincharemos en la pestaña “Datos” y a continuación, en “Cargar conjunto de datos”.
  • 18.
    PARA CALCULAR SIEXISTE ASOCIACIÓN ENTRE EL SEXO Y LA PRÁCTICA DEPORTIVA: Seleccionamos la pestaña “Estadísticos”, seguido de “Tablas de contingencia” y pinchamos en “Tabla de doble entrada”.
  • 19.
    Seleccionamos nuestras dosvariables “Sexo” y “ Practicadeporte” y en la pestaña “Estadísticos” incluimos el “Test de independencia Chi-cuadrado” y le damos también a “imprimir las frecuencias esperadas” comprobando así que podemos utilizar Chi- cuadrado y no Fisher.
  • 20.
    Nos aparecerá estosresultados: Chi-cuadrado observado = 19’163 y chi-cuadrado teórico = 3’84 (por el grado de libertad y el valor de significación) Como 19’163 > 3’84, nos quedamos con la hipótesis alternativa rechazando así la nula y esto quiere decir que sí existe asociación entre el sexo y practicar deportes, es decir, son dependientes.
  • 21.
    PARA CALCULAR SIEXISTE ASOCIACIÓN ENTRE EL SEXO Y LA INGESTA DE FRUTA: Volvemos a realizar los mismos pasos y elegimos en este caso “sexo” y “fruta” y volvemos a incluir el “Test de independencia de Chi-cuadrado” e “imprimir frecuencias esperadas”.
  • 22.
    Y estos sonlos resultados obtenidos: En este caso, tenemos que el valor de chi-cuadrado observado es 7’603 y que el del chi-cuadrado teórico (al tener 4 grados de libertad y un valor de significación de 0’05) es 9’487, por lo que 7’603 < 9’487 y por ello aceptaríamos la hipótesis nula, rechazando la H1 pues se observa que no existe asociación entre el sexo y comer fruta, es decir, son independientes.