1. Trabajando con el programa
estadístico “R”
Beatriz Gómez Machuca.Grupo4. Subgrupo 14.
TAREA DEL SEMINARIO 7
2. PRIMERA ACTIVIDAD
• Si queremos conocer si existe asociación entre el consumo de
tabaco y el bajo peso al nacer; estudiamos a 250 mujeres
fumadoras y a 1750 mujeres no fumadoras y encontramos que:
– De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
– De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al
nacer.
1. Representa los datos en un tabla de contingencia indicando las frecuencias
observadas y porcentajes
2. Establece una hipótesis adecuada para el estudio
3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis
4. Calcula la odds ratio
5. Repite el ejercicio con R Commander ¿Los resultados son los mismos?
6. Sube los resultados al blog
3. Niños sin bajo
peso
Niños con bajo
peso
TOTAL
Mujeres fumadoras 207 43 250
Porcentaje (%) 82,8% 17,2% 100%
Mujeres no fumadoras 1645 105 1750
Porcentaje (%) 94% 6% 100%
TOTAL 1852 148 2000
TOTAL (%) 92,6% 7,4% 100%
1.-Como bien dice el ejercicio, antes que nada, debemos realizar una tabla de
contingencia de doble entrada para indicar las frecuencias observadas y los
porcentajes. Con esto pretendemos saber si existe relación entre las variables
dicotómicas “madre fumadora” y “peso del bebé”.
4. • Ho : no existe relación alguna entre el
consumo de tabaco por parte de la madre y el
peso de su hijo al nacer (son independientes).
• H1: existe relación entre el consumo de
tabaco por parte de la madre y el peso de su
hijo al nacer (son dependientes).
2.- Una hipótesis adecuada sería ¿ Existe alguna relación entre el consumo de tabaco
de las mujeres y el bajo peso de sus hijos recién nacidos?
5. Las frecuencias esperadas se calculan a través del producto de los valores
totales marginales dividido por le número total de casos (n).
3.- El paso siguiente es utilizar la prueba chi-cuadrado de Pearson para contrastar mi
hipótesis y saber si estas variables cualitativas están o no asociadas. Para ello,
hemos de calcular las frecuencias esperadas.
6. Niños sin bajo peso Niños con bajo
peso
TOTAL
Mujeres fumadoras
(F. O)
207 43 250
F. esperada 231,5 18,5
Porcentaje (%) 82,8% 17,2% 100%
Mujeres no
fumadoras (F.O)
1645 105 1750
F. esperada 1620,5 129,5
Porcentaje (%) 94% 6% 100%
TOTAL 1852 148 2000
TOTAL (%) 92,6% 7,4% 100%
Volvemos a realizar la tabla pero esta vez con las frecuencias esperadas ya incluidas
para una mejor comprensión.
7. DF: (fila-1)x(columna-1).
Al ser una tabla de 2x2 sería 1.
VALOR P= 0,05
Por lo tanto legamos a la conclusión de que:
Así, podemos realizar ya el chi-cuadrado:
Ahora, nos hace falta calcular el
grado de libertad.
8. Podemos concluir diciendo que al ser
esta menor que 1 afirma de nuevo el
hecho de que son dependientes.
Como podemos observar, al ser la chi-cuadrado
teórica menor que la real, podemos rechazar la
hipótesis nula y aceptar por lo tanto la hipótesis
alternativa.
LAS DOS VARIABLES SON DEPENDIENTES, EXISTE
RELACIÓN ENTRE AMBAS, UNA VARIABLE SE
COMPORTA EN FUNCIÓN DE LA OTRA.
4.- El paso siguiente sería
calcular la Odds ratio.
9. 5.- Para finalizar debemos comparar si sucede lo mismo al utilizar el programa
estadístico “R Commander”. Al abrir el programa, accedemos a ESTADISTICOS –
TABLAS DE CONTINGENCIA - INTRODUCIR Y ANALIZAR UNA TABLA DE DOBLE ENTRADA
10. Podemos ver ya la tabla y que el chi-cuadrado teórico, el grado de libertad, las
frecuencias esperadas y la Odds Ratio coincide con el que hemos calculado
Además podemos ver
aquí que el P-valor es
menor que 0,05 por lo
que podemos asegurar
de nuevo que existe
relación entre las
variables y que son
dependientes.
11. SEGUNDA ACTIVIDAD
• Siguiendo todos los pasos anteriores establece
y describe si existe asociación entre las
variables del archivo “activossalud.Rdata”
sexo y:
– Practicadeporte (Sí, No)
– Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una
vez por semana”, 3-“Una o dos veces a la
semana”, 4- “Tres o más veces a la semana”, 5 “A
diario”
12. Para comenzar la segunda actividad debemos primero cargar los datos en el programa
estadístico R. Para ello elegimos DATOS-> CARGAR CONJUNTO DE DATOS -> ELEGIMOS
EL ARCHIVO-> COMPROBAMOS SI SE HA CARGADO.
13. Ahora, debemos realizar una tabla de contingencia para poder así si tiene relación la
variable “sexo” con la “practica de deporte”.
14. A continuación, podemos hacer la tabla de contingencia de nuevo pero esta vez
relacionando la variable “sexo” con la “fruta”.
15. Como vemos
Pvalor < 0,05 por lo
que rechazamos la
hipótesis nula y
aceptamos la
alternativa,
habiendo así
relación entre
ambas variables,
son dependientes.
Sin embargo en este caso Pvalor > 0.05 aceptando así la hipótesis nula y
rechazando la alternativa. No son dependientes y no tienen relación entre si.