2. INTRODUCCIÓN
• R Commander puede realizar operaciones estadísticas de diversas índoles. En
esta ocasión, vamos a realizar actividades relacionadas con la asociación de
variables, utilizando tablas de contingencia.
• Las actividades a realizar son :
• A partir de este ejercicio, realizarlo manualmente y contrastar los resultados con
la actividad hecha en R Commander.
• Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo
peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no
fumadoras y encontramos que:
• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
• Establecer y describir si existe asociación entre las variables del archivo
«activossalud.Rdata» sexo
• Practicadeporte (Si, NO);
• Fruta: 1 – «Nunca o casi nunca», 2- «Menos de una vez por semana», 3- «Una o
dos veces a la semana», 4-»Tres o más veces a la semana», 5 «A diario»
3. Ejercicio manual y ejercicio a
resolver en R Commander
1º Actividad del seminario 7
4. • Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al
nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y
encontramos que:
– De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
– De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
1. Representa los datos en un tabla de contingencia indicando las frecuencias
observadas y porcentajes
5. 2 Establece una hipótesis adecuada para el estudio.
¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebé con
bajo peso al nacer?
Para saber si existe o no asociación entre las dos variables que anteriormente hemos
indicado necesitamos fijarnos en la “p”. Para saber si es o no dependiente y decidir qué
hipótesis aceptar sabemos que:
-H0: No existe asociación entre el consumo de tabaco en mujeres y el bajo peso
al nacer.
-H1: Si existe asociación entre el consumo de tacabo en mujeres y el bajo peso
al nacer de los bebés.
6. 3. Utiliza la prueba Chi-cuadrado de Pearson para contrastar tu hipótesis.
Para poder llevar acabo esta prueba, necesitamos para seguir la fórmula las
frecuencias esperadas, aquellas que deberían haberse observado si aceptamos ha Ho; y
las frecuencias observadas en nuestro estudio.
Tenemos entonces que las frecuencias esperadas serían:
7. Cuando hemos realizado los cálculos lo ponemos en pie en una tabla de frecuencias
comparando las observadas y las esperadas.
A continuación, calculamos la Chi-cuadrado mediante la siguiente fórmula:
8. Ya conocemos por tanto la X2, es decir, la Chi-cuadrado; ahora necesitamos saber
los grados de libertad. Los grados de libertad se calculan multiplicando el número
de filas menos 1 y el número de columnas menos 1. En este caso, nos encontramos
ante dos variables, dicotómicas. Nos quedaría: (2-1)*(2-1)=1.
Cuando ya tenemos los datos tanto de Chi-cuadrado como de los grados de libertad,
nos vamos a la tabla de Chi-cuadrado y miramos cual es la probabilidad que tendrá
asociada nuestra Ho.
Hay que tener en cuenta lo siguiente.:
-Si el Chi-cuadrado real (el que hemos calculado) es menor o igual que la Chi-
cuadrado--- aceptamos la hipótesis nula (son independientes las variables).
-Si el Chi-cuadrado real es mayor que la Chi-cuadrado teórica- aceptamos la
hipótesis alternativa y por tanto son dependientes ambas variables.
Como X2 real es 40,044> X2 teórica (3.84) nuestra hipótesis nula es FALSA (Ho) y por
ello existirá dependencia o asociación entre el consumo de tabaco y el bajo peso de
los bebés al nacer.
9. 4 Calcula la odds ratio.
En este caso, la Odds Ratio es mayor a 1 lo que significa una mayor ocurrencia del
evento.
5 Repite el ejercicio con R commander ¿Los resultados son los mismos?
Primero abrimos R Commander, cliqueamos sobre “tablas de contingencia” y
finalmente sobre “Introducir y analizar una tabla de doble entrada”
Introducimos
los valores de
nuestra tabla de
*, cogiendo los
datos del
ejercicio
propuesto.
10. Una vez incluido los dato, cliquemos en aceptar y nos aparecerá en la ventana de
resultado, los valores de Chi-cuadrado y “p”; test exacto de Fisher y la Odds Ratio.
CONCLUSIÓN: los valores de X2
(40.044), “p”, las frecuencias
esperadas, test exacto de Fisher y
Odds ratio (3.25158)presentan
valores similares a los valores
dados al realizar de manera
manual la actividad.
12. Primero abrimos R Commander; cargamos el archivo de R “activossalud-
2.Rdata”. Para ello cliqueamos sobre “Datos” y posteriormente sobre
“Cargar conjunto de datos”. (primero hemos determinado el directorio de
trabajo”.
13. Una vez cargado el conjunto de datos construimos una tabla de contingencia. Para
ello, cliqueamos sobre “estadísticos”, luego sobre “Tablas de contingencia” y
finalmente sobre “tabla de doble entrada…”.
14. Una vez hecho lo anterior comenzamos a probar la asociación entre ciertas
variables:
a) Entre la variable “SEXO” y la variable “PRACTICADEDEPORTE”.
Conclusión: como podemos ver en los
resultados la X2 reales es 19.163, como la
X2 real es mayor que X2 teórica,
rechazaremos la hipótesis nula (Ho) y, por
tanto al aceptar la hipótesis alternativa
declaramos que existe asociación entre la
variable “sexo” y la variable
“practicadedeporte”.
15. • Entre la variable “sexo” y la variable “fruta”.
COCLUSIÓN: como podemos ver en los resultados la X2 reales
7.6036; como la X2 reales es mayor que x2 teórica (3.84),
rechazamos la hipótesis nula (Ho) y por tanto al aceptar la
hipótesis alternativa declaramos que existe asociación entre la
variable “sexo” y la variable “fruta”: