TABLAS DE CONTIGENCIA
Y ASOCIACIÓN ENTRE
VARIABLES
SEMINARIO 7
LAURA LASO RODRÍGUEZ
INTRODUCCIÓN
• R Commander puede realizar operaciones estadísticas de diversas índoles. En
esta ocasión, vamos a realizar actividades relacionadas con la asociación de
variables, utilizando tablas de contingencia.
• Las actividades a realizar son :
• A partir de este ejercicio, realizarlo manualmente y contrastar los resultados con
la actividad hecha en R Commander.
• Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo
peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no
fumadoras y encontramos que:
• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
• Establecer y describir si existe asociación entre las variables del archivo
«activossalud.Rdata» sexo
• Practicadeporte (Si, NO);
• Fruta: 1 – «Nunca o casi nunca», 2- «Menos de una vez por semana», 3- «Una o
dos veces a la semana», 4-»Tres o más veces a la semana», 5 «A diario»
Ejercicio manual y ejercicio a
resolver en R Commander
1º Actividad del seminario 7
• Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al
nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y
encontramos que:
– De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.
– De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
1. Representa los datos en un tabla de contingencia indicando las frecuencias
observadas y porcentajes
2 Establece una hipótesis adecuada para el estudio.
¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebé con
bajo peso al nacer?
Para saber si existe o no asociación entre las dos variables que anteriormente hemos
indicado necesitamos fijarnos en la “p”. Para saber si es o no dependiente y decidir qué
hipótesis aceptar sabemos que:
-H0: No existe asociación entre el consumo de tabaco en mujeres y el bajo peso
al nacer.
-H1: Si existe asociación entre el consumo de tacabo en mujeres y el bajo peso
al nacer de los bebés.
3. Utiliza la prueba Chi-cuadrado de Pearson para contrastar tu hipótesis.
Para poder llevar acabo esta prueba, necesitamos para seguir la fórmula las
frecuencias esperadas, aquellas que deberían haberse observado si aceptamos ha Ho; y
las frecuencias observadas en nuestro estudio.
Tenemos entonces que las frecuencias esperadas serían:
Cuando hemos realizado los cálculos lo ponemos en pie en una tabla de frecuencias
comparando las observadas y las esperadas.
A continuación, calculamos la Chi-cuadrado mediante la siguiente fórmula:
 Ya conocemos por tanto la X2, es decir, la Chi-cuadrado; ahora necesitamos saber
los grados de libertad. Los grados de libertad se calculan multiplicando el número
de filas menos 1 y el número de columnas menos 1. En este caso, nos encontramos
ante dos variables, dicotómicas. Nos quedaría: (2-1)*(2-1)=1.
Cuando ya tenemos los datos tanto de Chi-cuadrado como de los grados de libertad,
nos vamos a la tabla de Chi-cuadrado y miramos cual es la probabilidad que tendrá
asociada nuestra Ho.
 Hay que tener en cuenta lo siguiente.:
-Si el Chi-cuadrado real (el que hemos calculado) es menor o igual que la Chi-
cuadrado--- aceptamos la hipótesis nula (son independientes las variables).
-Si el Chi-cuadrado real es mayor que la Chi-cuadrado teórica- aceptamos la
hipótesis alternativa y por tanto son dependientes ambas variables.
Como X2 real es 40,044> X2 teórica (3.84) nuestra hipótesis nula es FALSA (Ho) y por
ello existirá dependencia o asociación entre el consumo de tabaco y el bajo peso de
los bebés al nacer.
4 Calcula la odds ratio.
En este caso, la Odds Ratio es mayor a 1 lo que significa una mayor ocurrencia del
evento.
5 Repite el ejercicio con R commander ¿Los resultados son los mismos?
Primero abrimos R Commander, cliqueamos sobre “tablas de contingencia” y
finalmente sobre “Introducir y analizar una tabla de doble entrada”
Introducimos
los valores de
nuestra tabla de
*, cogiendo los
datos del
ejercicio
propuesto.
Una vez incluido los dato, cliquemos en aceptar y nos aparecerá en la ventana de
resultado, los valores de Chi-cuadrado y “p”; test exacto de Fisher y la Odds Ratio.
CONCLUSIÓN: los valores de X2
(40.044), “p”, las frecuencias
esperadas, test exacto de Fisher y
Odds ratio (3.25158)presentan
valores similares a los valores
dados al realizar de manera
manual la actividad.
Asociación entre variables de un
conjunto de datos
2º actividad
Primero abrimos R Commander; cargamos el archivo de R “activossalud-
2.Rdata”. Para ello cliqueamos sobre “Datos” y posteriormente sobre
“Cargar conjunto de datos”. (primero hemos determinado el directorio de
trabajo”.
Una vez cargado el conjunto de datos construimos una tabla de contingencia. Para
ello, cliqueamos sobre “estadísticos”, luego sobre “Tablas de contingencia” y
finalmente sobre “tabla de doble entrada…”.
Una vez hecho lo anterior comenzamos a probar la asociación entre ciertas
variables:
a) Entre la variable “SEXO” y la variable “PRACTICADEDEPORTE”.
Conclusión: como podemos ver en los
resultados la X2 reales es 19.163, como la
X2 real es mayor que X2 teórica,
rechazaremos la hipótesis nula (Ho) y, por
tanto al aceptar la hipótesis alternativa
declaramos que existe asociación entre la
variable “sexo” y la variable
“practicadedeporte”.
• Entre la variable “sexo” y la variable “fruta”.
COCLUSIÓN: como podemos ver en los resultados la X2 reales
7.6036; como la X2 reales es mayor que x2 teórica (3.84),
rechazamos la hipótesis nula (Ho) y por tanto al aceptar la
hipótesis alternativa declaramos que existe asociación entre la
variable “sexo” y la variable “fruta”:

Presentación 7

  • 1.
    TABLAS DE CONTIGENCIA YASOCIACIÓN ENTRE VARIABLES SEMINARIO 7 LAURA LASO RODRÍGUEZ
  • 2.
    INTRODUCCIÓN • R Commanderpuede realizar operaciones estadísticas de diversas índoles. En esta ocasión, vamos a realizar actividades relacionadas con la asociación de variables, utilizando tablas de contingencia. • Las actividades a realizar son : • A partir de este ejercicio, realizarlo manualmente y contrastar los resultados con la actividad hecha en R Commander. • Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que: • De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. • De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer. • Establecer y describir si existe asociación entre las variables del archivo «activossalud.Rdata» sexo • Practicadeporte (Si, NO); • Fruta: 1 – «Nunca o casi nunca», 2- «Menos de una vez por semana», 3- «Una o dos veces a la semana», 4-»Tres o más veces a la semana», 5 «A diario»
  • 3.
    Ejercicio manual yejercicio a resolver en R Commander 1º Actividad del seminario 7
  • 4.
    • Si queremosconocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que: – De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. – De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer. 1. Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes
  • 5.
    2 Establece unahipótesis adecuada para el estudio. ¿Existe asociación entre el consumo de tabaco y la probabilidad de tener un bebé con bajo peso al nacer? Para saber si existe o no asociación entre las dos variables que anteriormente hemos indicado necesitamos fijarnos en la “p”. Para saber si es o no dependiente y decidir qué hipótesis aceptar sabemos que: -H0: No existe asociación entre el consumo de tabaco en mujeres y el bajo peso al nacer. -H1: Si existe asociación entre el consumo de tacabo en mujeres y el bajo peso al nacer de los bebés.
  • 6.
    3. Utiliza laprueba Chi-cuadrado de Pearson para contrastar tu hipótesis. Para poder llevar acabo esta prueba, necesitamos para seguir la fórmula las frecuencias esperadas, aquellas que deberían haberse observado si aceptamos ha Ho; y las frecuencias observadas en nuestro estudio. Tenemos entonces que las frecuencias esperadas serían:
  • 7.
    Cuando hemos realizadolos cálculos lo ponemos en pie en una tabla de frecuencias comparando las observadas y las esperadas. A continuación, calculamos la Chi-cuadrado mediante la siguiente fórmula:
  • 8.
     Ya conocemospor tanto la X2, es decir, la Chi-cuadrado; ahora necesitamos saber los grados de libertad. Los grados de libertad se calculan multiplicando el número de filas menos 1 y el número de columnas menos 1. En este caso, nos encontramos ante dos variables, dicotómicas. Nos quedaría: (2-1)*(2-1)=1. Cuando ya tenemos los datos tanto de Chi-cuadrado como de los grados de libertad, nos vamos a la tabla de Chi-cuadrado y miramos cual es la probabilidad que tendrá asociada nuestra Ho.  Hay que tener en cuenta lo siguiente.: -Si el Chi-cuadrado real (el que hemos calculado) es menor o igual que la Chi- cuadrado--- aceptamos la hipótesis nula (son independientes las variables). -Si el Chi-cuadrado real es mayor que la Chi-cuadrado teórica- aceptamos la hipótesis alternativa y por tanto son dependientes ambas variables. Como X2 real es 40,044> X2 teórica (3.84) nuestra hipótesis nula es FALSA (Ho) y por ello existirá dependencia o asociación entre el consumo de tabaco y el bajo peso de los bebés al nacer.
  • 9.
    4 Calcula laodds ratio. En este caso, la Odds Ratio es mayor a 1 lo que significa una mayor ocurrencia del evento. 5 Repite el ejercicio con R commander ¿Los resultados son los mismos? Primero abrimos R Commander, cliqueamos sobre “tablas de contingencia” y finalmente sobre “Introducir y analizar una tabla de doble entrada” Introducimos los valores de nuestra tabla de *, cogiendo los datos del ejercicio propuesto.
  • 10.
    Una vez incluidolos dato, cliquemos en aceptar y nos aparecerá en la ventana de resultado, los valores de Chi-cuadrado y “p”; test exacto de Fisher y la Odds Ratio. CONCLUSIÓN: los valores de X2 (40.044), “p”, las frecuencias esperadas, test exacto de Fisher y Odds ratio (3.25158)presentan valores similares a los valores dados al realizar de manera manual la actividad.
  • 11.
    Asociación entre variablesde un conjunto de datos 2º actividad
  • 12.
    Primero abrimos RCommander; cargamos el archivo de R “activossalud- 2.Rdata”. Para ello cliqueamos sobre “Datos” y posteriormente sobre “Cargar conjunto de datos”. (primero hemos determinado el directorio de trabajo”.
  • 13.
    Una vez cargadoel conjunto de datos construimos una tabla de contingencia. Para ello, cliqueamos sobre “estadísticos”, luego sobre “Tablas de contingencia” y finalmente sobre “tabla de doble entrada…”.
  • 14.
    Una vez hecholo anterior comenzamos a probar la asociación entre ciertas variables: a) Entre la variable “SEXO” y la variable “PRACTICADEDEPORTE”. Conclusión: como podemos ver en los resultados la X2 reales es 19.163, como la X2 real es mayor que X2 teórica, rechazaremos la hipótesis nula (Ho) y, por tanto al aceptar la hipótesis alternativa declaramos que existe asociación entre la variable “sexo” y la variable “practicadedeporte”.
  • 15.
    • Entre lavariable “sexo” y la variable “fruta”. COCLUSIÓN: como podemos ver en los resultados la X2 reales 7.6036; como la X2 reales es mayor que x2 teórica (3.84), rechazamos la hipótesis nula (Ho) y por tanto al aceptar la hipótesis alternativa declaramos que existe asociación entre la variable “sexo” y la variable “fruta”: