Seminario 8: Chi cuadrado de
Pearson
• El estadístico Chi cuadrado de Pearson se puede
utilizar para:
– Estudiar la relación o independencia de una variable
con más de una categoría
• Es una prueba de conformidad o bondad de ajuste
– Estudiar la relación entre dos o más muestras o
poblaciones
• Es una prueba de homogeneidad
– Entre dos o más variables de una población de la que
hemos extraído una muestra
• Es una prueba de independencia o relación
Recordemos que…
La prueba o estadístico Chi cuadrado se utiliza
para comprobar si la diferencia en los datos que
observamos:
– Está dentro de lo normal y probable, es decir, la
diferencia que observamos en los datos es debida
al azar
• Recordemos que la Ho establece que no hay diferencia
o lo que es lo mismo hay igualdad.
• Aceptamos la Ho
– La diferencia que observamos es debida a algo
más
• Rechazamos la Hipótesis Nula
Condiciones para aplicarla…
• Las observaciones deben ser independientes.
– Es decir, al clasificar los sujetos en cada casilla debe haber sujetos
distintos; no puede haber sujetos repetidos en más de una casilla. Ni
los sujetos se pueden clasificar en más de un lugar.
• Utilizar en variables cualitativas
• Más de 50 casos
• Las frecuencias teóricas o esperadas en cada casilla de
clasificación no deben ser inferiores a 5.
– Es tolerable que un 20% de las casillas tengan una frecuencia teórica
inferior a 5, pero no deben ser muy inferiores.
• Si no se cumplen los requisitos
– Utilizar el estadístico de Fisher
– Corrección de continuidad de Yates
• Actualmente discutido por bastantes autores y se puede no tener en
cuenta
• Conviene mencionarla porque responde a una práctica muy generalizada y figura
en muchos textos.
Recordar …
• Frecuencia observada: la que recogen los
datos
• Frecuencia esperada: la que observaríamos si
no hubiera relación
• Grados de libertad…
Se trata de comparar las frecuencias observadas
y las frecuencias esperadas
Grados de libertad
• Número de valores o datos que pueden variar libremente
dado un determinado resultado
• Si un criterio de clasificación. Ejemplo: 300 sujetos están
clasificados según elijan A, B o C (tres categorías de
clasificación)
– Grados de libertad = k -1 (número de categorías menos una)
– Grados de libertad serán 3-1 = 2
• Si dos criterios de clasificación.
- Grados de libertad = (f -1)(c -1)
(número de filas menos una) por (número de columnas menos una).
Si comparamos una variable…
• Si se da el caso que las frecuencias esperadas sean pequeñas
o menores de 5… no se puede utilizar el estadístico Chi
– ¿Qué hacemos?
• Reagrupar los valores de las categorías
• Utilizar
– la Prueba exacta de Fisher
– Corrección de Yates
La Chi… para comparar dos variables…
• Para comparar dos variables cualitativas: tabla de
contingencia
• Poner las frecuencias observadas (datos)
• Calcular las frecuencias teóricas o esperadas
– Es importante caer en la cuenta de que la suma de las frecuencias
observadas debe ser igual a la suma de las frecuencias teóricas
• Estas sumas (de todas las frecuencias observadas y de todas las
frecuencias teóricas) con frecuencia no son idénticas porque
redondeamos los decimales, pero deben ser muy parecidas
• Calcular los grados de libertad

Calcular los grados de libertad
• Los grados de libertad son igual al número de valores o datos que pueden
variar libremente dado un determinado resultado (o resultados).
– Grados de libertad = k -1 (número de categorías menos una)
• Si un criterio de clasificación
– Ejemplo si hay 300 sujetos están clasificados según elijan A, B o C (tres
categorías de clasificación)
• Grados de libertad serán 3-1 = 2.
• Si dos criterios de clasificación
– Grados de libertad = (f -1)(c -1)
(número de filas menos una) por (número de columnas menos una).
Los software informáticos… nos facilitan la vida
• Analizar------Estadísticos Descriptivos------
Tablas de contingencia
• Elegir las dos variables categóricas.
• Contrasta la hipótesis de que las dos variables
a contrastar son independientes.
Chi en SPSS
Ejercicio casa blog
Una enfermera analiza las historias de enfermería de
292 mujeres y de 192 hombres que cuidan a familiares
dependientes. De entre todas las historias revisadas,
observa que 450 personas presentan cansancio en el
rol de cuidador, de las cuales 168 son hombres y 282
mujeres. Trabaja con un nivel de confianza del 99%.
¿Existe relación entre tener cansancio en el rol del
cuidador y el sexo?
¿Podemos aplicar chi cuadrado?
• Se trata de variables cualitativas, sexo y
cansancio.
• Son excluyentes (dos observaciones
independientes).
• En la tabla de frecuencias esperadas no puede
haber valores menor que 5.
Procedimiento
1. Establecer la hipótesis nula.
2. Realizar una tabla con los datos observados o frecuencias
observadas.
3. Calcular los grados de libertad.
4. Calcular las frecuencias esperadas o teóricas.
5. Utilizar el estadístico.
6. Compararlo con las tablas al nivel de significación fijado.
7. Aceptar o rechazar la H0.
2
2 ( )fo ft
ft


 
1. Formular las hipótesis.
– Ho: No existe relación entre tener
cansancio en el rol del cuidador y el sexo
(no hay diferencias).
– H1: Existe relación entre tener cansancio
en el rol del cuidador y el sexo.
2. Tabla de frecuencias observadas
Sí presentan
cansancio
No presentan
cansancio
Total
Mujeres 282 10 292
Hombres 168 24 192
Total 450 34 484
Para calcular las frecuencias observadas…
3. Tabla de frecuencias esperadas (teóricas)
Sí presentan
cansancio
No presentan
cansancio
Total
Mujeres 271,5 20,5 292
Hombres 178,5 13,5 192
Total 450 34 484
4. Aplicar la fórmula
2

Celda a = (282 – 271,5)2 / 271,5 = 0,41
Celda b = (10 – 20,5)2 / 20,5 = 5,38
Celda c = (168 – 178,5)2 / 178,5 = 0,62
Celda d = (24 – 13,5)2 / 13,5 = 8,17
X2 = = 0,41 + 5,38 + 0,62 + 8,17 = 14,58
2
2 ( )fo ft
ft


 
5. Calcular los grados de libertad: (2-1)(2-1) = 1
6. Buscar en la tabla de la a un nivel de
significación del 0,01 y con un grado de
libertad el valor es = 6,64
2

7. Conclusiones …
X2 real= 14,58 (chi observada en los datos o que obtenemos
mediante la fórmula)
X2
0,01; 1 (teórica) = 6,64 (la que habría esperar si no hubiera
diferencia)
Puesto que la X2real > X2teórica, se rechaza la Hipótesis nula. Lo
que quiere decir que si existe relación entre tener cansancio del
rol de cuidador y el sexo. Al rechazar la hipótesis nula estamos
diciendo que las diferencias encontradas son estadísticamente
significativas, lo que es lo mismo, no es debido al azar.

Seminario 8

  • 1.
    Seminario 8: Chicuadrado de Pearson
  • 2.
    • El estadísticoChi cuadrado de Pearson se puede utilizar para: – Estudiar la relación o independencia de una variable con más de una categoría • Es una prueba de conformidad o bondad de ajuste – Estudiar la relación entre dos o más muestras o poblaciones • Es una prueba de homogeneidad – Entre dos o más variables de una población de la que hemos extraído una muestra • Es una prueba de independencia o relación Recordemos que…
  • 3.
    La prueba oestadístico Chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos: – Está dentro de lo normal y probable, es decir, la diferencia que observamos en los datos es debida al azar • Recordemos que la Ho establece que no hay diferencia o lo que es lo mismo hay igualdad. • Aceptamos la Ho – La diferencia que observamos es debida a algo más • Rechazamos la Hipótesis Nula
  • 4.
    Condiciones para aplicarla… •Las observaciones deben ser independientes. – Es decir, al clasificar los sujetos en cada casilla debe haber sujetos distintos; no puede haber sujetos repetidos en más de una casilla. Ni los sujetos se pueden clasificar en más de un lugar. • Utilizar en variables cualitativas • Más de 50 casos • Las frecuencias teóricas o esperadas en cada casilla de clasificación no deben ser inferiores a 5. – Es tolerable que un 20% de las casillas tengan una frecuencia teórica inferior a 5, pero no deben ser muy inferiores. • Si no se cumplen los requisitos – Utilizar el estadístico de Fisher – Corrección de continuidad de Yates • Actualmente discutido por bastantes autores y se puede no tener en cuenta • Conviene mencionarla porque responde a una práctica muy generalizada y figura en muchos textos.
  • 5.
    Recordar … • Frecuenciaobservada: la que recogen los datos • Frecuencia esperada: la que observaríamos si no hubiera relación • Grados de libertad… Se trata de comparar las frecuencias observadas y las frecuencias esperadas
  • 6.
    Grados de libertad •Número de valores o datos que pueden variar libremente dado un determinado resultado • Si un criterio de clasificación. Ejemplo: 300 sujetos están clasificados según elijan A, B o C (tres categorías de clasificación) – Grados de libertad = k -1 (número de categorías menos una) – Grados de libertad serán 3-1 = 2 • Si dos criterios de clasificación. - Grados de libertad = (f -1)(c -1) (número de filas menos una) por (número de columnas menos una).
  • 7.
    Si comparamos unavariable… • Si se da el caso que las frecuencias esperadas sean pequeñas o menores de 5… no se puede utilizar el estadístico Chi – ¿Qué hacemos? • Reagrupar los valores de las categorías • Utilizar – la Prueba exacta de Fisher – Corrección de Yates
  • 8.
    La Chi… paracomparar dos variables… • Para comparar dos variables cualitativas: tabla de contingencia • Poner las frecuencias observadas (datos) • Calcular las frecuencias teóricas o esperadas – Es importante caer en la cuenta de que la suma de las frecuencias observadas debe ser igual a la suma de las frecuencias teóricas • Estas sumas (de todas las frecuencias observadas y de todas las frecuencias teóricas) con frecuencia no son idénticas porque redondeamos los decimales, pero deben ser muy parecidas • Calcular los grados de libertad 
  • 9.
    Calcular los gradosde libertad • Los grados de libertad son igual al número de valores o datos que pueden variar libremente dado un determinado resultado (o resultados). – Grados de libertad = k -1 (número de categorías menos una) • Si un criterio de clasificación – Ejemplo si hay 300 sujetos están clasificados según elijan A, B o C (tres categorías de clasificación) • Grados de libertad serán 3-1 = 2. • Si dos criterios de clasificación – Grados de libertad = (f -1)(c -1) (número de filas menos una) por (número de columnas menos una).
  • 10.
    Los software informáticos…nos facilitan la vida • Analizar------Estadísticos Descriptivos------ Tablas de contingencia • Elegir las dos variables categóricas. • Contrasta la hipótesis de que las dos variables a contrastar son independientes.
  • 11.
  • 14.
    Ejercicio casa blog Unaenfermera analiza las historias de enfermería de 292 mujeres y de 192 hombres que cuidan a familiares dependientes. De entre todas las historias revisadas, observa que 450 personas presentan cansancio en el rol de cuidador, de las cuales 168 son hombres y 282 mujeres. Trabaja con un nivel de confianza del 99%. ¿Existe relación entre tener cansancio en el rol del cuidador y el sexo?
  • 15.
    ¿Podemos aplicar chicuadrado? • Se trata de variables cualitativas, sexo y cansancio. • Son excluyentes (dos observaciones independientes). • En la tabla de frecuencias esperadas no puede haber valores menor que 5.
  • 16.
    Procedimiento 1. Establecer lahipótesis nula. 2. Realizar una tabla con los datos observados o frecuencias observadas. 3. Calcular los grados de libertad. 4. Calcular las frecuencias esperadas o teóricas. 5. Utilizar el estadístico. 6. Compararlo con las tablas al nivel de significación fijado. 7. Aceptar o rechazar la H0. 2 2 ( )fo ft ft    
  • 17.
    1. Formular lashipótesis. – Ho: No existe relación entre tener cansancio en el rol del cuidador y el sexo (no hay diferencias). – H1: Existe relación entre tener cansancio en el rol del cuidador y el sexo.
  • 18.
    2. Tabla defrecuencias observadas Sí presentan cansancio No presentan cansancio Total Mujeres 282 10 292 Hombres 168 24 192 Total 450 34 484
  • 19.
    Para calcular lasfrecuencias observadas…
  • 20.
    3. Tabla defrecuencias esperadas (teóricas) Sí presentan cansancio No presentan cansancio Total Mujeres 271,5 20,5 292 Hombres 178,5 13,5 192 Total 450 34 484
  • 21.
    4. Aplicar lafórmula 2  Celda a = (282 – 271,5)2 / 271,5 = 0,41 Celda b = (10 – 20,5)2 / 20,5 = 5,38 Celda c = (168 – 178,5)2 / 178,5 = 0,62 Celda d = (24 – 13,5)2 / 13,5 = 8,17 X2 = = 0,41 + 5,38 + 0,62 + 8,17 = 14,58 2 2 ( )fo ft ft    
  • 22.
    5. Calcular losgrados de libertad: (2-1)(2-1) = 1 6. Buscar en la tabla de la a un nivel de significación del 0,01 y con un grado de libertad el valor es = 6,64 2 
  • 24.
    7. Conclusiones … X2real= 14,58 (chi observada en los datos o que obtenemos mediante la fórmula) X2 0,01; 1 (teórica) = 6,64 (la que habría esperar si no hubiera diferencia) Puesto que la X2real > X2teórica, se rechaza la Hipótesis nula. Lo que quiere decir que si existe relación entre tener cansancio del rol de cuidador y el sexo. Al rechazar la hipótesis nula estamos diciendo que las diferencias encontradas son estadísticamente significativas, lo que es lo mismo, no es debido al azar.