POEMAS ILUSTRADOS DE LUÍSA VILLALTA. Elaborados polos alumnos de 4º PDC do IE...
CLASE 7 Y 8 CHI CUADRADO.
1. Nombre del contenido:
Distribución chi cuadrada.
Nombre de la asignatura:
Estadística Computacional
Nombre del docente:
Ing. Daniel Alberto Meléndez Martínez
2. ✓Utilizar las diferentes distribuciones de
probabilidad para resolver problemas prácticos.
✓Utilizar la distribución chi cuadrado, para
someter a prueba hipótesis referidas a
frecuencias.
Competencias de
la asignatura
3. Contenidos a desarrollar
• Distribución chi cuadrado.
• Características de la distribución chi
cuadrado.
• Cálculo del valores chi cuadrado.
4. Introducción al contenido
El matemático inglés Karl Pearson (1857 / 1936),
con formación en literatura medieval alemana,
derecho romano, física, biología y teoría política
del socialismo, hasta 1890 sobresalió por aplicar
ampliamente la Estadística y la Teoría de la
Probabilidad a la solución de diferentes problemas
de la ingeniería industrial.
Se deriva de la distribución normal y la
distribución gamma.
5. Características de la distribución Chi cuadrada
• La distribución tiene un solo parámetro, k, denominado grados de libertad de la variable
aleatoria. La variable aleatoria continua X tiene una distribución chi cuadrada, con k grados
de libertad, si su función de densidad es dada por:
• 𝑓 𝑥; 𝑘 = ൞
1
2
𝑘
2Γ
𝑘
2
𝑥
𝑘
2
−1𝑒
−
𝑥
2
𝑝𝑎𝑟𝑎 𝑥 ≥ 0
0 𝑝𝑎𝑟𝑎 𝑥 < 0
• Donde k es un entero positivo.
6. Cálculo de valores chi
cuadrado
A menudo, la propia definición del tipo de
variable lleva implícitos los valores de sus
parámetros o de parte de ellos; si esto no
fuera así dichos parámetros se estimarán
a partir de la muestra de valores de la
variable que se utiliza para realizar la
prueba de ajuste.
𝒙𝟐 =
σ(𝑶𝒊 − 𝐄𝐢)𝟐
𝑬𝒊
La media y la varianza de la distribución
chi cuadrado son k y 2k respectivamente.
7. Como se obtienen las frecuencias observadas y esperadas
𝒙𝟐
=
σ(𝑶𝒊 − 𝐄𝐢)𝟐
𝑬𝒊
𝑶𝒊 = frecuencias observadas, obtenidas de la muestra.
E𝒊 = frecuencias esperadas. Se calculan de la forma siguiente:
E𝒊 =
𝑡𝑜𝑡𝑎𝑙 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙 𝑑𝑒 𝑟𝑒𝑛𝑔𝑙𝑜𝑛 ∗ 𝑡𝑜𝑡𝑎𝑙 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙 𝑑𝑒 𝑐𝑜𝑙𝑢𝑚𝑛𝑎
𝑇
8. Regla de decisión
Obteniendo los GL que corresponden a la tabla
de distribución de chi cuadrada, además un nivel
de significancia alfa “Si el valor calculado de x2
es mayor o igual al de la tabla de distribución
de chi cuadrada significa que se acepta la
hipótesis de investigación (H1) por que
resultó significativa, pero si el valor calculado
de x2 es menor al de la tabla se rechaza la
hipótesis de investigación (H1)”
Distribución chi-cuadrada
9. Nivel de significancia
Probabilidad por debajo de la cuál se rechaza la
hipótesis nula. Máximo error alfa o Tipo I
considerado como aceptable, fijado
arbitrariamente suele ser 0,05 (5%) o también
0,01 (1%).
Distribución chi-cuadrada
10. Grados de libertad
Teniendo en cuenta los valores observados, los
grados de libertad se calculan de la siguiente manera:
k = (Cantidad de filas - 1)*(Cantidad de columnas - 1)
Distribución chi-cuadrada
12. .
Ejemplo
Un investigador está interesado en evaluar la asociación
entre el uso de cinturón de seguridad en vehículos
particulares y el nivel socioeconómico del conductor del
vehículo. Con este objeto se toma una muestra de
conductores a quienes se clasifica en una tabla de
asociación, encontrando los siguientes resultados:
Nivel socioeconómico
Uso cinturón
Total
Si No
Bajo 8 13 21
Medio 15 16 31
Alto 28 14 42
Total 51 43 94
13. ¿Permiten estos datos afirmar que el uso del
cinturón de seguridad depende del nivel
socioeconómico? Utilizando un nivel de significación
alfa=0,05.
Solución.
Hipótesis
H0: El uso del cinturón de seguridad es
independiente del nivel socioeconómico.
H1: El uso del cinturón de seguridad depende del
nivel socioeconómico.
Nivel
socioeconómico
Uso cinturón
Si No
Bajo 8 13
Medio 15 16
Alto 28 14
Tabla de frecuencias observadas
Ejemplo
14. Solución.
Tabla de frecuencias esperadas
A cada frecuencia observada le
corresponde una frecuencia esperada,
como se muestra a continuación:
Nivel socioeconómico
Uso cinturón
Si No
Bajo 8:(21x51/94) =11.4 13:(21x43/94)=9.6
Medio 15:(31x51/94)=16.8 16:(31x43/94)=14.2
Alto 28:(42x51/94)=22.8 14:(42x43/94)=19.2
Nivel socioeconómico
Uso cinturón
Total
Si No
Bajo 8 13 21
Medio 15 16 31
Alto 28 14 42
Total 51 43 94
Ejemplo
15. 𝑥2
𝑐𝑎𝑙𝑐 =
(8 − 11.4)2
11.4
+
(13 − 9.6)2
9.6
+
(15 − 16.8)2
16.8
+
(16 − 14.2)2
14.2
+
(28 − 22.8)2
22.8
+
(14 − 19.2)2
19.2
𝑥2
𝑐𝑎𝑙𝑐 = 1.014 + 1.204 + 0.193 + 0.228 + 1.186 + 1.408
𝑥2
𝑐𝑎𝑙𝑐 = 5.23
Grados de libertad
k = (Cantidad de filas - 1)*(Cantidad de columnas - 1)
k = (3 - 1)*(2 - 1)
k = 2
X2 crítico
El valor del X2 critico se debe buscar en la tabla de valores críticos de la distribución X2,
con 2 grados de libertad y alfa = 0.05
Para este ejemplo en particular, el valor del X2 critico es de 5.99 (ver tabla de distribución
chi cuadrado).
Solución
Distribución chi-cuadrada
16. Comparación entre el x2
calc y el x2
crit
Si el valor del X2
calc es menor o igual que el X2
crit, entonces se
acepta la hipótesis nula. En caso contrario no se acepta.
En este caso, se tiene entonces lo siguiente:
X2
calc < X2
crit
5.23 < 5.99
Conclusión: por tanto, la decisión es aceptar la hipótesis nula, H0:
El uso del cinturón de seguridad es independiente del nivel
socioeconómico.
Solución
Distribución chi-cuadrada
17. .
Ejemplo
Se desea investigar si los resultados obtenidos de unas
calificaciones de dos universidades influye con el tipo de
universidad.
Cantidad de estudiantes, según la calificación obtenida en
Estadística I de dos Universidades
Universidades Deficiente Regular Bueno Total
UGB 5 11 7 23
UNE 20 32 8 55
Total 25 43 10
18. ¿Influye el tipo de universidad en la calificación
obtenida?
Utilizando un nivel de significación alfa=0,05.
Solución.
Hipótesis
H0: No influye el tipo de universidad.
H1: Si influye el tipo de universidad.
Tabla de frecuencias observadas
Ejemplo
Universidades Deficiente Regular Bueno Total
UGB 5 11 7 23
UNE 20 32 8 55
Total 25 43 10
19. Tabla de frecuencias esperadas
Ejemplo
Universidades Deficiente Regular Bueno Total
UGB 5 11 7 23
UNE 20 32 8 55
Total 25 43 10 78
5= (25x23)/78= 7.37 20= (25x55)/78= 17.63 11= (43x23)/78= 12.64
32= (43x55)/78= 30.32 7= (10x23)/78= 2.95 8= (10x55)/78= 7.05
20. 𝑥2
𝑐𝑎𝑙𝑐
=
(5 − 7.37)2
7.37
+
(11 − 12.65)2
12.65
+
(7 − 2.95)2
2.95
+
(20 − 17.63)2
17.63
+
(32 − 30.32)2
30.32
+
(3 − 7.05)2
7.05
𝑥2
𝑐𝑎𝑙𝑐 = 0.76 + 0.22 + 5.56 + 0.32 + 0.09 + 2.26
𝑥2
𝑐𝑎𝑙𝑐 = 9.21
Grados de libertad
k = (Cantidad de filas - 1)*(Cantidad de columnas - 1)
k = (2 - 1)*(3 - 1)
k = 2
X2 crítico
El valor del X2 critico se debe buscar en la tabla de valores críticos de la distribución X2,
con 2 grados de libertad y alfa = 0.05
Para este ejemplo en particular, el valor del X2 critico es de 5.99 (ver tabla de distribución
chi cuadrado).
Solución
21. Tabla de frecuencias esperadas
Ejemplo
Universidades Deficiente Regular Bueno Total
UGB 5 11 7 23
UNE 20 32 8 55
Total 25 43 10 78
X2= sumatoria de los resultados obtenidos anteriores=
Con este resultado obtenido
22. Comparación entre el x2
calc y el x2
crit
Si el valor del X2
calc es menor o igual que el X2
crit, entonces se
acepta la hipótesis nula. Si el valor del X2
calc es mayor o igual que
el X2
crit, entonces se acepta la hipótesis que no es nula.
X2
calc mayor o igual X2
crit
9.21 mayor o igual a 5.99
Conclusión: por tanto, la decisión es aceptar la hipótesis que no
es nula, H1: Si influye el tipo de universidad.
Solución
23. .
Ejemplo
Se realizó una votación para elegir entre tres partidos
políticos y los resultados fueron los siguientes
Genero FMLN NI ARENA Total
Hombres 762 327 468 1557
Mujeres 484 239 477 1200
Total 1246 566 945
24. ¿Votan igual las mujeres que los hombres?
Utilizando un nivel de significación alfa=0,05.
Solución.
Hipótesis
H0: Las mujeres votan por los mismos partidos que los hombres.
H1: Las mujeres votan igual que los hombres.
Tabla de frecuencias observadas
Ejemplo
Genero FMLN NI ARENA Total
Hombres 762 327 468 1557
Mujeres 484 239 477 1200
Total 1246 566 945
25. Tabla de frecuencias esperadas
Ejemplo
Genero FMLN NI ARENA Total
Hombres 762 327 468 1557
Mujeres 484 239 477 1200
Total 1246 566 945 2757
762= (1246x1557)/2757= 703.67 327= (566x1557)/2757= 319.65 468= (945x1557)/2757= 533.68
484= (1246x1200)/2757= 542.33 239= (566x1200)/2757= 246.35 477= (945x1200)/2757= 411.32
26. 𝑥2
𝑐𝑎𝑙𝑐
=
(762 − 703.67)2
703.67
+
484 − 542.33)2
542.33
+
(327 − 319.65)2
319.65
+
(239 − 246.35)2
246.35
+
(468 − 533.68)2
533.68
+
(477 − 411.32)2
411.32
𝑥2
𝑐𝑎𝑙𝑐 = 4.84 + 6.27 + 0.17 + 0.22 + 8.08 + 10.48
𝑥2
𝑐𝑎𝑙𝑐 = 30.06
Grados de libertad
k = (Cantidad de filas - 1)*(Cantidad de columnas - 1)
k = (2 - 1)*(3 - 1)
k = 2
X2 crítico
El valor del X2 critico se debe buscar en la tabla de valores críticos de la distribución X2,
con 2 grados de libertad y alfa = 0.05
Para este ejemplo en particular, el valor del X2 critico es de 5.99 (ver tabla de distribución
chi cuadrado).
Solución
27. Comparación entre el x2
calc y el x2
crit
Si el valor del X2
calc es menor o igual que el X2
crit, entonces se
acepta la hipótesis nula. Si el valor del X2
calc es mayor o igual que
el X2
crit, entonces se acepta la hipótesis que no es nula.
X2
calc mayor o igual X2
crit
30.06 mayor o igual a 5.99
Conclusión: por tanto, la decisión es aceptar la hipótesis que no
es nula, H1: Las mujeres votan igual que los hombres
Solución
28. Recursos Complementarios
Recurso Título Cita Referencial
Libro Estadística II: Métodos prácticos de
inferencia estadística.
Gildaberto Bonilla
Libro Estadística para administración y
economía.
https://www.upg.mx/wp-
content/uploads/2015/10/LIBR
O-13-Estadistica-para-
administracion-y-economia.pdf
Documento Distribución chi cuadrada https://www.youtube.com/wat
ch?v=gHkMGcn2MsE