SlideShare una empresa de Scribd logo
1 de 25
Descargar para leer sin conexión
Distribución
Chi (o Ji) cuadrada (χ2)
•   PEARSON, KARL. On the Criterion that a Given System of Deviations
    from the Probable in the Case of a Correlated System of Variables is such
    that it Can Reasonably Be Supposed to have Arisen from Random
    Sampling

•   El famoso artículo de Karl Pearson sobre la distribución Chi-cuadrada
    apareció en la primavera de 1900, lo que se puede considerar un inicio
    auspicioso a un magnífico siglo para el campo de la estadística -B. Efron,
    The Statistical Century
La distribución Chi-Cuadrada (chi squared en inglés, se pronuncia “Kay
skuerd”) es una de las distribuciones más empleadas en todos los campos. Su
uso más común es cuando se quiere probar si unas mediciones que se hayan
efectuado siguen una distribución esperada, por ejemplo la normal o cualquier
otra.


Otro de sus usos es en intervalos de confianza y pruebas de hipótesis para las
varianzas o desviaciones estándar.


Empezaremos ilustrando la definición de la distribución para proceder a
ejemplos de uso práctico.
Supongamos que se efectúa el siguiente experimento estadístico.
Seleccionamos una muestra aleatoria de tamaño n de una población con
distribución normal, con desviación estandar igual a σ. De la muestra
encontramos que la desviación estandar es igual a s. Con estos datos podemos
calcular una estadística, que llamamos Chi-Cuadrada, por medio de la
                                               Cuadrada
siguiente ecuación:
                              ( n − 1) ⋅ s
                                         2
                     χ =
                      2
                                    2
                                     σ
Si repetimos el experimento un número infinito de veces, obtendríamos una
distribución muestral para la estadística chi-cuadrada. Pero la distribución
                                              cuadrada
final que tendríamos se puede definir por la siguiente ecuación:
                                                   χ2
                                     ν         −
                  Y = Y0 ⋅ χ ( − 1)e
                                 2                 2
                              2
Donde Y0 es una constante que depende del número de grados de libertad (υ =
n – 1, n es el tamaño de la muestra), χ2 es el valor de chi-cuadrada y e es el
llamado número natural (aproximadamente 2.71828). Y0 se define de forma
que el área bajo la curva sea igual a 1.
Si graficamos curvas para diferentes valores de n, encontramos que
la forma de la distribución chi cuadrada cambia dependiendo del
número de grados de libertad.

                                        Distribution Plot
                                            Chi-Square
                                                                        df
                    0.5
                                                                        2
                                                                        4
                                                                        6
                    0.4                                                 10
                                                                        30


                    0.3
          Density




                    0.2


                    0.1


                    0.0
                          0   10   20        30          40   50   60
                                              X




  También vemos que al aumentar el número de grados de libertad,
  la curva se aproxima a la distribución normal.
La distribución chi cuadrada tiene las siguientes propiedades:
                                                  propiedades
•La media es igual al número de grados de libertad (que es igual al tamaño
de las muestras menos 1): μ = ν = n – 1
•La varianza es igual a dos veces el número de grados de libertad (por lo
tanto la desviación estándar es la raíz cuadrada de 2ν):
                          σ2 = 2 * ν
•Cuando los grados de libertad son mayores o iguales que 2, el máximo
valor de Y ocurre cuando
                          χ2=ν–2
•Conforme los grados de libertad (tamaño de la muestra) aumenta, la
distribución chi-cuadrada se aproxima a la distribución normal.
                                                        normal
Ejemplo de χ2 cuadrada para 5 muestras




                              La desviación estándar es
                              σ = σ 2 = 2 ⋅ν = ± 8




                       La media μ = ν = 4 (es igual a n-1)
El valor máximo ocurre para
χ2 = ν – 2 = 2
Probabilidad Acumulativa y la Distribución Chi-cuadrada

La distribución χ2, como otras distribuciones por ejemplo la t de student y
la z-normal estándar, se construye de forma que el área total bajo la
                  ndar
curva sea igual a 1. El área bajo la curva entre 0 y un valor particular de la
estadística chi-cuadrada es la probabilidad asociada con ese valor. Por
ejemplo, en la figura, el área sombreada representa la probabilidad
acumulada para una χ2 igual a un valor A.
Supóngase que en una determinada muestra se observan una serie de
posibles sucesos E1, E2, E3, . . . , EK, que ocurren con frecuencias o1, o2,
o3, . . ., oK, llamadas frecuencias observadas y que, según las reglas de
probabilidad, se espera que ocurran con frecuencias e1, e2, e3, . . . ,eK
llamadas frecuencias teóricas o esperadas.
A menudo se desea saber si las frecuencias observadas difieren
significativamente de las frecuencias esperadas. Para el caso en que
solamente son posibles dos sucesos E1 y E2 como, por ejemplo, caras o
cruces, defectuoso, etc., el problema queda resuelto satisfactoriamente con
los métodos de las unidades anteriores. Ahora se considera el problema
general.

Definición de χ2 para el caso de pruebas de bondad de ajuste.

Una medida de la discrepancia existente entre las frecuencias observadas y
esperadas está dada por el estadístico que sigue la distribución χ2:
donde el total de frecuencias es N




Si χ2 = 0, las frecuencias observadas y esperadas concuerdan exactamente,
mientras que si χ2 >0, no coinciden exactamente. A valores mayores de χ2,
mayores son las discrepancias entre las frecuencias observadas y esperadas.

El número de grados de libertad n está dado por:

                               n=k–1–m
en donde:

k = número de clasificaciones en el problema.
m = número de parámetros estimados a partir de los datos muestrales para
obtener los valores esperados.
En la práctica, las frecuencias esperadas se calculan como la hipótesis Ho. Si
bajo esta hipótesis el valor calculado de χ2 dado es mayor que algún valor
crítico, se deduce que las frecuencias observadas difieren significativamente
de las esperadas y se rechaza Ho al nivel de significación correspondiente. En
caso contrario, no se rechazará Ho. Este procedimiento se llama prueba de
hipótesis chi-cuadrado.

Debe advertirse que aquellas circunstancias en que χ2 esté muy próxima a
cero deben tomarse con cierto recelo, puesto que es raro que las frecuencias
observadas concuerden demasiado bien con las esperadas. Para examinar
tales situaciones, se puede determinar si el valor calculado de χ2 es menor
que las χ2 críticas (prueba de cola izquierda), en cuyos casos se decide si la
concordancia es suficientemente buena.
Ejemplos del uso de χ2 en pruebas de bondad de ajuste.

1. En los experimentos de Mendel con chícharos, observaron 315 lisos y
amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes.
De acuerdo con su teoría, estos números deberían presentarse en la
proporción 9:3:3:1. ¿Hay alguna evidencia que permita dudar de su teoría al
nivel de significación del 0.01?

Solución:

Ho; La teoría de Mendel es acertada.
H1; La teoría de Mendel no es correcta.

El número total de chícharos es 315+108+101+32=556. Puesto que los
números esperados están el la proporción 9:3:3:1 (9+3+3+1=16), se
esperaría lo siguiente:
9
        (556) = 312.75    lisos y amarillos
     16
      3                   lisos y verdes
        (556) = 104.25
     16
      3                   rugosos y amarillos
        (556) = 104.25
     16
      1
        (556) = 34.75     rugosos y verdes
     16

Grados de libertad = k-1-m = 4-1-0 = 3
No se tuvo que calcular ningún parámetro para obtener las frecuencias
esperadas.
Regla de decisión:

Si χ2 ≤ 11.3 no se rechaza Ho.
Si χ2 > 11.3 se rechaza Ho.




Justificación y decisión:
Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel
de significancia de 0.01 que la teoría de Mendel es correcta.
Pero como el valor de 0.470 está cercano a cero, se procede a hacer una
prueba unilateral izquierda:
Ho; La teoría de Mendel es acertada.
H1; La teoría de Mendel es muy acertada.




Regla de decisión:

Si χ2 ≥ 0.115 no se rechaza Ho.
Si χ2 < 0.115 se rechaza Ho.

Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento
o la teoría de Mendel es correcta.
2. Se cree que la duración del sueño profundo de las personas se puede
aproximar mediante una distribución normal con media μ = 3.5 hrs y
desviación estándar σ = 0.7 hrs. Probar la veracidad de esta idea con los
siguientes datos tomados de una muestra de pacientes. Utilizar una
significancia de 0.05.




Total de datos 40.
Primero visualizamos los datos en un histograma.
Aparentemente los datos siguen una distribución normal.
Prueba de hipótesis:


H0; Los datos provienen de una distribución normal.
H1; Los datos no provienen de una distribución normal.
En este ejemplo en particular se cuenta con la media y desviación estándar
de la población, por lo que no se tienen que estimar. En caso de que no se
tuvieran, se estimarían a partir de los datos agrupados, tomando en cuenta
que para los grados de libertad el valor de m sería 2, ya que se estimarían la
media y la desviación estándar.


Se procederá a calcular los valores de z para encontrar las probabilidades
usando los límites inferiores de los intervalos de clase:



                                 x−μ
                          z=
                                    σ
La razón por la cual se comienza con el límite de 1.95 y se termina con el
límite de 4.45, es porque la suma de todas las probabilidades debe ser 1,
bajo la curva normal.
A continuación se muestra la curva normal con sus respectivas
probabilidades, según los limites reales.
Con estas probabilidades se calcularán los valores esperados, multiplicando
cada probabilidad por 40 (el total).
Grados de libertad: k-1-m = 4-1-0 = 3




Regla de decisión:

Si χ2 ≤ 7.815 no se rechaza Ho.
Si χ2 > 7.815 se rechaza Ho.




Justificación y decisión:
Como 3.06 no es mayor de 7.815, no se rechaza H0 y se concluye con
α = 0.05 que el ajuste de los datos a una distribución normal es bueno.
Ejemplo del uso de χ2 en pruebas de desviación estándar.
La compañía de baterías Duramás ha desarrollado una nueva batería para
celulares. En promedio, la batería dura 60 minutos por carga. La desviación
estándar es de 4 minutos.
Supongamos que el departamento de manufactura corre una prueba de
control de calidad. Ellos seleccionan 7 baterías al azar. La desviación
estándar de las baterías seleccionadas es de 6 minutos. ¿Qué valor de la
estadística chi-cuadrada tenemos para esta prueba?




Solución
Bueno, empezamos con lo que sabemos:
•La desviación estandar de la población es de 4 minutos.
•La desviación estandar de la muestra es de 6 minutos.
•El número de observaciones muestreadas es 7.
Para calcular la estadística chi-cuadrada, usamos los valores en la ecuación para
χ 2.
                    ( n − 1) ⋅ s 2     (7 − 1)62
             χ2 =                    =           = 13.5
                        σ2                4 2



donde χ2 es la estadística chi-cuadrada, n el tamaño de la muestra, s la
desviación estándar de la muestra, y σ la desviación estándar de la población.

Ahora vamos a ver cómo usar este resultado.

Problema 1

Vamos a expresar el mismo ejemplo de otra manera.
El departmento de manufactura corrió una prueba de control de calidad usando 7
baterías seleccionadas al azar. En su prueba, la desviación estándar fue de 6
minutos, lo que equivale a un valor de chi-cuadrada de 13.5.
Supongamos que repiten la prueba con otras 7 baterías.

¿Cuál es la probabilidad de que la desviación estándar de la nueva prueba sea
mayor a 6 minutos?
Solución

Sabemos lo siguiente:
Tamaño de la muestra es n = 7 .
Los grados de libertad son n - 1 = 7 - 1 = 6.
El valor χ2 para la prueba es 13.5 (del Ejemplo 1).
Dados estos valores, podemos determinar la probabilidad acumulada de chi-
cuadrada. Para ello, usamos una tabla de la estadística χ2 con los valores de
grados de libertad (6) y de chi-cuadrada (13.5) o empleamos alguna
herramienta como la calculadora Chi-Square Distribution Calculator. De
cualquiera de los dos obtenemos el valor de: 0.96.

Esto implica que la probabilidad de que la desviación estándar de la muestra
fuera menor o igual a 6 minutos es 0.96. Lo anterior significa que la
probabilidad de que la desviación estándar sea mayor a 6 minutos es de

                      1 - 0.96 o sea .04 (muy pequeña).
Area bajo la curva
                          hasta el valor de
                         χ2 =13.5 es 0.96


probabilidad de que
    la desviación
       desviació
   estándar de la
   está
muestra sea MENOR
O IGUAL a 6 minutos
       es 0.96
                                 probabilidad de que
                                    la desviación
                                       desviació
                                    estándar de la
                                    está
                                 muestra sea MAYOR
                                 a 6 minutos es 0.04




                      χ2 =13.5

Más contenido relacionado

La actualidad más candente

Estadistica ii correlacion y regresion
Estadistica ii    correlacion y regresionEstadistica ii    correlacion y regresion
Estadistica ii correlacion y regresion
Edgar Sanchez
 
Distribución f de fisher snedecor
Distribución f de fisher snedecorDistribución f de fisher snedecor
Distribución f de fisher snedecor
pilosofando
 
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleSolucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Miguel Leonardo Sánchez Fajardo
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
varo99
 
Ejemplos de ejercicios bernoulli
Ejemplos de ejercicios bernoulliEjemplos de ejercicios bernoulli
Ejemplos de ejercicios bernoulli
Carol Ramos
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
eraperez
 
Distribucion de Chi Cuadrado
Distribucion de Chi CuadradoDistribucion de Chi Cuadrado
Distribucion de Chi Cuadrado
Carlos Sevilla
 
DISTRIBUCION T DE STUDENT
DISTRIBUCION T DE STUDENTDISTRIBUCION T DE STUDENT
DISTRIBUCION T DE STUDENT
Torimat Cordova
 
Ejemplos distribución poisson
Ejemplos distribución poissonEjemplos distribución poisson
Ejemplos distribución poisson
FeLipe PueNntes
 
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasEjercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
Javiera Huera (Temuco)
 

La actualidad más candente (20)

Preguntas de Regresion Lineal
Preguntas de Regresion LinealPreguntas de Regresion Lineal
Preguntas de Regresion Lineal
 
Estadistica ii correlacion y regresion
Estadistica ii    correlacion y regresionEstadistica ii    correlacion y regresion
Estadistica ii correlacion y regresion
 
Distribución f de fisher snedecor
Distribución f de fisher snedecorDistribución f de fisher snedecor
Distribución f de fisher snedecor
 
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleSolucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
 
Distribucion uniforme continua
Distribucion uniforme continuaDistribucion uniforme continua
Distribucion uniforme continua
 
2. ejercicios de prueba de hipótesis
2. ejercicios de prueba de hipótesis2. ejercicios de prueba de hipótesis
2. ejercicios de prueba de hipótesis
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Ejemplos de ejercicios bernoulli
Ejemplos de ejercicios bernoulliEjemplos de ejercicios bernoulli
Ejemplos de ejercicios bernoulli
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
 
Problemas resueltos de distribución muestral
Problemas resueltos de distribución muestralProblemas resueltos de distribución muestral
Problemas resueltos de distribución muestral
 
Tarea 8 de probabilidad y estadística con respuestas
Tarea 8 de probabilidad y estadística  con respuestasTarea 8 de probabilidad y estadística  con respuestas
Tarea 8 de probabilidad y estadística con respuestas
 
Distribucion de Chi Cuadrado
Distribucion de Chi CuadradoDistribucion de Chi Cuadrado
Distribucion de Chi Cuadrado
 
Ejercicios parte i
Ejercicios parte iEjercicios parte i
Ejercicios parte i
 
DISTRIBUCION T DE STUDENT
DISTRIBUCION T DE STUDENTDISTRIBUCION T DE STUDENT
DISTRIBUCION T DE STUDENT
 
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTASTarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
 
Ejemplos distribución poisson
Ejemplos distribución poissonEjemplos distribución poisson
Ejemplos distribución poisson
 
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasEjercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
 
Normal
NormalNormal
Normal
 

Similar a X cuadrada

Distribucion chi
Distribucion chiDistribucion chi
Distribucion chi
zhurii
 
Distribucion chi
Distribucion chiDistribucion chi
Distribucion chi
zhurii
 
RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2
FELIX Castro Garcia
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
Moonsee P'c
 

Similar a X cuadrada (20)

Chi cuadrado propiedades
Chi cuadrado propiedadesChi cuadrado propiedades
Chi cuadrado propiedades
 
Clase9
Clase9Clase9
Clase9
 
Ji cuadrada1
Ji cuadrada1Ji cuadrada1
Ji cuadrada1
 
U0304
U0304U0304
U0304
 
U0304
U0304U0304
U0304
 
Folleto de estadística (1)
Folleto de estadística (1)Folleto de estadística (1)
Folleto de estadística (1)
 
[Exposicion] modelos probabilísticos aplicados
[Exposicion]   modelos probabilísticos aplicados[Exposicion]   modelos probabilísticos aplicados
[Exposicion] modelos probabilísticos aplicados
 
diapositiva estadistica neymar
diapositiva estadistica neymardiapositiva estadistica neymar
diapositiva estadistica neymar
 
rhjhjkhjkgjkhjkhjkgjkgDistribucion de t student
rhjhjkhjkgjkhjkhjkgjkgDistribucion de t studentrhjhjkhjkgjkhjkhjkgjkgDistribucion de t student
rhjhjkhjkgjkhjkhjkgjkgDistribucion de t student
 
Distribucion chi
Distribucion chiDistribucion chi
Distribucion chi
 
Distribucion chi
Distribucion chiDistribucion chi
Distribucion chi
 
Distribuciones de probabilidad continua
Distribuciones de probabilidad continuaDistribuciones de probabilidad continua
Distribuciones de probabilidad continua
 
RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2
 
Jose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de probJose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de prob
 
Unidad 2
Unidad 2Unidad 2
Unidad 2
 
7 prueba de hipotesis
7 prueba de hipotesis7 prueba de hipotesis
7 prueba de hipotesis
 
Normal Dos Métodos
Normal Dos MétodosNormal Dos Métodos
Normal Dos Métodos
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Distribucion Binomial
Distribucion BinomialDistribucion Binomial
Distribucion Binomial
 
Distribuciones de probabilidad_1
Distribuciones de probabilidad_1Distribuciones de probabilidad_1
Distribuciones de probabilidad_1
 

X cuadrada

  • 1. Distribución Chi (o Ji) cuadrada (χ2)
  • 2. PEARSON, KARL. On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling • El famoso artículo de Karl Pearson sobre la distribución Chi-cuadrada apareció en la primavera de 1900, lo que se puede considerar un inicio auspicioso a un magnífico siglo para el campo de la estadística -B. Efron, The Statistical Century
  • 3. La distribución Chi-Cuadrada (chi squared en inglés, se pronuncia “Kay skuerd”) es una de las distribuciones más empleadas en todos los campos. Su uso más común es cuando se quiere probar si unas mediciones que se hayan efectuado siguen una distribución esperada, por ejemplo la normal o cualquier otra. Otro de sus usos es en intervalos de confianza y pruebas de hipótesis para las varianzas o desviaciones estándar. Empezaremos ilustrando la definición de la distribución para proceder a ejemplos de uso práctico.
  • 4. Supongamos que se efectúa el siguiente experimento estadístico. Seleccionamos una muestra aleatoria de tamaño n de una población con distribución normal, con desviación estandar igual a σ. De la muestra encontramos que la desviación estandar es igual a s. Con estos datos podemos calcular una estadística, que llamamos Chi-Cuadrada, por medio de la Cuadrada siguiente ecuación: ( n − 1) ⋅ s 2 χ = 2 2 σ Si repetimos el experimento un número infinito de veces, obtendríamos una distribución muestral para la estadística chi-cuadrada. Pero la distribución cuadrada final que tendríamos se puede definir por la siguiente ecuación: χ2 ν − Y = Y0 ⋅ χ ( − 1)e 2 2 2 Donde Y0 es una constante que depende del número de grados de libertad (υ = n – 1, n es el tamaño de la muestra), χ2 es el valor de chi-cuadrada y e es el llamado número natural (aproximadamente 2.71828). Y0 se define de forma que el área bajo la curva sea igual a 1.
  • 5. Si graficamos curvas para diferentes valores de n, encontramos que la forma de la distribución chi cuadrada cambia dependiendo del número de grados de libertad. Distribution Plot Chi-Square df 0.5 2 4 6 0.4 10 30 0.3 Density 0.2 0.1 0.0 0 10 20 30 40 50 60 X También vemos que al aumentar el número de grados de libertad, la curva se aproxima a la distribución normal.
  • 6. La distribución chi cuadrada tiene las siguientes propiedades: propiedades •La media es igual al número de grados de libertad (que es igual al tamaño de las muestras menos 1): μ = ν = n – 1 •La varianza es igual a dos veces el número de grados de libertad (por lo tanto la desviación estándar es la raíz cuadrada de 2ν): σ2 = 2 * ν •Cuando los grados de libertad son mayores o iguales que 2, el máximo valor de Y ocurre cuando χ2=ν–2 •Conforme los grados de libertad (tamaño de la muestra) aumenta, la distribución chi-cuadrada se aproxima a la distribución normal. normal
  • 7. Ejemplo de χ2 cuadrada para 5 muestras La desviación estándar es σ = σ 2 = 2 ⋅ν = ± 8 La media μ = ν = 4 (es igual a n-1) El valor máximo ocurre para χ2 = ν – 2 = 2
  • 8. Probabilidad Acumulativa y la Distribución Chi-cuadrada La distribución χ2, como otras distribuciones por ejemplo la t de student y la z-normal estándar, se construye de forma que el área total bajo la ndar curva sea igual a 1. El área bajo la curva entre 0 y un valor particular de la estadística chi-cuadrada es la probabilidad asociada con ese valor. Por ejemplo, en la figura, el área sombreada representa la probabilidad acumulada para una χ2 igual a un valor A.
  • 9. Supóngase que en una determinada muestra se observan una serie de posibles sucesos E1, E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK, llamadas frecuencias observadas y que, según las reglas de probabilidad, se espera que ocurran con frecuencias e1, e2, e3, . . . ,eK llamadas frecuencias teóricas o esperadas. A menudo se desea saber si las frecuencias observadas difieren significativamente de las frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E1 y E2 como, por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto satisfactoriamente con los métodos de las unidades anteriores. Ahora se considera el problema general. Definición de χ2 para el caso de pruebas de bondad de ajuste. Una medida de la discrepancia existente entre las frecuencias observadas y esperadas está dada por el estadístico que sigue la distribución χ2:
  • 10. donde el total de frecuencias es N Si χ2 = 0, las frecuencias observadas y esperadas concuerdan exactamente, mientras que si χ2 >0, no coinciden exactamente. A valores mayores de χ2, mayores son las discrepancias entre las frecuencias observadas y esperadas. El número de grados de libertad n está dado por: n=k–1–m en donde: k = número de clasificaciones en el problema. m = número de parámetros estimados a partir de los datos muestrales para obtener los valores esperados.
  • 11. En la práctica, las frecuencias esperadas se calculan como la hipótesis Ho. Si bajo esta hipótesis el valor calculado de χ2 dado es mayor que algún valor crítico, se deduce que las frecuencias observadas difieren significativamente de las esperadas y se rechaza Ho al nivel de significación correspondiente. En caso contrario, no se rechazará Ho. Este procedimiento se llama prueba de hipótesis chi-cuadrado. Debe advertirse que aquellas circunstancias en que χ2 esté muy próxima a cero deben tomarse con cierto recelo, puesto que es raro que las frecuencias observadas concuerden demasiado bien con las esperadas. Para examinar tales situaciones, se puede determinar si el valor calculado de χ2 es menor que las χ2 críticas (prueba de cola izquierda), en cuyos casos se decide si la concordancia es suficientemente buena.
  • 12. Ejemplos del uso de χ2 en pruebas de bondad de ajuste. 1. En los experimentos de Mendel con chícharos, observaron 315 lisos y amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su teoría, estos números deberían presentarse en la proporción 9:3:3:1. ¿Hay alguna evidencia que permita dudar de su teoría al nivel de significación del 0.01? Solución: Ho; La teoría de Mendel es acertada. H1; La teoría de Mendel no es correcta. El número total de chícharos es 315+108+101+32=556. Puesto que los números esperados están el la proporción 9:3:3:1 (9+3+3+1=16), se esperaría lo siguiente:
  • 13. 9 (556) = 312.75 lisos y amarillos 16 3 lisos y verdes (556) = 104.25 16 3 rugosos y amarillos (556) = 104.25 16 1 (556) = 34.75 rugosos y verdes 16 Grados de libertad = k-1-m = 4-1-0 = 3 No se tuvo que calcular ningún parámetro para obtener las frecuencias esperadas.
  • 14. Regla de decisión: Si χ2 ≤ 11.3 no se rechaza Ho. Si χ2 > 11.3 se rechaza Ho. Justificación y decisión: Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel de significancia de 0.01 que la teoría de Mendel es correcta. Pero como el valor de 0.470 está cercano a cero, se procede a hacer una prueba unilateral izquierda:
  • 15. Ho; La teoría de Mendel es acertada. H1; La teoría de Mendel es muy acertada. Regla de decisión: Si χ2 ≥ 0.115 no se rechaza Ho. Si χ2 < 0.115 se rechaza Ho. Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o la teoría de Mendel es correcta.
  • 16. 2. Se cree que la duración del sueño profundo de las personas se puede aproximar mediante una distribución normal con media μ = 3.5 hrs y desviación estándar σ = 0.7 hrs. Probar la veracidad de esta idea con los siguientes datos tomados de una muestra de pacientes. Utilizar una significancia de 0.05. Total de datos 40. Primero visualizamos los datos en un histograma.
  • 17. Aparentemente los datos siguen una distribución normal. Prueba de hipótesis: H0; Los datos provienen de una distribución normal. H1; Los datos no provienen de una distribución normal.
  • 18. En este ejemplo en particular se cuenta con la media y desviación estándar de la población, por lo que no se tienen que estimar. En caso de que no se tuvieran, se estimarían a partir de los datos agrupados, tomando en cuenta que para los grados de libertad el valor de m sería 2, ya que se estimarían la media y la desviación estándar. Se procederá a calcular los valores de z para encontrar las probabilidades usando los límites inferiores de los intervalos de clase: x−μ z= σ
  • 19. La razón por la cual se comienza con el límite de 1.95 y se termina con el límite de 4.45, es porque la suma de todas las probabilidades debe ser 1, bajo la curva normal. A continuación se muestra la curva normal con sus respectivas probabilidades, según los limites reales.
  • 20. Con estas probabilidades se calcularán los valores esperados, multiplicando cada probabilidad por 40 (el total).
  • 21. Grados de libertad: k-1-m = 4-1-0 = 3 Regla de decisión: Si χ2 ≤ 7.815 no se rechaza Ho. Si χ2 > 7.815 se rechaza Ho. Justificación y decisión: Como 3.06 no es mayor de 7.815, no se rechaza H0 y se concluye con α = 0.05 que el ajuste de los datos a una distribución normal es bueno.
  • 22. Ejemplo del uso de χ2 en pruebas de desviación estándar. La compañía de baterías Duramás ha desarrollado una nueva batería para celulares. En promedio, la batería dura 60 minutos por carga. La desviación estándar es de 4 minutos. Supongamos que el departamento de manufactura corre una prueba de control de calidad. Ellos seleccionan 7 baterías al azar. La desviación estándar de las baterías seleccionadas es de 6 minutos. ¿Qué valor de la estadística chi-cuadrada tenemos para esta prueba? Solución Bueno, empezamos con lo que sabemos: •La desviación estandar de la población es de 4 minutos. •La desviación estandar de la muestra es de 6 minutos. •El número de observaciones muestreadas es 7.
  • 23. Para calcular la estadística chi-cuadrada, usamos los valores en la ecuación para χ 2. ( n − 1) ⋅ s 2 (7 − 1)62 χ2 = = = 13.5 σ2 4 2 donde χ2 es la estadística chi-cuadrada, n el tamaño de la muestra, s la desviación estándar de la muestra, y σ la desviación estándar de la población. Ahora vamos a ver cómo usar este resultado. Problema 1 Vamos a expresar el mismo ejemplo de otra manera. El departmento de manufactura corrió una prueba de control de calidad usando 7 baterías seleccionadas al azar. En su prueba, la desviación estándar fue de 6 minutos, lo que equivale a un valor de chi-cuadrada de 13.5. Supongamos que repiten la prueba con otras 7 baterías. ¿Cuál es la probabilidad de que la desviación estándar de la nueva prueba sea mayor a 6 minutos?
  • 24. Solución Sabemos lo siguiente: Tamaño de la muestra es n = 7 . Los grados de libertad son n - 1 = 7 - 1 = 6. El valor χ2 para la prueba es 13.5 (del Ejemplo 1). Dados estos valores, podemos determinar la probabilidad acumulada de chi- cuadrada. Para ello, usamos una tabla de la estadística χ2 con los valores de grados de libertad (6) y de chi-cuadrada (13.5) o empleamos alguna herramienta como la calculadora Chi-Square Distribution Calculator. De cualquiera de los dos obtenemos el valor de: 0.96. Esto implica que la probabilidad de que la desviación estándar de la muestra fuera menor o igual a 6 minutos es 0.96. Lo anterior significa que la probabilidad de que la desviación estándar sea mayor a 6 minutos es de 1 - 0.96 o sea .04 (muy pequeña).
  • 25. Area bajo la curva hasta el valor de χ2 =13.5 es 0.96 probabilidad de que la desviación desviació estándar de la está muestra sea MENOR O IGUAL a 6 minutos es 0.96 probabilidad de que la desviación desviació estándar de la está muestra sea MAYOR a 6 minutos es 0.04 χ2 =13.5