SlideShare una empresa de Scribd logo
1 de 2
EL TEST CHI-CUADRADO



        El test Chi-cuadrado es un ejemplo de los denominados test de ajuste estadístico,
cuyo objetivo es evaluar la bondad del ajuste de un conjunto de datos a una determinada
distribución candidata. Su objetivo es aceptar o rechazar la siguiente hipótesis:

        “Los datos de que se dispone son una muestra aleatoria de una distribución
FX ( x ) ”.

       El procedimiento de realización del test Chi-cuadrado es el siguiente:

1)     Se divide el rango de valores que puede tomar la variable aleatoria de la
       distribución en K intervalos adyacentes:

                            [a0 , a1 ), [a1 , a2 ),, [aK −1 , aK )

       Pueden ser a0 = −∞ y aK = ∞ .
2)     Sea N j el número de valores de los datos que tenemos que pertenecen al
       intervalo [a j − , a j ) .
                       1

3)     Se calcula la probabilidad de que la variable aleatoria de la distribución
       candidata FX ( x ) esté en el intervalo [a j − , a j ) . Por ejemplo, si se trata de una
                                                     1

       distribución continua, esa probabilidad sería:

                                                             f X ( x )dx
                                                 aj
                                     p j =∫
                                                 a j−1




       siendo f X ( x ) la función densidad de probabilidad de la distribución candidata.
       También se puede hacer:

                                  p j = FX ( a j ) − FX ( a j −1 )

       Nótese que este es un valor teórico, que se calcula de acuerdo a la distribución
       candidata y a los intervalos fijados.

4)     Se forma el siguiente estadístico de prueba:


                                    ∆=∑
                                           K     (N      j   − Np j )
                                                                        2


                                          j =1               Np j

       Si el ajuste es bueno, ∆ tenderá a tomar valores pequeños (¿por qué?).

      Rechazaremos la hipótesis de la distribución candidata si ∆ toma valores
“demasiado grandes”.
Nótese que para decidir si los valores son “demasiado grandes”, necesitamos
fijar un umbral. Para ello se hace uso de la siguiente propiedad, que no demostraremos.
Nótese que ∆ es a su vez una variable aleatoria (¿por qué?).

        “Si el número de muestras es suficientemente grande, y la distribución candidata
es la adecuada ∆ tiende a tener a una distribución Chi-cuadrado de (K – 1) grados de
libertad”

       En realidad, la afirmación anterior sólo es estrictamente cierta si no hay que
estimar ningún parámetro en la distribución candidata. Si para definir la distribución
candidata hay que estimar algún parámetro (su media, su varianza,…) el número de
grados de libertad de la distribución Chi-cuadrado es

       (K – 1 – número de parámetros que hay que estimar a partir de los datos)

        Tenemos por tanto, que si la distribución candidata es la adecuada, conocemos la
distribución del parámetro (está tabulada y se proporciona la tabla en el Apéndice 1 de
la práctica). Además, si la distribución candidata es la adecuada, el valor del parámetro
 ∆ tenderá a ser pequeño, y si no es adecuada, tenderá a ser grande.

       Una forma razonable de fijar un umbral de decisión sería:

       “Rechazar la distribución candidata si

                                       ∆ > χgdl ,α
                                            2




siendo χgdl ,α el valor que en la distribución Chi-cuadrado de gdl grados de libertad
          2


deja por encima una masa de probabilidad de α ”.

         Nótese que α (que se denomina nivel de significación) representa la
probabilidad de equivocarse si la distribución candidata es la adecuada (¿por qué?), y se
fijará a un valor pequeño (típicamente, 0.1, 0.05 ó 0.01).

         Es muy importante tener en cuenta que el test está sujeto a error. Acabamos de
ver que es posible equivocarse aunque la hipótesis sobre la distribución candidata sea
cierta, porque podemos tener la mala suerte de que los valores de ∆ salgan grandes.
Eso en todo caso sucederá con probabilidad baja (0.1, 0.05 ó 0.01, según acabamos de
ver). Asimismo, podríamos equivocarnos también decidiendo que la distribución
candidata es la adecuada aunque no sea cierto, debido a que los valores de ∆ podrían
salir pequeños. El test se basa en la suposición razonable de que si la distribución
candidata no es la adecuada, los valores de ∆ tenderán a salir por encima del umbral
 χgdl ,α .
   2

Más contenido relacionado

La actualidad más candente (16)

Pruebas de bondad de ajuste vfinal
Pruebas de bondad de ajuste vfinalPruebas de bondad de ajuste vfinal
Pruebas de bondad de ajuste vfinal
 
Chi cuadrado
Chi cuadradoChi cuadrado
Chi cuadrado
 
notas19deagosto
notas19deagostonotas19deagosto
notas19deagosto
 
Tutorial eviews (normalidad)
Tutorial eviews (normalidad)Tutorial eviews (normalidad)
Tutorial eviews (normalidad)
 
Tr bases 3
Tr bases 3Tr bases 3
Tr bases 3
 
Chi cuadrado
Chi  cuadradoChi  cuadrado
Chi cuadrado
 
Variables Aleatorias y Distribuciones de Probabilidad
Variables Aleatorias y Distribuciones de ProbabilidadVariables Aleatorias y Distribuciones de Probabilidad
Variables Aleatorias y Distribuciones de Probabilidad
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Aplicacion del tema de limites a la contabilidad
Aplicacion del tema de limites a la contabilidadAplicacion del tema de limites a la contabilidad
Aplicacion del tema de limites a la contabilidad
 
Demostraciones probabilidad
Demostraciones probabilidadDemostraciones probabilidad
Demostraciones probabilidad
 
UNIDAD II
UNIDAD IIUNIDAD II
UNIDAD II
 
Manual de uso de eviews vf
Manual de uso de eviews vfManual de uso de eviews vf
Manual de uso de eviews vf
 
03 Variable Aleatoria
03   Variable Aleatoria03   Variable Aleatoria
03 Variable Aleatoria
 
Distribuciones
DistribucionesDistribuciones
Distribuciones
 
Tarea chi cuadrado
Tarea chi cuadradoTarea chi cuadrado
Tarea chi cuadrado
 
Calculo diferencial
Calculo diferencialCalculo diferencial
Calculo diferencial
 

Similar a Práctica 3 test chi cuadrado

Estadistica chi cuadrado
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadradoPABLITO Pablo
 
Distribuciones de probabilidad continua
Distribuciones de probabilidad continuaDistribuciones de probabilidad continua
Distribuciones de probabilidad continuaLIZBETH IZA
 
Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1guest0e7a0f7
 
Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1guest0e7a0f7
 
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirreTarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirreONG Institute
 
Chi cuadrado propiedades
Chi cuadrado propiedadesChi cuadrado propiedades
Chi cuadrado propiedadesPABLITO Pablo
 
Clase9
Clase9Clase9
Clase9mayejh
 
VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.ppt
VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.pptVARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.ppt
VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.pptJuanJosGarcaAlvarado2
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesisMoonsee P'c
 
Presentación Distribución de Probabilidad
Presentación Distribución de ProbabilidadPresentación Distribución de Probabilidad
Presentación Distribución de ProbabilidadCarlosdbarradasm
 
Jose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de probJose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de probJose Ramon Borges Yepez
 
Distribucion normal, binomial y poisson
Distribucion normal, binomial y poisson Distribucion normal, binomial y poisson
Distribucion normal, binomial y poisson Jessenia Alacayo
 

Similar a Práctica 3 test chi cuadrado (20)

Investigacion unidadii
Investigacion unidadiiInvestigacion unidadii
Investigacion unidadii
 
Investigacion unidad II
Investigacion unidad IIInvestigacion unidad II
Investigacion unidad II
 
Investigacion unidad II
Investigacion unidad IIInvestigacion unidad II
Investigacion unidad II
 
Investigacion unidadii
Investigacion unidadiiInvestigacion unidadii
Investigacion unidadii
 
ESTADISTICA UNIDAD II
ESTADISTICA UNIDAD IIESTADISTICA UNIDAD II
ESTADISTICA UNIDAD II
 
Investigacion unidad II
Investigacion unidad IIInvestigacion unidad II
Investigacion unidad II
 
Estadistica chi cuadrado
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadrado
 
Distribuciones de probabilidad continua
Distribuciones de probabilidad continuaDistribuciones de probabilidad continua
Distribuciones de probabilidad continua
 
Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1
 
Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1
 
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirreTarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
 
Chi cuadrado propiedades
Chi cuadrado propiedadesChi cuadrado propiedades
Chi cuadrado propiedades
 
Clase9
Clase9Clase9
Clase9
 
VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.ppt
VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.pptVARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.ppt
VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES.ppt
 
Ji cuadrada1
Ji cuadrada1Ji cuadrada1
Ji cuadrada1
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Presentación Distribución de Probabilidad
Presentación Distribución de ProbabilidadPresentación Distribución de Probabilidad
Presentación Distribución de Probabilidad
 
Clase 1 distribuciones
Clase 1 distribucionesClase 1 distribuciones
Clase 1 distribuciones
 
Jose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de probJose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de prob
 
Distribucion normal, binomial y poisson
Distribucion normal, binomial y poisson Distribucion normal, binomial y poisson
Distribucion normal, binomial y poisson
 

Práctica 3 test chi cuadrado

  • 1. EL TEST CHI-CUADRADO El test Chi-cuadrado es un ejemplo de los denominados test de ajuste estadístico, cuyo objetivo es evaluar la bondad del ajuste de un conjunto de datos a una determinada distribución candidata. Su objetivo es aceptar o rechazar la siguiente hipótesis: “Los datos de que se dispone son una muestra aleatoria de una distribución FX ( x ) ”. El procedimiento de realización del test Chi-cuadrado es el siguiente: 1) Se divide el rango de valores que puede tomar la variable aleatoria de la distribución en K intervalos adyacentes: [a0 , a1 ), [a1 , a2 ),, [aK −1 , aK ) Pueden ser a0 = −∞ y aK = ∞ . 2) Sea N j el número de valores de los datos que tenemos que pertenecen al intervalo [a j − , a j ) . 1 3) Se calcula la probabilidad de que la variable aleatoria de la distribución candidata FX ( x ) esté en el intervalo [a j − , a j ) . Por ejemplo, si se trata de una 1 distribución continua, esa probabilidad sería: f X ( x )dx aj p j =∫ a j−1 siendo f X ( x ) la función densidad de probabilidad de la distribución candidata. También se puede hacer: p j = FX ( a j ) − FX ( a j −1 ) Nótese que este es un valor teórico, que se calcula de acuerdo a la distribución candidata y a los intervalos fijados. 4) Se forma el siguiente estadístico de prueba: ∆=∑ K (N j − Np j ) 2 j =1 Np j Si el ajuste es bueno, ∆ tenderá a tomar valores pequeños (¿por qué?). Rechazaremos la hipótesis de la distribución candidata si ∆ toma valores “demasiado grandes”.
  • 2. Nótese que para decidir si los valores son “demasiado grandes”, necesitamos fijar un umbral. Para ello se hace uso de la siguiente propiedad, que no demostraremos. Nótese que ∆ es a su vez una variable aleatoria (¿por qué?). “Si el número de muestras es suficientemente grande, y la distribución candidata es la adecuada ∆ tiende a tener a una distribución Chi-cuadrado de (K – 1) grados de libertad” En realidad, la afirmación anterior sólo es estrictamente cierta si no hay que estimar ningún parámetro en la distribución candidata. Si para definir la distribución candidata hay que estimar algún parámetro (su media, su varianza,…) el número de grados de libertad de la distribución Chi-cuadrado es (K – 1 – número de parámetros que hay que estimar a partir de los datos) Tenemos por tanto, que si la distribución candidata es la adecuada, conocemos la distribución del parámetro (está tabulada y se proporciona la tabla en el Apéndice 1 de la práctica). Además, si la distribución candidata es la adecuada, el valor del parámetro ∆ tenderá a ser pequeño, y si no es adecuada, tenderá a ser grande. Una forma razonable de fijar un umbral de decisión sería: “Rechazar la distribución candidata si ∆ > χgdl ,α 2 siendo χgdl ,α el valor que en la distribución Chi-cuadrado de gdl grados de libertad 2 deja por encima una masa de probabilidad de α ”. Nótese que α (que se denomina nivel de significación) representa la probabilidad de equivocarse si la distribución candidata es la adecuada (¿por qué?), y se fijará a un valor pequeño (típicamente, 0.1, 0.05 ó 0.01). Es muy importante tener en cuenta que el test está sujeto a error. Acabamos de ver que es posible equivocarse aunque la hipótesis sobre la distribución candidata sea cierta, porque podemos tener la mala suerte de que los valores de ∆ salgan grandes. Eso en todo caso sucederá con probabilidad baja (0.1, 0.05 ó 0.01, según acabamos de ver). Asimismo, podríamos equivocarnos también decidiendo que la distribución candidata es la adecuada aunque no sea cierto, debido a que los valores de ∆ podrían salir pequeños. El test se basa en la suposición razonable de que si la distribución candidata no es la adecuada, los valores de ∆ tenderán a salir por encima del umbral χgdl ,α . 2