1. METODOS NO PARAMETRICOS Ji CUADRADO<br />PRUEBA DE BONDAD DE AJUSTE<br />Esta prueba es aplicable para variables aleatorias discretas o continuas<br />Sea una muestra aleatoria de tamaño n tomada de una población con una distribución especificada f0(x) que es de interés verificar.<br />Suponer que las observaciones de la muestra están agrupadas en k clases, siendo ni la cantidad de observaciones en cada clase i = 1, 2, ..., k<br />Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i.<br />Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que según el modelo especificado deberían estar incluidos en la clase i:<br />ei = pi n,i = 1, 2, ..., n<br />Tenemos entonces dos valores de frecuencia para cada clase i<br />ni:frecuencia observada (corresponde a los datos de la muestra)<br />ei:frecuencia esperada (corresponde al modelo propuesto)<br />La teoría estadística demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste:<br />Definición<br />Estadístico para la prueba de bondad de ajuste Ji-cuadrado2 = , distribución Ji-cuadrado con =k–1 grados de libertad Es una condición necesaria para aplicar esta prueba que i(ei5) Dado un nivel de significancia se define un valor crítico para el rechazo de la hipótesis propuesta Ho: f(x) = f0(x). <br />EXPLICACION <br />Supongamos que tenemos un número k de clases en las cuales se han ido registrado un total de n observaciones (n será pues el tamaño muestral). Denotaremos las frecuencias observadas en cada clase por O1, O2, ..., O k (Oi es el número de valores en la clase Ai). Se cumplirá:<br />Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas (teóricas), a las que denotaremos por E1, E2, ..., E k . Se cumplirá:<br />Se tratará ahora de decidir si las frecuencias observadas están o no en concordancia con las<br />frecuencias esperadas (es decir, si el número de resultados observados en cada clase corresponde aproximadamente al número esperado). Para comprobarlo, haremos uso de un contraste de hipótesis usando la distribución Chi-cuadrado:<br />El estadístico de contraste será: <br />Observar que este valor será la suma de k números no negativos. El numerador de cada término es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto, cuanto más cerca estén entre sí ambos valores más pequeño será el numerador, y viceversa. El denominador permite relativizar el tamaño del numerador.<br />Las ideas anteriores sugieren que, cuanto menor sean el valor del estadístico χ2∗ , más coherentes serán las observaciones obtenidas con los valores esperados. Por el contrario, valores grandes de este estadístico indicarán falta de concordancia entre las observaciones y lo esperado. En este tipo de contraste se suele rechazar la hipótesis nula (los valores observados son coherentes con los esperados) cuando el estadístico es mayor que un determinado valor crítico.<br />Notas:<br />El valor del estadístico χ2∗ se podrá aproximar por una distribución Chi-cuadrado cuando el tamaño muestral n sea grande (n > 30), y todas las frecuencias esperadas sean iguales o mayores a 5 (en ocasiones deberemos agrupar varias categorías a fin de que se cumpla este requisito).<br />Las observaciones son obtenidas mediante muestreo aleatorio a partir de una población particionada en categorías.<br />Ejemplo<br />Se ha tomado una muestra aleatoria de 40 baterías y se ha registrado su duración en años. Estos resultados se los ha agrupado en 7 clases en el siguiente cuadro.<br /> i clase (duración) frecuencia observada (ni)11.45 – 1.95221.95 – 2.45132.45 – 2.95442.95 – 3.451553.45 – 3.951063.95 – 4.45574.45 – 4.953<br />Verificar con 5% de significancia que la duración en años de las baterías producidas por este fabricante tiene duración distribuida normalmente con media 3.5 y desviación estándar 0.7<br />Solución<br />Sea X: duración en años (variable aleatoria contínua)<br />1)Ho:f(x) = N(3.5, 0.7)(distribución normal, =3.5, =0.7)<br />2)Ha: H0<br />3) = 0.05<br />Cálculo de la probabilidad correspondiente a cada intervalo<br />p1 = P(X1.95) = P(Z(1.95 – 3.5)/0.7) = 0.0136<br />p2 = P(1.95X2.45) = P((1.95 – 3.5)/0.7 Z (2.45 – 3.5)/0.7) = 0.0532<br />p3 = P(2.45X2.95) = P((2.45 – 3.5)/0.7 Z (2.95 – 3.5)/0.7) = 0.135<br />... (etc)<br />Cálculo de las frecuencias esperadas<br />e1 = p1 n = 0.0136 (40) 0.5<br />e2 = p2 n = 0.0532 (40) 2.1<br />e3 = p3 n = 0.135 (40) 5.4<br />... (etc)<br />Resumen de resultados<br />duración (años) frecuencia observada (ni) frecuencia esperada (ei)1.45 – 1.9520.51.95 – 2.4512.12.45 – 2.9545.42.95 – 3.451510.33.45 – 3.951010.73.95 – 4.45574.45 – 4.9533.5<br />Es necesario que se cumpla la condición i(ei5) por lo que se deben agrupar clases adyacentes. Como resultado se tienen cuatro clases k=4<br />Duración (años) frecuencia observada (ni) frecuencia esperada (ei)1.45 – 2.9578.52.95 – 3.451510.33.45 – 3.951010.73.95 – 4.95810.5<br />Ahora se puede definir la región de rechazo de Ho<br /> = 0.05, = k – 1 = 3, = 7.815(Tabla 2)<br />Rechazar Ho si 2 > 7.815<br />5)Cálculo del estadístico de prueba<br />2 = = = 3.05<br />6)Decisión<br />Como 3.05 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la población.<br />Tomado de: Universidad Oberta de Catalunya. Estadística: Métodos no paramétricos Ji Cuadrado[en línea], España. Disponible en: http://www.uoc.edu/in3/emath/docs/Chi_cuadrado.pdf [consulta 14-06-2011].<br />Tomado de: Universidad de Valencia. Prueba de Bondad de Ajuste: Prueba JI-Cuadrado [en línea], España. Disponible en: http://www.uv.es/ceaces/ [consulta 14-06-2011]<br />