ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
Tarea 2 bondad ajuste
1. PRUEBAS DE BONDAD DE AJUSTE
Prof. Fernando Carrasco
Cap. 1: Pruebas de bondad de ajuste
1.1 Introducción
Recordemos la definición de probabilidad que se vio en la sesión 2 de este
curso, donde se definió la probabilidad del evento A como:
erimentodelresultadosposiblesde
Aeventodelcondiciónlacumplenqueresultadosde
AP
exp#
#
)(
Donde, A es un evento (subconjunto del espacio muestral), y el espacio muestral es el conjunto de todos
los posibles resultados de un experimento.
Algo que es importante resaltar en torno a esta definición, es si ¿la probabilidad se cumple o no en la
vida real?. Y la respuesta es que la probabilidad si se cumple en la vida real, pero al repetir el
experimento un cierto número de veces.
Por ejemplo, supongamos que lanzamos una moneda. Sabemos por la definición dada, que la probabilidad
que salga cara es 0,5 (o 50%) y la probabilidad que salga sello es 0,5 (o 50%).
2. Esto implica que si nosotros lanzamos la moneda, por ejemplo 2 veces, desde el punto de vista teórico o
ideal, la moneda debería dar como resultados una cara y un sello, de donde tomando la frecuencia
relativa de estos resultados se tendría las probabilidades mencionadas.
Sin embargo, puede ocurrir esto?. Pues la respuesta es, no necesariamente. Supongamos que en los dos
lanzamientos, ocurrieron 2 caras y 0 sellos. Tomando la frecuencia relativa se tiene 100% para la
ocurrencia de cara, y 0% para la ocurrencia de sello, valores que están lejos de los valores reales o
verdaderos que son 50% para cara y 50% para sello.
Pero que tal si lanzamos ahora 10 veces la moneda y registramos las veces que salen la cara y el sello.
Desde el punto de vista teórico o ideal, deberían haber salido 5 caras (50%) y 5 sellos (50%), sin
embargo, ocurre esto?, pues nuevamente la respuesta es, no necesariamente. Supongamos que salieron
7 (70%) caras y 3 sellos (30%). Estamos un poco más cerca de los valores reales.
Ahora registremos 100 lanzamientos de la moneda, y supongamos que se obtuvo 55 caras (55%) y 45
sellos (45%). Podemos apreciar ahora que estamos cada vez más cerca de las probabilidades
verdaderas: cara (50%) y sello (50%).
Y lo que ocurre es que mientras más veces repitamos el experimento, la frecuencia relativa se va
aproximando a las probabilidades reales o verdaderas
Pues precisamente las pruebas de bondad de ajuste se
basan en esta característica de la probabilidad.
3. Frecuencia observada
Cara 98
Sello 2
Total 100
Supongamos que hemos registrado las veces que salió cada uno de los resultados de una moneda en 100
lanzamientos, teniendo lo siguiente:
Con estos resultados, de manera intuitiva, podemos
asegurar que la moneda es una moneda de truco,
o que esta alterada, puesto que una moneda
normal, en 100 lanzamientos, debería tener
frecuencias cercanas a 50 (por la definición de
probabilidad).
Frecuencia observada
Cara 57
Sello 43
Total 100
Veamos otra moneda donde se registró
igualmente los resultados de 100
lanzamientos:
Observando estos resultados y, de acuerdo al concepto de probabilidad que en 100
lanzamientos de una moneda, deberían darse 50 caras y 50 sellos (idealmente), no se tiene
porqué sospechar de esta moneda y con mucha confianza podríamos decir que la moneda
no está alterada o que está en buen estado o es una moneda normal.
4. Así, las pruebas de bondad de ajuste, se basan en comparar estas
frecuencias observadas con las frecuencias ideales o teóricas que se
obtienen con la probabilidad de ocurrencia. De esta manera, este modelo
de bondad de ajuste nos permite decidir si el evento que estamos
analizando tiene o no el comportamiento esperado de un evento
normal.
Para el caso de la primera moneda la comparación sería de la siguiente manera:
Frecuencia
observada
Frecuencia
esperada (ideal)
Cara 98 50
Sello 2 50
Total 100 100
Donde la frecuencia esperada o ideal se calcula multiplicando el número de lanzamientos (100) o
pruebas realizadas por la probabilidad de ocurrencia de cada uno de los resultados de la moneda (0,5
para cara y 0,5 para sello). Así, para la cara y sello, las frecuencias esperadas están dadas por:
100*0,5 = 50.
5. Variable (categorías)
Frecuencia
observada
Frecuencia
esperada (ideal)
1 O1 e1
2 O2 e2
3 O3 e3
. . .
i Oi ei
. . .
. . .
k Ok ek
Total N N
k
i i
ii
e
eO
1
2
2 )(
Y las frecuencias esperadas se obtienen multiplicando el número total de observaciones N por la
probabilidad de ocurrencia de cada una de las categorías de la variable, es decir:
ei = N * Probabilidad (ocurra categoría i) para i=1,2,3,.., k
Y para llevar a cabo esta prueba se construye el estadístico siguiente (que se ajusta a la llamada ley
chi-cuadrado de probabilidades):