1. PRUEBAS DE BONDAD DE AJUSTE
Es necesario colectar y procesar cierta
cantidad de datos, formular el modelo
matemático así como estimar parámetros.
Para realizar esta actividad se requiere de
analizar los datos del problema que nos lleven
a estimar parámetros e indagar si los datos
recolectados se ajustan a una distribución de
probabilidad.
2. PRUEBAS DE BONDAD DE AJUSTE
Los pasos básicos para realizar una prueba de bondad de ajuste se encuentran:
1. Definir la variable a analizar. Para definir la variable es importante revisar la
problemática, y analizar si los datos corresponden a datos discretos o continuos.
2. Obtener media y varianza de los datos. Haciendo uso de estadística obtener la
media y varianza que servirá en muchos casos para estimar los parámetros. Se
pueden usar herramientas computacionales para obtener la media y varianza.
3. Elaborar el histograma de frecuencias, de preferencia datos discretos se manejan
de forma puntal y datos continuos se manejan como rangos. Se pueden usar
herramientas computacionales para obtener los histogramas de frecuencia.
3. PRUEBAS DE BONDAD DE AJUSTE
Elegir la posible distribución de
probabilidad a utilizar. Cabe
hacer notar que será importante
tener un conocimiento de los
datos y de las diferentes
distribuciones de probabilidad
como son función de
probabilidad, parámetros, rango,
media, varianza, estimadores y
posibles aplicaciones, entre las
que se encuentran:
4. PRUEBAS DE BONDAD DE AJUSTE
Calcular los parámetros. Una vez que se elija la distribución de probabilidad será
importante calcular los parámetros de la distribución a utilizar para realizar la prueba
a través de los estimadores.
Realizar la prueba de bondad de ajuste, será importante realizar los cálculos
necesarios de acuerdo a la prueba, se tienes diferentes pruebas como las que a
continuación se mencionan:
5. PRUEBA CHI-CUADRADA
• Chi-Cuadrada. Compara las frecuencias observadas (FOi) por clase, contra las frecuencias
esperadas, y es una prueba paramétrica que mínimo requiere 5 clases así como 5 observaciones
mínimas en cada clase, consta de los siguientes pasos:
1. Determinar la frecuencia esperada (FEi) para cada uno de los intervalos de la distribución de probabilidad
propuesta. Será importante conocer las distribuciones acumulativas para realizar este cálculo.
2. Calcular el estimador:
𝜒 𝑐
2
= σ𝑖=1
𝑘 (𝐹𝐸 𝑖−𝐹𝑂𝑖)2
𝐹𝐸 𝑖
donde k es el número de intervalos en el histograma de frecuencias.
3. Comparamos el estadístico 𝜒 𝑐
2
con distribución Ji-cuadrada 𝜒 𝛼,𝑘−𝑚−1
2
con un nivel de significancia y k-m-1
grados de libertad, siendo k el número de clases en la tabla de distribución de frecuencias y m el número de
parámetros estimados.
6. PRUEBA KOLMOGOROV-SMIRNOV
• Kolmogorov – Smirnov. Es una prueba no paramétrica, trabaja con valores agrupados en
intervalos de clase y para valores sin agrupar, pueden ser muestras pequeñas, es más
confiable que la prueba Ji-Cuadrada, consta de los siguiente pasos:
1. Se considera la frecuencia observada (FOi) de cada intervalo, se obtiene la probabilidad observada (POi)
en cada intervalo, dividiendo su frecuencia observada entre el número de datos observado n.
2. Se calcula la probabilidad observada acumulada (POAi).
3. Usando la distribución de densidad de probabilidades propuesta, se calcula la probabilidad esperada
(PEi) para cada intervalo de clase.
4. Se calcula la probabilidad esperada acumulada (PEAi) para los intervalos de clase.
5. Se determina el valor absoluto de la diferencia PEAi - POAi en todos los intervalos de clase y se considera
la máxima diferencia MD, la cual será el estimador.
6. Se compara al estimador MD con el valor correspondiente a los n datos observados con un nivel de
significación de 1- al valor crítico Dn,1-
7. PRUEBAS DE BONDAD DE AJUSTE
Verificar si cumple con los criterios de la prueba. Las reglas de decisión son:
ReglaparaJi-Cuadrada:
Si 𝜒𝑐
2
≤ 𝜒𝛼,𝑘−𝑚−1
2
losdatosseajustanaladistribucióndeprobabilidadpropuesta.
ReglaparaKolmogorov-Smirnov:
SiMD≤Dn,1- losdatosseajustanaladistribucióndeprobabilidadpropuesta.
8. EJEMPLO 1
Suponga que se tiene los tiempos entre llegadas de un bien que requiere de un
empaquetado en minutos, en este caso la variable en estudio es Xt: tiempo entre
llegada del bien t y el t-1 (los datos serán continuos), se muestra el histograma con
las frecuencias, las clases ya agrupadas y resumen de datos generales:
9. EJEMPLO 1
Para este caso se trabajará con la prueba de bondad de ajuste de Ji-cuadrada ya que se
tiene 100 datos, más de cinco clases y por clase más de 5 datos. Por el tipo de variable y
aplicación se puede pensar en una distribución de probabilidad Exponencial, con media
( ത𝑋) 4.83 y desviación estándar 4.55, en este caso se supondrá que el parámetro se
estima con 1/ ത𝑋 (0.207). Se pueden usar diversas herramientas para realizar la prueba
como Excel, R, etc., en este caso se utilizó Excel:
10. EJEMPLO 1
Comparando 𝜒 𝑐
2
con distribución Ji-cuadrada 𝜒 𝛼,𝑘−𝑚−1
2
queda 5.00≤11.07 (este valor se
obtiene de las tablas de la Chi cuadrada con un 95% y 5 grados de libertad) por tanto los
datos se asemejan a una distribución exponencial con =0.207.
11. EJEMPLO 2
Suponga que se tienen los tiempos en minutos de servicio del trabajador que empaqueta
el bien, en este caso la variable aleatoria Xt: tiempo de empaquetado en minutos que tarda
el trabajador con el paquete t. (se tendrá una variable continuo) con el siguiente
histograma:
12. EJEMPLO 2
En este caso se trabajará con la prueba Kolmogorov – Smirnov ya que se tiene una menor
cantidad de datos (40), considerando el histograma se puede pensar en una distribución
uniforme con mínimo 4 y un máximo 10, al igual que en el caso anterior se utilizará Excel
para realizar los cálculos:
13. EJEMPLO 2
Comparando Dn, 1- con MD, donde n equivale a 40 datos y =0.05, se obtiene para D40, 95, y
se realiza la prueba 0.11≤0.210 (este valor se obtiene de las tablas “Valores críticos de D
para la prueba de Kolmogorov-Smirnov de una muestra”), por tanto se acepta que los
datos se distribuye como una uniforme.
14. FORMAS DE OBTENER LA FRECUENCIA ESPERADA
Normal
Exponencial
Uniforme
15. NORMAL
Parámetros: R 2>0
Rango: x R
Media:
Varianza: 2
Estimadores: est ()=X est (2)= S2
Función de Densidad:
Para calcular la frecuencia esperada pueden
usar la distribución normal estándar, deben
estandarizar su propuesta utilizando:
Suponga un intervalo [x1,x2], entonces
sustituirán X, por x1 obteniendo un Z1 y
obtendrán un Z2 al sustituir X por X2,
[Z1,Z2], esto lo tendrán que buscar en tablas
de la normal. Encuentran el valor de Z1 y su
probabilidad y encuentran el valor Z2 y su
probabilidad y para obtener P(Z2-Z1)=
P(Z2)-P(Z1) (a este valor se le llama
probabilidad por intervalos), para asociar la
frecuencia deben multiplicar nP(Z2-Z1)
donde n es el número de elementos de la
muestra.
Tabla de la Normal:
http://2.bp.blogspot.com/-
qIKb4y1GVik/UJqKZNE98gI/AAAAAAAAAH
s/aYO_TTqzFuU/s1600/Tabla_normal.png
16. EXPONENCIAL
Parámetros: >0
Rango: [0, ∞)
Media: 1/
Varianza: 1/ 2
Estimadores: est ()=1/X
Función de Densidad: Para calcular la frecuencia
esperada, suponiendo el rango
[x1,x2], usarán 𝑃 𝑥1, 𝑥2 =
− 𝑒−𝜆𝑥2 + 𝑒−𝜆𝑥1 (a este valor se
la llama probabilidad por
intervalos) a este valor le
multiplicarán n (n se el número de
elementos de la muestra)
17. UNIFORME
Parámetros: a,b con b>a
Rango: [a, b]
Media: (a+b)/2
Varianza: (b-a)2/12
Estimadores: est (a)=min Xi, est(b)=máx
Xi
Función de Densidad:
Para calcular la frecuencia
esperada, suponiendo cualquier
rango [x1,x2], el valor siempre
será el mismo 1/(b-a), para
obtener el valor esperado será
necesario multiplicar n (número de
elementos de la muestra)