Este documento describe los pasos para realizar la prueba de Kolmogorov-Smirnov para determinar si una serie de datos se ajusta a una distribución de probabilidad específica. Explica cómo calcular las probabilidades observadas y esperadas acumuladas, el estadístico de prueba, y compararlo con un valor crítico para determinar si se puede rechazar la hipótesis nula de que los datos se ajustan a la distribución propuesta. Luego aplica estos pasos para determinar que los datos de tiempo entre roturas de un filamento se a
2. Desarrollada en la década de los treinta del siglo xx, esta prueba permite al igual que
la prueba Chi-cuadrada determinar la distribución de probabilidad de una serie de
datos. Una limitante de la prueba de Kolmogorov-Smirnov estriba en que solamente
se puede aplicar al análisis de variables continuas.
3. El procedimiento general de la prueba es:
Obtener al menos 30 datos de la variable aleatoria a analizar.
Calcular la media y la varianza de los datos.
Crear un histograma de 𝑚 = 𝑛 intervalos, y obtener la frecuencia observada en cada
intervalo 𝑂𝑖.
Calcular la probabilidad observada en cada intervalo 𝑃𝑂𝑖 = 𝑂𝑖/𝑛 , esto es, dividir la
frecuencia observada 𝑂𝑖 entre el número total de datos, n.
Acumular las probabilidades 𝑃𝑂𝑖 para obtener la probabilidad observada hasta el i-esimo
intervalo, 𝑃𝑂𝐴𝑖
4. El procedimiento general de la prueba es:
Establecer explícitamente la hipótesis nula, proponiendo una distribución de probabilidad
que se ajuste a la forma del histograma.
Calcular la probabilidad esperada acumulada para cada intervalo, 𝑃𝐸𝐴𝑖, a partir de la función
de probabilidad propuesta.
Calcular el estadístico de prueba:
𝑐 = 𝑚á𝑥 𝑃𝐸𝑖 − 𝑃𝑂𝐴𝑖 𝑖 = 1,2,3, … , 𝑘, … , 𝑚
5. El procedimiento general de la prueba es:
Definir el nivel de significancia de la prueba 𝛼, y determinar el valor crítico de la prueba, 𝐷 𝛼,𝑛
(consulte la tabla de valores críticos de la prueba de Kolmogorov-Smirnov).
Comparar el estadístico de prueba con el valor crítico. Si el estadístico de prueba es menor
que el valor crítico no se puede rechazar la hipótesis nula.
6. Un estudio del comportamiento del tiempo entre roturas de cierto filamento, medido
en minutos/rotura, se muestra a continuación:
7. Determinar la distribución de probabilidad con un nivel de significancia 𝛼 de 5 %.
El histograma (vea la figura 4) de los n = 50 datos con m = 8 intervalos, la media
muestral de 4.7336 y la varianza muestral de 12.1991 permiten estimar un parámetro
de forma de 1.38 y un parámetro de escala de 5.19, y establecer la hipótesis:
𝐻 𝑜: 𝑊𝑒𝑖𝑏𝑢𝑙𝑙 (𝛼 = 1.38, 𝛽 = 5.19) minutos/rotura
𝐻1: 𝑂𝑡𝑟𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
10. Posteriormente calculamos la probabilidad esperada acumulada de cada intervalo
𝑃𝐸𝐴𝑖 a partir de la función de probabilidad acumulada de Weibull:
𝐹 𝑥 = 0
𝑥
𝛼𝛽−𝛼
𝑥 𝛼−1
𝑒
−
𝑥
𝛽
𝛼
𝑑𝑥
𝐹 𝑥 = 1 − 𝑒
−
𝑥
𝛽
𝛼
𝐹 𝑥 = 1 − 𝑒
−
𝑥
5.19
1.38
11. Por ejemplo, para el interval con el limite superior de 8:
𝑃𝐸𝐴8 = 𝐹 𝑥 = 8 = 1 − 𝑒
−
𝑥
5.19
1.38
=0.8375
Por ultimo calculamos el estadístico de prueba
𝑐 = 𝑚á𝑥 𝑃𝑂𝐴𝑖 − 𝑃𝐸𝐴𝑖 = 𝑚á𝑥 0.24 − 0.2353 , 0.50 − 0.5025 , … , 1 − 1 = 0.0375
12. A partir de los cálculos anteriores se obtiene la tabla 2
Intervalo 𝑶𝒊 𝑷𝑶𝒊 𝑷𝑶𝑨𝒊 𝑷𝑬𝑨𝒊 𝑷𝑶𝑨𝒊 − 𝑷𝑬𝑨𝒊
0-2 12 0.24 0.24 0.23526 0.0047
2-4 13 0.26 0.50 0.50247 0.0025
4-6 9 0.18 0.68 0.70523 0.0252
6-8 6 0.12 0.80 0.83747 0.0375
8-10 6 0.12 0.92 0.91559 0.0044
10-12 2 0.04 0.96 0.95839 0.0016
12-14 1 0.02 0.98 0.98042 0.0004
14-8 1 0.02 1.00 1 0.0000
Total 50 1 c 0.0375
13. El valor del estadístico de prueba, c = 0.0375, comparado con el valor de tablas críti-
co, 𝐷0.05,50 = 0.1923, indica que no podemos rechazar la hipótesis de que la variable
aleatoria se comporta de acuerdo con una distribución de Weibull con parámetro de
escala 5.19 y parámetro de forma 1.38.