La prueba de Kolmogorov-Smirnov es un procedimiento de bondad de ajuste que permite medir el grado de concordancia entre la distribución de frecuencias observada en una muestra y una distribución teórica específica. Calcula un estadístico K-S que compara la función de distribución empírica de la muestra con la función teórica, y permite probar si la muestra proviene de la distribución teórica propuesta. Se presenta un ejemplo donde se aplica la prueba K-S para determinar si los tiempos de
1. La Prueba Kolmogorov-Smirnov
Prueba no paramétrica para bondad de ajuste
Análisis Cuantitativo del Riesgo
Estadística I
David Solís
Data don’t make any
sense, we will have
to resort to statistics.
3. 3
Resumen
La prueba de Kolmogorov-Smirnov es un procedimiento de
bondad de ajuste, es decir, permite la medición del grado de
concordancia existente entre la distribución de un conjunto
de datos (muestra) y una distribución teórica específica.
Hipótesis:
H0: La distribución de frecuencias observada es consistente
con la distribución teórica - Buen ajuste
H1: La distribución de frecuencias observada no es
consistente con la distribución teórica - Mal ajuste
α = Nivel de significación de la prueba
4. 4
Introducción
El objetivo de esta prueba de bondad
de ajuste es señalar y determinar si
los datos estudiados o mediciones
muéstrales provienen de una
población que tiene una distribución
teórica determinada.
La prueba de Kolmogorov-Smirnov
es una prueba no paramétrica que se
emplea para probar el grado de
concordancia entre la distribución de
datos empíricos de la muestra y
alguna distribución teórica específica.
Objetivo Definición
Más poderosa que la Chi cuadrada
Fácil de calcular y usar - no requiere agrupación de los datos
El estadístico es independiente de la distribución de frecuencias esperada,
solo depende del tamaño de la muestra
Ventajas
La prueba aborda la pregunta: ¿Provienen las observaciones de la muestra de
alguna distribución hipotética?
16. 9
Ejemplo Problema
Se cree que los tiempos de un autobús de pasajeros en cierta ciudad están
distribuidos de manera uniforme de acuerdo a los límites de destino de 35
minutos a 50 minutos, dependiendo del flujo de tráfico de la mañana. Una
muestra aleatoria de n = 10 tiempos fue tomada, obteniéndose las
siguientes realizaciones: 37, 42, 48, 30, 38, 39, 49, 47, 40, 41. Para un nivel
de significación de 0.05, determinar si la muestra proviene de una
distribución uniforme.
La función de distribución para H0 está especificada por:
18. 11
Ejemplo Solución
Fuente: Miller, L. H. (1956). Table of percentage points of Kolmogorov statistics. Journal of the American Statistical Association, 51(273), 111-121.
Dado que 0.233 < 0.409, no hay evidencia empírica suficiente que
indiquen que la muestra no está distribuida uniformemente entre 35 y 50