1. I. INTRODUCCIÓN
Se entiende por bondad de ajuste, la asimilación de datos observados de una
variable, a una función matemática previamente establecida y reconocida. A
través de ésta es posible interpolar y extrapolar información; en otras palabras,
predecir el comportamiento de la variable en estudio (Pizarro et al, 1986).
Para la estimación de la bondad de ajuste, existen variadas pruebas, las cuales
poseen distinto grado de efectividad.
En el presente documento se entrega el test de Kolmogorov-Smirnov. La prueba
de bondad de ajuste se aplica en diseños de investigación en los que se estudia a
un único grupo.
La prueba compara la distribución de frecuencias observada (Fo) de una variable
usualmente cualitativa, pero que también puede ser cuantitativa, con la
distribución de frecuencias de la misma variable medida en un grupo de
referencia.
El procedimiento de la prueba implica el cálculo de una distribución esperada (Fe)
en el grupo estudiado, usando como punto de partida a la distribución de la
variable en el grupo de referencia.
El propósito de la prueba es averiguar si existen diferencias estadísticamente
significativas entre la distribución observada (Fo) y la distribución esperada (Fe).
2. II. CUERPO O CONTENIDO
2.1 Prueba Kolmogorov – Smirnov
Método por el cual se comprueba la bondad de ajuste de las distribuciones,
asimismo permite elegir la más representativa, es decir la de mejor ajuste.
Esta prueba consiste en comparar el máximo valor absoluto de la diferencia D
entre la función de distribución de probabilidad observada Fo (xm) y la estimada F
(xm):
D = máx / Fo(xm) – F(xm)/
Con un valor crítico d que depende del número de datos y el nivel de significancia
seleccionado (Tabla Nº 03). Si D<d, se acepta la hipótesis nula. Esta prueba tiene
la ventaja sobre la prueba de X2 de que compara los datos con el modelo
estadístico sin necesidad de agruparlos. La función de distribución de probabilidad
observada se calcula como:
Fo(xm) = 1- m / (n+1) (13)
Donde m es el número de orden de dato xm en una lista de mayor a menor y n es
el número total de datos. (Aparicio, 1996)
3. 2.2 Test de Kolmogorov-Smirnov en la Distribución de Gumbel
Para la aplicación del test señalado, es necesario determinar la frecuencia
observada acumulada.
Para la frecuencia observada en el caso especial de Gumbel, se ordena la
información de menor a mayor y se aplica:
donde:
Fn (x): frecuencia observada acumulada.
n: N° total de orden
N: N° total de datos.
En el caso de la frecuencia teórica acumulada, ésta se determina a través de la
función de Gumbel.
Una vez determinadas ambas frecuencias, se obtiene el supremo de las
diferencias entre ambas, en la i-ésima posición de orden, que se denomina D.
4. Luego, asumiendo un valor de significancia, se recurre a la tabla de valores
criticos de D en la prueba de Bondad de ajuste de Kolmogorov-Smirnov, y
considerando el tamaño de la muestra, se establece lo sieguiente:
Si D < D tabla, se acepta que (el ajuste es adecuado, coon el nive de confiabilidad
asumido.
Ajuste a Gumbel:
Se desea conocer la ley de distribución de las precipitaciones máximas en 24
horas, de la estación Monte Patria provincia de Limarí. Para ello, se dispone de
los siguientes datos.
De lo expuesto, se deduce que se cuenta con una información de doce años, y
además que los montos denotan una extrema variabilidad.
En relación al primer aspecto, es un denominador común en muchas estaciones
del país, la carencia de series hidrológicas consistentes, por lo cual es difícil
soslayarlo. En cuanto a la variabilidad, es preciso destacar que las zonas áridas
se caracterizan por presentar este elemento como característica de la distribución
y monto de las precipitaciones.
No obstante lo anterior, y como se tiende a estimar valores máximos, se puede
obviar este último aspecto considerando las dos o tres precipitaciones máximas
anuales, para con esta nueva serie de datos elegir un número mayor de años a
considerar.
5. Luego, el enfrentamiento de este problema es resorte del criterio que el ingeniero
utilice para tomar la decisión, y la cual sólo podrá ser calificada a la luz de los
antecedentes que cada situación denote. Así, para el caso en cuestión, se
trabajará con la información deprecipitación máxima anual en 24 horas, toda vez
que se trata de un ejercicio metodológico.
Con los datos de la columna 1, se determina que:
Luego, los parámetros u y d quedan:
6. Por consiguiente, la función de Gumbel se define como:
De lo expuesto, se deduce que se cuenta con una información de doce años, y
además que los montos denotan una extrema variabilidad. Por otra parte,
aplicando la expresión n/N+1, se obtiene la frecuencia observada acumulada, la
cual se expresa en la columna (2) del cuadro N° 2. Asimismo, reemplazando en la
ecuación (1) los valores de x, se obtienen las frecuencias teóricas acumuladas,
las cuales constituyen la columna (3) del cuadro N° 2.
2.3 Aplicación de Kolmogorov-Smirnov.
Con la información del cuadro N° 2, se busca el
En este caso, corresponde a D = 0.073 en el tercer valor del cuadro mencionado.
Con un 95% de confiabilidad y n = 12, se obtiene un valor de tabla Dt = 0.375.
Luego D < Dt, por consiguiente se acepta con 95% de seguridad que el ajuste es
bueno.
7. 2.4 SPSS: PRUEBAS NO PARAMÉTRICAS y Kolmogorov y smirnov
La prueba de Kolmogorov-Smirnov para una muestra es un procedimiento de
"bondad de ajuste", que permite medir el grado de concordancia existente entre la
distribución de un conjunto de datos y una distribución teórica específica. Su
objetivo es señalar si los datos provienen de una población que tiene la
distribución teórica especificada, es decir, contrasta si las observaciones podrían
razonablemente proceder de la distribución especificada.
Ejemplo. Muchas pruebas paramétricas requieren que las variables se distribuyan
de forma normal. La prueba de Kolmogorov-Smirnov para una muestra se puede
utilizar para comprobar si una variable (por ejemplo notas) se distribuye
normalmente.
Estadísticos. Media, desviación típica, mínimo, máximo, número de casos no
perdidos y cuartiles.
Seleccionar:
• Analizar…
o K-S de 1 muestra...
8.
9. Se pueden seleccionar una o más variables de contraste numéricas. Cada
variable genera una prueba independiente. En nuestro caso vamos a seleccionar t
para realizar la prueba.
Si lo deseas, puedes pulsar en Opciones para obtener estadísticos descriptivos,
cuartiles y controlar el tratamiento de los datos perdidos.
10. Pulsamos aceptar…….
Comprobamos el nivel de significación, si es menor que 0.05 la distribución no es
normal, si es mayor que 0.05 la distribución es normal.
En este caso la distribución es normal (nivel de significación 0.904).
11. III. CONCLUSIONES
El Test de Kolmogorov-Smirnov se basa en la idea de comparar la función
de la distribución acumulada de los datos observados con la de una
distribución normal, midiendo la máxima distancia entre ambas curvas.
El Tests de Kolmogorov-Smirnov se utilizan para verificar si
una distribución se ajusta o no a una distribución esperada, en particular a
la distribución normal.
La prueba de Kolmogórov-Smirnov se utiliza para determinar la bondad de
ajuste de dos distribuciones de probabilidad entre sí y es bastante potente
con muestras grandes.
La prueba Kolmogórov-Smirnov es más sensible a los valores cercanos a
la mediana que a los extremos de la distribución.
12. IV. REFERENCIA
PIZARRO, R.; NOVOA, P. 1986. Instructivo n° 5. Determinación de valores
probabilísticos para variables hidrológicas. Elementos técnicos de
Hidrología. Corporación Nacional Forestal (CONAF). Chile. 78 p.
http://eias.utalca.cl/Docs/pdf/Publicaciones/manuales/a_modulo_leyes.pdf
http://transparencia.mtc.gob.pe/idm_docs/normas_legales/1_0_2950.pdf
http://www.facmed.unam.mx/deptos/salud/censenanza/planunico/spii/antolo
gia2012/3.pdf
http://www.uv.es/innomide/spss/SPSS/SPSS_0802A.pdf
http://www-01.ibm.com/software/pe/analytics/spss/
http://www.mangrafias.com/trabajos11/docima/docima.shtml
http://www.math.epn.edu.ec/~sandra/TDE_2013_B/Tablas%20KS.pdf