2. - Métodos Probabilísticos
2
Metodos Probabilisticos
PROFESOR: Ing. Dante Salazar Sánchez
CURSO: Hidrología General
UNIVERSIDAD SAN PEDRO
Métodos Probabilísticos
Contenido
Distribución de Probabilidades en Hidrología ……………………………..……………… 3
Parámetros Estadísticos………………………………………………………………... 4
Distribución de Probabilidad para Variables Continuas……………….. 6
Ajuste de Distribuciones ………………………………………..…… 11
3. - Métodos Probabilísticos
3
DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGÍA
El comportamiento de las variables aleatorias discretas o continuas se describe con la
ayuda de Distribuciones de Probabilidad. La variable se designa por mayúscula y un valor
específico de ella por minúscula.
Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente
P(a ≤ x ≤ b) denota la probabilidad de que un evento se encuentre en el intervalo (a, b).
Si conocemos la probabilidad P(a ≤ x ≤ b) para todos los valores de a y b, se dice que
conocemos la Distribución de Probabilidades de la variable x.
Si x es un número dado y consideramos la probabilidad P(X ≤ x):
F(x)= P(X x):
y llamamos F(x) la función de distribución acumulada.
4. - Métodos Probabilísticos
4
PARAMETROS ESTADISTICOS
Los estadísticos extraen información de una muestra, indicando las características de la
población. Los principales estadísticos son los momentos de primer, segundo y tercer
orden correspondiente a la media, varianza, y asimetría respectivamente.
1.2.1 Media :
Es el valor esperado de la variable misma. Primer momento respecto al origen. Muestra la
tendencia central de la distribución.
El valor estimado de la media a partir de la muestra es:
1.2.2 Varianza ²:
Mide la variabilidad de los datos. Es el segundo momento respecto a la media
El valor estimado de la varianza a partir de la muestra es
En el cual el div isor es n-1 en lugar de n para asegurar que la estadística que no tenga una
tendencia, en promedio, a ser mayor o menor que el valor verdadero. Las unidades de la
varianza son la media al cuadrado, la desviación estándar s es una medida de la
variabilidad que tiene las mismas dimensiones que la media y simplemente es la raíz
cuadrada de la varianza, se estima por s.
5. - Métodos Probabilísticos
Efectos de la función de densidad de probabilidad causados por cambios en la
desviación estándar
Coeficiente de variación es una medida adimensional de la variabilidad su
5
estimado es
1.2.3 Coeficiente de asimetría
la distribución de los valores de una distribución alrededor de la media se mide por la
asimetría. Se obtiene a partir del tercer momento alrededor de la media, div idiéndolo por
el cubo de la desviación estándar para que sea adimensional.
tercer momento respecto a la media
Un estimativo del coeficiente de asimetría está dado por:
ANALISIS DE FRECUENCIA
El análisis de frecuencia es una herramienta utilizada para, predecir el comportamiento
futuro de los caudales en un sitio de interés, a partir de la información histórica de
caudales. Es un método basado en procedimientos estadísticos que permite calcular la
magnitud del caudal asociado a un período de retorno. Su confiabilidad depende de la
longitud y calidad de la serie histórica, además de la incertidumbre propia de la
distribución de probabilidades seleccionada.
Para determinar la magnitud de eventos extremos cuando la distribución de
probabilidades no es una función fácilmente invertibles se requiere conocer la variación
de la variable respecto a la media. Chow en 1951 propusó determinar esta variación a
partir de un factor de frecuencia KT que puede ser expresado:
y se puede estimar a partir de los datos
Para una distribución dada, puede determinarse una relación entre K y el período de
retorno Tr. Esta relación puede expresarse en términos matemáticos o por medio del uso
de una tabla.
6. - Métodos Probabilísticos
6
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS
3.1 DISTRIBUCION NORMAL
La distribución normal es una distribución simétrica en forma de campana, también
conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los datos
hidrológicos tiene amplia aplicación por ejemplo a los datos transformados que siguen la
distribución normal.
3.1.1 Función de densidad:
La función de densidad está dada por
Los dos parámetros de la distribución son la media m y desviación estándar s para los
cuales (media) y s (desviación estándar) son derivados de los datos.
3.1.2 Estimación de parámetros:
3.1.3 Factor de frecuencia:
1. Si se trabaja con los X sin transformar el K se calcula como
este factor es el mismo de la variable normal estándar
3.1.4 Limites de confianza:
donde a es el nivel de probabilidad es el cuantil de la distribución normal estandarizada
para una probabilidad acumulada de 1-a y Se es el error estándar
7. - Métodos Probabilísticos
3.2 DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS
Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se
distribuye normalmente.
Esta distribución es muy usada para el calculo de valores extremos por ejemplo Qmax,
Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la ventaja que X>0
y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar
logaritmos se reducen en mayor proporción los datos mayores que los menores.
Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos de las
variables estén centrados en la media
7
3.2.1 Función de densidad:
y = ln x
donde, my : media de logaritmos de la población (parámetro escalar),
sy : Desviación estándar de los logaritmos de la población, estimado sy.
3.2.2 Estimación de parámetros:
3.2.3 Factor de frecuencia:
K es la variable normal estandarizada para el Tr dado, es el coeficiente de
variación, x media de los datos originales y s desviación estándar de los datos originales.
3.2.4 Limites de confianza:
en donde, n número de datos, Se error estándar, KT variable normal estandarizada.
8. - Métodos Probabilísticos
3.3 DISTRIBUCION GUMBEL O EXTREMA TIPO I
Una familia importante de distribuciones usadas en el análisis de frecuencia hidrológico es
la distribución general de valores extremos, la cual ha sido ampliamente utilizada para
representar el comportamiento de crecientes y sequías (máximos y mínimos).
8
3.3.1 Función de densidad:
En donde a y b son los parámetros de la distribución.
3.3.2 Estimación de parámetros
donde son la media y la desviación estándar estimadas con la muestra.
3.3.3 Factor de frecuencia:
Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que el caudal
para un período de retorno de 2.33 años es igual a la media de los caudales máximos.
3.3.4 Limites de confianza
KT es el factor de frecuencia y t(1-a) es la variable normal estandarizada para una
probabilidad de no excedencia de 1-a.
9. - Métodos Probabilísticos
3.4 DISTRIBUCION GAMMA DE TRES PARÁMETROS O PEARSON TIPO 3
Esta distribución ha sido una de las mas utilizadas en hidrología. Como la mayoría de las
variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la distribución
de frecuencia de variables tales como crecientes máximas anuales, Caudales mínimos,
Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y
volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres
parámetros.
9
3.4.1 Función de densidad:
donde,
x0 < x < a para a > 0
a < x < x0 para a < 0
a y b son los parámetros de escala y forma, respectivamente , y x0 es el parámetro de
localización.
3.4.2 Estimación de parámetros:
3.4.3 Factor de frecuencia:
Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la
muestra.
3.4.4 Intervalos de confianza:
Donde S es la desviación estándar de la muestra, n es el número de datos y d se
encuentra tabulado en función de Cs y Tr.
10. - Métodos Probabilísticos
3.5 DISTRIBUCIÓN LOG GAMMA O LOGPEARSON DE 3 PARÁMETROS
Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo I I I ,
se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo I I I . Esta
distribución es ampliamente usada en el mundo para el análisis de frecuencia de
Caudales máximos. Esta se trabaja igual que para la Pearson Tipo I I I pero con Xy y Sy
como la media y desviación estándar de los logaritmos de la variable original X.
10
3.5.1 Función de densidad:
a y b son los parámetros de escala y forma, respectivamente , y y0 es el parámetro de
localización
3.5.2 Estimación de parámetros:
Cs es el coeficiente de asimetría, son la media y la desviación estándar de los
logaritmos de la muestra respectivamente
3.5.3 Factor de frecuencia:
donde z es la variable normal estandarizada
Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la
muestra.
3.5.4 Intervalos de confianza:
Xt ± t(1-a) Se
Donde Sy es la desviación estándar de los logaritmos de la muestra, n es el número de
datos y d se encuentra tabulado en función de Cs y Tr.
11. - Métodos Probabilísticos
11
AJUSTE DE DISTRIBUCIONES
Para la modelación de caudales máximos se utilizan, entre otras, las distribuciones Log -
Normal, Gumbel y Log-Gumbel principalmente. Para seleccionar la distribución de
probabilidades de la serie histórica se deben tener en cuenta algunas consideraciones.
Cuando la información es adecuada el análisis de frecuencia es la metodología más
recomendable para la evaluación de eventos extremos, ya que la estimación depende
solamente de los caudales máximos anuales que han ocurrido en la cuenca y no da
cuenta de los procesos de transformación de la precipitación en escorrentía. Obviamente
tiene algunas limitaciones relacionadas con el comportamiento de la serie histórica y con
el tamaño y calidad de los datos de la muestra.
4.1 Plotting Position
Trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Se han
propuesto numerosos métodos empíricos. Si n es el total de valores y m es el rango de un
valor en una lista ordenada de mayor a menor (m=1 para el valor máximo) la probabilidad
de excedencia se puede obtener por medio de las siguientes expresiones:
California
Weibull
Hazen
La expresión más utilizada es la Weibull. Con las anteriores expresiones se halla lo que se
conoce como la distribución empírica de una muestra, esta luego se puede ajustar a una
de las distribuciones teóricas presentadas anteriormente. Los resultados pueden ser
dibujados en el papel de probabilidad; este es diseñado para que los datos se ajusten a
una línea recta y se puedan comparar los datos muestrales con la distribución teórica
(línea recta).
4.2 Pruebas de Ajuste
Para determinar que tan adecuado es el ajuste de los datos a una distribución de
probabilidades se han propuesto una serie de pruebas estadísticas que determinan si es
adecuado el ajuste. Estos son análisis estadísticos y como tal se deben entender, es decir,
no se puede ignorar el significado físico de los ajustes.
12. - Métodos Probabilísticos
4.2.1 Prueba Smirnov - Kolmogorov
El estadístico Smirnov Kolmogorov D considera la desviación de la función de distribución
de probabilidades de la muestra P(x) de la función de probabilidades teórica, escogida
Po(x) tal que
La prueba requiere que el valor Dn calculado con la expresión anterior sea menor que el
valor tabulado Dn para un nivel de probabilidad requerido.
12
Esta prueba es fácil de realizar y comprende las siguientes etapas:
El estadístico Dn es la máxima diferencia entre la función de distribución acumulada
de la muestra y la función de distribución acumulada teórica escogida.
Se fija el nivel de probabilidad a, valores de 0.05 y 0.01 son los más usuales.
El valor crítico Da de la prueba debe ser obtenido de tablas en función de a y n.
Si el valor calculado Dn es mayor que el Da, la distribución escogida se debe
rechazar.
4.2.2 Prueba Chi Cuadrado
Una medida de las discrepancias entre las frecuencias observadas (fo) y las frecuencias
calculadas (fc) por medio de una distribución teórica esta dada por el estadístico χ²
en donde
Si el estadístico χ²=0 significa que las distribuciones teórica y empírica ajustan
exactamente, mientras que si el estadístico χ²>0, ellas difieren. La distribución del
estadístico χ² se puede asimilar a una distribución Chi-cuadrado con (k-n-1) grados de
libertad, donde k es el número de intervalos y n es el número de los parámetros de la
distribución teórica. La función χ² se encuentra tabulada.
Supongase que una hipótesis Ho es aceptar que una distribución empírica se ajusta a una
distribución Normal.
Si el v alor calculado de χ² por la ecuación anterior es mayor que algún v alor crítico de χ²,
con niveles de significancia a de 0.05 y 0.01 (el nivel de confianza es 1-a) se puede decir
que las frecuencias observadas difieren significativamente de las frecuencias esperadas
(o calculadas) y entonces la hipótesis Ho se rechaza, si ocurre lo contrario entonces se
acepta.
Aunque no existe una definición generalmente aceptada, se puede entender como
valores extremos, muy superiores a los demás registrados (Ashkar, et al. 1994).
13. - Métodos Probabilísticos
13
1. ESTADISTICA DE DATOS HIDROMETRICOS
ANALISIS DE DATOS HIODROMETRICOS EN RIO JEQUETEPQUE
14. - Métodos Probabilísticos
14
CALCULO DE PROBABILIDAD DE DATOS HIDROMETRICOS EN RIO JEQUETEPQUE
ANALISIS DATOS HIDROMETRICOS
PARA LA REALIZACIÓN DEL ESTUDIO HIDROLÓGICO DE LA CUENCA HIDROGRÁFICA SE
DISPONE DE MEDICIÓNES DE CAUDALES, CONSIDERANDO LA DISPONIBILIDAD DE
ESTOS REGISTROS EN LAS ESTACIONES DE AFORO.
LA DETERMINACION DE LA CURVA DE CALIBRACION - PERIODO DE RETORNO SE
REALIZO MEDIANTE EL ANALISIS ESTADISTICO DE AJUSTE DE UNA DISTRIBUCION DE
PROBABILIDAD, APLICANDOSE EN ESTE CASO LAS DISTRIBUCIONES: NORMAL,
LOGNORMAL, PEARSON, LOGPEARSON, GUMBEL, LOGGUMBEL. ELIGIENDOSE LA MAS
REPRESENTATIVA A LA SERIE DE DATOS ANALIZADOS.
DEL ANALISIS RESULTA QUE LA DISTRIBUCION DE GUMBEL ES LA QUE MAS SE
APEGA A LA SERIE DE DATOS DE LA ESTACION HIDROMETRICA DE YONAN.
18. - Métodos Probabilísticos
18
CALCULO DE PROBABILIDAD DE DATOS HIDROMETRICOS EN RIO JEQUETEPQUE
METODOLOGIA DEAPLICACIÓN DE LA DISTRIBUCION DE PROBABILIDAD GUMBEL
DICHA DISTRIBUCION ES DEL TIPO EXPONENCIAL, CASO ESPECIAL DE LA LOG-NORMAL
A) DISTRIBUCION GUMBEL B) DISTRIBUCION LOG-GUMBEL
FUNCION MATEMATICA
X = Xm + ( (Y - Yn ) / Tn ) S FUNCION MATEMATICA
DONDE:
X VALOR BUSCADO W=Wm+((Y-Yn)/Tn)Sw
Xm, S MEDIA Y DESVIACION DE LA SERIE
Yn, Tn CONSTANTES TEORICAS, SEGÚN n (CUADRO 3.6)
n NUMERO TOTAL DE DATOS CONSIDERADOS
Y 46 T 46
0.5468 1.1538
Y VARIABLE REDUCIDA , FUNCION DE LA PROBABILIDAD
Tr p(X<=x)=1-(1/Tr) Y X Tr p(X<=x)=1-(1/Tr) Y W X=ANTILOG (W)
1000 0.9990 6.907 15.1 1000 0.9990 6.907 2.12 131.4
500 0.9980 6.214 13.8 500 0.9980 6.214 1.92 83.4
200 0.9950 5.296 12.0 200 0.9950 5.296 1.66 45.7
100 0.9900 4.600 10.6 100 0.9900 4.600 1.46 29.0
50 0.9800 3.902 9.2 50 0.9800 3.902 1.26 18.4
25 0.9599 3.196 7.9 25 0.9600 3.199 1.06 11.6
20 0.9500 2.970 7.4 20 0.9500 2.970 1.00 10.0
10 0.9000 2.250 6.0 10 0.9000 2.250 0.79 6.2
5 0.8000 1.500 4.6 5 0.8000 1.500 0.58 3.8
2 0.5000 0.367 2.4 0.26 1.812299695
INTERVALO DE CONFIANZA PARA EL Tr= 100 AÑOS
SI CTE.= 1 - 1 / Tr 0.99 MAYOR A 0.9
ENTONCES Ax=+- 1.14 Sx / Tn 2.22
EL VALOR FLUCTUA ENTRE: 13 POR REGISTROS ALTOS SE CONSIDERA ADECUADO EL INTERVALO ALTO
8
ESTUDIO HIDROLOGICO DE AVENIDAS
ANALISIS DE DATOS HIDROMETRICOS
X= Xm + (( Y - Y n )/ Tn ) S
EL PROCEDIMIENTO ES SIMILAR A LA DE GUMBEL, CONSIDERANDO COMO SERIE A LOS
LOGARITMOS DE LOS DATOS ORIGINALES, ESTO ES Wi = LOG X
23. - Métodos Probabilísticos
PROBABILIDAD DE NO
EXCEDENCIA DIST.LOG-NORMAL
0.00 0.20 0.40 0.60 0.80 1.00 1.20
23
COMPARACION ENTRE LAS FRECUENCIAS OBSERVADAS Y TEORICAS
FRECUENCIAS OBSERVADAS FRECUENCIAS TEORICAS PROBABILIDAD VALOR DE LA VARIABLE DI ST. NORMAL 2P MEDIA 3.43 VALOR DE LA VARIABLE
DE NO OCURRENCIA OBSERVADA DESV.EST 3.15
0. 10 1. 07 0. 10 - 0. 60
0. 20 1. 21 0. 20 0. 79
0. 30 1. 69 0. 30 1. 78
0. 40 1. 95 0. 40 2. 64
0. 50 1. 97 0. 50 3. 43
0. 60 2. 72 0. 60 4. 23
0. 70 3. 33 0. 70 5. 08
0. 80 6. 50 0. 80 6. 08
0. 90 7. 64 0. 90 7. 46
0. 99 12. 33 0. 99 10. 75
DI ST. LOG. NORMAL 2P MEDIA 0.71 VALOR DE LA VARIABLE
VARIANCIA 4.28
0. 10 0. 01
0. 20 0. 06
0. 30 0. 22
0. 40 0. 69
0. 50 2. 03
0. 60 6. 01
0. 70 19. 15
0. 80 74. 35
0. 90 488. 08
0. 99 42582. 19
CUADRO N° A.1.4 PRUEBA DE AJUSTE MEDIANTE CHI-CUADRADO
Ho : Exi st e aj ust e suf i ci ent e a l a Di st . Nor mal
CHI-CUADRADO CHI-CUADRADO
CALCULADO TEORICO
#¡ NUM! 3. 9 #¡ NUM!
Ho : Exi st e aj ust e suf i ci ent e a l a Di st . Log. Nor mal
CHI-CUADRADO CHI-CUADRADO
CALCULADO TEORICO
0. 0 3. 9 SE ACEPTA Ho
14.00
12.00
10.00
8.00
6.00
4.00
2.00
0.00
PROBABILIDAD DE NO
EXCEDENCIA-DIST.NORMAL
0.00 0.20 0.40 0.60 0.80 1.00 1.20
Valor de la Variable
P(X<=x)
45000.00
40000.00
VALOR DE LA VARIABLE
35000.00
30000.00
25000.00
20000.00
15000.00
10000.00
5000.00
0.00
-5000.00
-10000.00
P(X<=x)
FREC.TEORICA
FREC.TEORICA
FREC. OBSERV.
FREC. OBSERV.
28. - Métodos Probabilísticos
28
BIBLIOGRAFIA Y WEBGRAFIA
- Autoridad Nacional del Agua – Sd Rio Jequetepeque – Balance Hidrico Anual
- www.udicop.net/metodos-probabilisticos-ref.sxp/lg#.ffd
- https://Bibliotecasvirtual/hidrometria-met#hotspot/12099