6 distribuciones estadisticas en Hidrologia y su aplicación en el lenguaje de programación R: Log-Normal 3P, Gamma 2P, Gamma 3P, Log Pearson, Gumbel, Log Gumbel.
Trabajo Realizado para el Curso: Hidrología General.
DISTRIBUCIONES ESTADISTICAS EN HIDROLOGÍA Y SU APLICACIÓN EN R
1. UNIVERSIDAD NACIONAL DE HUANCAVELICA
(Creada por Ley Nro. 25265)
Facultad de Ciencias de Ingeniería
Escuela Profesional de Civil-Hvca
DISTRIBUCIONES ESTADISTICAS EN
HIDROLOGÍA Y SU APLICACIÓN EN R
CÁTEDRA : HIDROLOGÍA GENERAL
CATEDRÁTICO : Ing. IVAN AYALA BIZARRO
ESTUDIANTE : VENTURA HUAMAN, Dennis Oliver
CICLO Y SECCIÓN : VII “A”
HUANCAVELICA - 2016
2. Dedico de manera muy especial a mis padres, ya que ellos son el cimiento para la
construcción de mi vida profesional.
1
4. INTRODUCCIÓN
Las distribuciones estadísticos en el campo de la hidrología, tienen una gran importancia
para la estimación de valores de diseño a un periodo de retorno según al tipo de estructura
a la que se proyecta; a continuación se presenta 8 distribuciones estadísticas, entre ellas:
1. Log-Normal 3 parámetros
2. Gamma 2 parámetros
3. Gamma 3 Parámetros
4. Log-Pearson tipo III
5. Gumbel
6. Log-Gumbel.
Los parámetros de las distribuciones ya mencionadas pueden ser estimados por varios mé-
todos, los más usados son el método de momentos, método simplificado y el método de
máxima verisimilitud. El método de momentos tiene una limitación, pues para su aplicación
el coeficiente de cesgo tiene que se mayor a 0.52, caso contrario este métdodo no podria
ser aplicado. El método simplificado solo aproxima el valor del parámetro de posición y por
tanto los valores de los demás parámetros tambien son solo aproximaciones, y esto conlleva a
que no podría usarse para algunas de las distribuciones. El método de máxima verisimilitud
es uno de los métodos más confiables para el cálculo de los parámetros.
En el presente trabajo se detalla el procedimiento para el cálculo de cada uno de los diferentes
parámetros; además de los algoritmos en el lenguaje de programación estadístico R.
3
5. OBJETIVOS
• Optimizar y reducir tiempo en el cálculo de valores de diseños hidrológicos e hidráuli-
cos usando el lenguaje de programación estadistico R.
• Ampliar conocimientos sobre la programación orientados a la hidrología.
• Por medio del test de bondad de ajuste de Kolmogorov-Smirnov, determinar las fun-
ciones de distribución de probabilidad que mejor representan a la serie.
4
6. 1. CAPÍTULO 1. UN POCO DE HISTORIA 5
Capítulo 1
UN POCO DE HISTORIA
1.1. R
Fue desarrollado inicialmente por Robert Gentleman
y Ross Ihaka del Departamento de Estadística de la Uni-
versidad de Auckland en 1993. Sin embargo, si se remonta
a sus bases iniciales, puede decirse que inició en los Bell
Laboratories de AT&T y ahora Alcatel-Lucent en Nueva
Jersey con el lenguaje S. Éste último, un sistema para el
análisis de datos desarrollado por John Chambers, Rick
Becker, y colaboradores diferentes desde finales de 1970.
La historia desde este punto es prácticamente la del len-
guaje S. Los diseñadores iniciales, Gentleman y Ihaka,
combinaron las fortalezas de dos lenguajes existentes, S y Scheme. En sus propias palabras:
“El lenguaje resultante es muy similar en apariencia a S, pero en el uso de fondo y la semán-
tica es derivado desde Scheme”. El resultado se llamó R “en parte al reconocimiento de la
influencia de S y en parte para hacer gala de sus propios logros”.
R proporciona un amplio abanico de herramientas estadísticas (modelos lineales y no
lineales, tests estadísticos, análisis de series temporales, algoritmos de clasificación y agru-
pamiento, etc.) y gráficas.
Al igual que S, se trata de un lenguaje de programación, lo que permite que los usuarios lo
extiendan definiendo sus propias funciones. De hecho, gran parte de las funciones de R están
escritas en el mismo R, aunque para algoritmos computacionalmente exigentes es posible
desarrollar bibliotecas en C, C++ o Fortran que se cargan dinámicamente.
7. CAPÍTULO 1. 1.1. R 6
(a) Interfaz R en su versión 3.3.
(b) Iterfaz de Rstudio, Un IDE para R.
Figura 1.1: R como lenguaje de programación.
HIDROLOGÍA GENERAL
8. 2. CAPÍTULO 2. DISTRIBUCIONES DE PROBABILIDAD 7
Capítulo 2
DISTRIBUCIONES DE
PROBABILIDAD
2.1. DISTRIBUCIÓN LOG-NORMAL DE 3 PARÁME-
TROS
La distribución Log-Normal de tres parámetros es similar a la distribución Log-Normal
2P excepto que la variable x es restada en una cantidad xo que representa un límite inferior
para dicha variable, tal que: y = ln(x − x0)
2.1.1. Función densidad
La función densidad, de la distribución log-normal de 3 parámetros es:
f(x) =
1
(x − x0)σy
√
2π
e
−1
2
[
ln(x−x0)−µy
σy
]2
(2.1)
para xo ≤ x ≤ ∞
donde:
xo : Parámetro de posición en el dominio x
µy : Parámetro de escala en el dominio x
σ2
o : Parámetro de forma en el dominio x
2.1.2. Estimación de parámetros, método de Máxima Verisimilitud
Los prámetros de la distribución log-normal de 3 parámetros, estimados por el método
de máxima verisimilitud son:
µy =
1
N
N
i=1
ln(xi − xo) (2.2)
σy =
1
N
N
i=1
(ln(xi − xo) − µy)2) (2.3)
donde:
µy=Parámetro de escala, igual al promedio de los ln(x−xo) σy=Parámetro de forma, igual a
la desviación estándar de los ln(x − xo) xo=Parámetro de posición El parámetro de posición
9. CAPÍTULO 2. 2.1. DISTRIBUCIÓN LOG-NORMAL DE 3 PARÁMETROS 8
se calcula mediante un proceso iterativo como solución de la siguiente expresión resumida:
N
i=1
1
xi − xo
σ2
y − µy +
N
i=1
ln (xi − xo)
xi − xo
= 0 (2.4)
Para poder obtener los valores de los parámetros se tiene que recurrir a utilizar los métodos
numéricos, en este caso el método de la secante:
xn+1 = xn −
xn − xn−1
f(xn) − f(xn−1)
f(xn) (2.5)
Como se puede ver, este método necesitará dos aproximaciones iniciales de la raíz para poder
inducir una pendiente inicial.
2.1.3. Función de distribución acumulada
F(Z) =
1
√
2π
Z
−∞
e
−Z2
2 dZ (2.6)
donde:
Z =
ln(x − xo) − µy
σy
(2.7)
Se utilizó la solución empírica para la función acumulada de Abramowitz y Stegun(1965):
F(Z) = 1 − f(Z)(0,4361836t − 0,1201676t2
+ 0,937298t3
)
donde: para Z ≥ 0 t = 1
1+0,33267|Z|
2.1.4. Procedimiento para el cálculo y aplicación en R
1 Lectura e importación de datos
1 ### Aplication 01: Log−Normal 3P
2 ### BY: DENNIS VENTURA HUAMAN
3 # Location of work f o l d e r
4 setwd ( ’D: /UNH_CIVIL_VII_A/HIDROLOGIA/W−5/DISTRIBUCIONES R’ )
5 Data<− read . table ( ’ Data_Qmax(1) . txt ’ , header=TRUE)
6 x<−sort ( Data$Qmax)
7 summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
360.0 581.0 818.0 957.6 1030.0 3800.0
2 Distribución empírica propuesta por Weilbull: Pe = m
n+1
1 n<−length (x)
2 P_E <− c ()
3 f or ( i in 1: n)
4 {
5 P_E[ i ] <− i / (n+1)
6 }
7 P_E
HIDROLOGÍA GENERAL
10. CAPÍTULO 2. 2.1. DISTRIBUCIÓN LOG-NORMAL DE 3 PARÁMETROS 9
[1] 0.03333333 0.06666667 0.10000000 0.13333333 0.16666667
[6] 0.20000000 0.23333333 0.26666667 0.30000000 0.33333333
[11] 0.36666667 0.40000000 0.43333333 0.46666667 0.50000000
[16] 0.53333333 0.56666667 0.60000000 0.63333333 0.66666667
[21] 0.70000000 0.73333333 0.76666667 0.80000000 0.83333333
[26] 0.86666667 0.90000000 0.93333333 0.96666667
1 plot (x ,P_E, pch=18, col=" blue " , type="b" , l t y=1 , ylab = "P" ,
2 main = " Empirical Distribution " )
3 grid () 6
500 1000 1500 2000 2500 3000 3500
0.00.20.40.60.81.0
Empirical Distribution
x
P
3 Dar un valor inicial a xo, en este caso le damos una unidad menor al primer elemento de
nuestros datos, para el cálculo de los parámetros de forma y escala iniciales se usaron
las ecuaciones 2.2, 2.3 y 2.4; se iteró hasta obtener un error de 0.00001
1 ### Parameters c a l c u l a t i o n .
2 # Parameters c a l c u l a t i o n by of maximum l i k e l i h o o d method
3 # Using the secant method
4 xo<−x[1] −1
5 x1<−xo−10
6 mu<−sum( log (x−xo , exp (1) ) ) /n
7 sigma<−sum(( log (x−xo , exp (1) )−mu) ∗∗2/n) ∗∗ 0.5
8
9 Eo<−sum(( log (x−xo , exp (1) ) ) / (x−xo ) )+sum(1 / (x−xo ) ) ∗ ( sigma∗∗2−mu)
10 while ( abs (Eo)>=1E−5){
11 mu<−sum( log (x−x1 , exp (1) ) ) /n
12 sigma<−sum(( log (x−x1 , exp (1) )−mu) ∗∗2/n) ∗∗ 0.5
13
14 E1<−sum(( log (x−x1 , exp (1) ) ) / (x−x1 ) )+sum(1 / (x−x1 ) ) ∗ ( sigma∗∗2−mu)
15 x2<−x1−(E1∗ (xo−x1 ) ) / (Eo−E1)
16 xo<−x1
17 x1<−x2
HIDROLOGÍA GENERAL
11. CAPÍTULO 2. 2.1. DISTRIBUCIÓN LOG-NORMAL DE 3 PARÁMETROS 10
18 Eo<−E1
19 }
20 xo<−x1
21 data . frame (xo , mu, sigma )
xo mu sigma
1 265.2597 6.224071 0.7827017
4 La función de distribución acumulada de la distribución Log-Normal3P, usando
1 # The cumulative d i s t r i b u t i o n function of Log−Normal3P Distribution
2 F_A<−c ()
3 f or ( i in 1: n)
4 {
5 z<−( log (x [ i ]−xo )−mu) /sigma
6 fz <− 1/ ( sqrt (2 ∗ pi ) ) ∗exp( −0.5∗z ^2)
7 w <− 1. /(1+0.33267∗abs ( z ) )
8 F_A[ i ]<−1−fz ∗ (0.4361836 ∗w−0.1201676∗w∗∗2+0.937280∗w∗∗ 3)
9 i f ( z<0){
10 F_A[ i ]<−1−F_A[ i ]
11 }
12 }
13 F_A
[1] 0.01629376 0.02037232 0.06335211 0.19114418 0.19387792 0.24184177
[7] 0.25003546 0.27446035 0.31308922 0.32354610 0.37426083 0.40448191
[13] 0.46876900 0.50900526 0.54620254 0.55166365 0.55166365 0.59620549
[19] 0.62798899 0.63094134 0.64036091 0.70221669 0.74950822 0.76331959
[25] 0.79606151 0.85227513 0.90296489 0.96150490 0.99354272
1 plot (x , F_A, type=" l " , pch=20, col=" red " , l t y =2, xlab="" ,
2 ylab="Cumulative probability " , main="" )
3 l i n e s (x , P_E, pch=18, col=" blue " , type="b" , l t y =1)
4 legend ( ’ bottomright ’ , legend=c ( ’Log−Normal3P Distribution ’ , ’ Empirical
Distribution ’ ) ,
5 l t y =1:2 , col=c ( ’ red ’ , ’ blue ’ ) , cex =0.8 , text . font =4)
6 grid ()
HIDROLOGÍA GENERAL
12. CAPÍTULO 2. 2.1. DISTRIBUCIÓN LOG-NORMAL DE 3 PARÁMETROS 11
500 1000 1500 2000 2500 3000 3500
0.00.20.40.60.81.0
Cumulativeprobability
Log−Normal3P Distributión
Empirical Distribution
5 Prueba de bondad usando el método Kolmogorov-Smirnov
1 # Kolmogorov−Smirnov Test
2 dFP<−abs (P_E−F_A)
3 dFP<−sort (dFP, decreasing = TRUE) ;dFP
4 delta<−dFP [ 1 ] ; delta
5 # Theoretical delta
6 i f (n<35){
7 deltao<−0.000003848186 ∗n∗∗4 −0.00033109622∗n∗∗3+0.010220554∗n∗∗
2 −0.141035449935∗n+1.07518805168
8
9 } e l s e { deltao<−1.36 / sqrt (n)
10
11 }; deltao
12 data . frame ( delta , deltao )
delta deltao
1 0.05963909 0.2272891
1 i f ( deltao>delta ) {
2 print ( "The LOG−NORMAL3P d i s t r i b u t i o n f i t the curve " )
3 } e l s e { print ( "LOG−NORMAL3P d i s t r i b u t i o n doesn ’ t f i t the curve " )
4 }
[1] "The LOG-NORMAL3P distribution fit the curve"
HIDROLOGÍA GENERAL
13. CAPÍTULO 2. 2.2. DISTRIBUCIÓN GAMMA 2 PARÁMETROS 12
2.2. DISTRIBUCIÓN GAMMA 2 PARÁMETROS
2.2.1. Función densidad
La función densidad, de la distribución Gamma 2 parámetros es:
f(x) =
xγ−1
e− x
β
βγΓ (γ)
(2.8)
para:
0 ≤ x < ∞
0 < γ < ∞
0 < β < ∞
donde:
γ : Parámetro de forma (+)
β : Parámetro de escala (+)
Γ(γ) : Función gamma completa.
2.2.2. Función Acumulada
F(x) =
x
0
xγ−1
e− x
β
βγΓ (γ)
dx (2.9)
La variable aleatoria reducida gamma de 2 parámetros, está dad por: y = x
β
la cual reduce
la función acumulada a:
G(y) =
y
0
yγ−1
e−y
Γ (γ)
dy (2.10)
La solución a la ecuación de la función acumulada Gamma, se puede obtener por el desarrollo
de la serie:
G (y) =
e−y
Γ (y)
yγ
γ
+
yγ+1
γ (γ + 1)
+ ... +
yγ+n+1
γ (γ + 1) ... (γ + n + 1)
(2.11)
2.2.3. Estimación de parámetros, método de Máxima Verisimilitud
Los prámetros de la distribución Gamma 2 parámetros, estimados por el método de
máxima verisimilitud son:
Parámetro de forma
El parámetro de forma se puede calcular por la siguiente relación aproximada de Green-
wood y Durand(1960):
para: 0 ≤ y ≤ 0,5772
γ =
0,5000876 + 0,1648852y − 0,0544274y2
y
(2.12)
y para: 0,5772 < y ≤ 17,0
γ =
8,898919 + 9,05995y + 0,9775373y2
y(17,79728 + 11,968477y + y2)
(2.13)
donde:
y = lnx − lnx
HIDROLOGÍA GENERAL
14. CAPÍTULO 2. 2.2. DISTRIBUCIÓN GAMMA 2 PARÁMETROS 13
Parámetro de escala
β =
X
γ
(2.14)
Procedimiento para el cálculo y aplicación en R
1 Los pasos para el cálculo y el gráfico de la distribución de probabilidad empírica son
explicados anteriormente en la distribución Log-Normal 3P, usando los mismos datos.
2 Para el cálculo de los parámetros de la distribución Gamma2P se usarán las ecuaciones
2.12, 2.13 y 2.14
1
2 ### Parameters c a l c u l a t i o n .
3 # Parameters c a l c u l a t i o n by of maximum l i k e l i h o o d method .
4
5 YP<−log (mean(x) , exp (1) )−mean( log (x , exp (1) ) )
6 # Form parameter (+) :
7 i f (0<=YP | | YP<=0.5772)
8 gam<−(0.5000876+0.1648852 ∗YP−0.0544274∗YP∗∗ 2) /YP
9 i f (0.5772 <YP | | YP<=17)
10 gam<−(8.898919+9.05995 ∗YP+0.9775373∗YP∗∗ 2) / (YP∗ (17.79728+11.968477 ∗YP+
YP∗∗ 2) )
11 # Scale parameter (+) :
12 Beta<−mean(x) /gam
13 data . frame (gam, Beta )
gam Beta
1 3.432879 278.9455
3 La función de distribución acumulada de la distribución Gamma2P, si se cumple con
la condición: β > 0
1 ### Accumulated Distribution :
2 DNMR<−c (gam)
3 Lga<−gam∗ (gam+1)
4 f or ( i in 1 : ( n−1))
5 {
6 DNMR[ i +1]<−Lga
7 Lga=Lga∗ (gam+i +1)
8 }
9 Gy<−c ()
10 LY<−x/Beta
11 f or ( i in 1: n)
12 {
13 NMDR<−c ()
14 f or ( j in 0 : ( n−1))
15 {NMDR[ j +1]<−LY[ i ] ∗∗ (gam+j ) }
16 Gy[ i ]<−exp(−LY[ i ] ) ∗sum(NMDR/DNMR) /gamma(gam)
17 };Gy
[1] 0.08577258 0.08997629 0.12321476 0.20093495 0.20257440
[6] 0.23179129 0.23688890 0.25231196 0.27749971 0.28450614
[11] 0.31977970 0.34192782 0.39226960 0.42627395 0.45967330
[16] 0.46474612 0.46474612 0.50784752 0.54059829 0.54372960
[21] 0.55382441 0.62424380 0.68321489 0.70130930 0.74576767
[26] 0.82670686 0.90219894 0.97951670 0.99971924
HIDROLOGÍA GENERAL
15. CAPÍTULO 2. 2.2. DISTRIBUCIÓN GAMMA 2 PARÁMETROS 14
1 plot (x , Gy, type=" l " , pch=20, col=" red " , l t y =2, xlab="" ,
2 ylab="Cumulative probability " , main="" )
3 l i n e s (x , P_E, pch=18, col=" blue " , type="b" , l t y =1)
4 legend ( ’ bottomright ’ , legend=c ( ’Gamma2P Distribution ’ , ’ Empirical
Distribution ’ ) ,
5 l t y =1:2 , col=c ( ’ red ’ , ’ blue ’ ) , cex =0.8 , text . font =4)
6 grid ()
500 1000 1500 2000 2500 3000 3500
0.20.40.60.81.0
Cumulativeprobability
Gamma2P Distributión
Empirical Distribution
4 Prueba de bondad usando el método Kolmogorov-Smirnov
1 # Kolmogorov−Smirnov t e s t
2 dFP<−abs (P_E−Gy)
3 dFP<−sort (dFP, decreasing = TRUE) ;dFP
4 delta<−dFP [ 1 ] ; delta
5 # Theoretical delta
6 i f (n<35){
7 deltao<−0.000003848186 ∗n∗∗4 −0.00033109622∗n∗∗3+0.010220554∗n∗∗
2 −0.141035449935∗n+1.07518805168
8
9 } e l s e { deltao<−1.36 / sqrt (n)
10
11 }; deltao
12 data . frame ( delta , deltao )
delta deltao
1 0.1461756 0.2272891
1 i f ( deltao>delta ) {
2 print ( "GAMMA2P d i s t r i b u t i o n f i t the curve " )
3 } e l s e { print ( "GAMMA2P d i s t r i b u t i o n doesn ’ t f i t the curve " )
4 }
[1] "GAMMA2P distribution fit the curve"
HIDROLOGÍA GENERAL
16. CAPÍTULO 2. 2.3. DISTRIBUCIÓN GAMMA 3 PARÁMETROS 15
2.3. DISTRIBUCIÓN GAMMA 3 PARÁMETROS
2.3.1. Función densidad
La función densidad, de la distribución Gamma 3 parámetros es:
f(x) =
(x − xo)γ−1
e−x−xo
β
βγΓ (γ)
(2.15)
para:
xo ≤ x < ∞
−∞ < xo < ∞
0 < γ < ∞
0 < β < ∞
donde:
xo : parámetro de posición, origen de la variable x
γ : Parámetro de forma (+)
β : Parámetro de escala (+)
Γ(γ) : Función gamma completa.
2.3.2. Función Acumulada
F(x) =
x
xo
(x − xo)γ−1
e−x−xo
β
βγΓ (γ)
dx (2.16)
La variable aleatoria reducida gamma de 2 parámetros, está dada por: y = x−xo
β
la cual
reduce la función acumulada a:
G(y) =
y
0
yγ−1
e−y
Γ (γ)
dy (2.17)
La solución a la ecuación de la función acumulada Gamma, se puede obtener por el desarrollo
de la serie:
G (y) =
e−y
Γ (y)
yγ
γ
+
yγ+1
γ (γ + 1)
+ ... +
yγ+n+1
γ (γ + 1) ... (γ + n + 1)
(2.18)
2.3.3. Estimación de parámetros, método de momentos
Aplicando el método de momentos se obtienen las siguientes ecuaciones:
γ =
4
C2
s
(2.19)
β =
CsS
2
(2.20)
xo = X −
2S
Cs
(2.21)
donde:
Cs = g = N2M3
(N−1)(N−2)S3
M3 =
(xi−X)3
N
M3 =
(xi−X)2
N−1
X =
xi
N
HIDROLOGÍA GENERAL
17. CAPÍTULO 2. 2.3. DISTRIBUCIÓN GAMMA 3 PARÁMETROS 16
Procedimiento para el cálculo y aplicación en R
1 Los pasos para el cálculo y el gráfico de la distribución de probabilidad empírica son
explicados anteriormente en la distribución Log-Normal 3P, usando los mismos datos.
2 Para el cálculo de los parámetros de la distribución Gamma3P se usarán las ecuaciones
2.19, 2.20 y 2.21
1 ############### Parameter c a l c u l a t i o n ################
2 #Method of Moments :
3 YP<−log (mean(x) , exp (1) )−mean( log (x , exp (1) ) )
4
5 # Bias to c a l c u l a t i n g the position parameter
6 CSG<−n∗sum(( x−mean(x) ) ∗∗ 3) / (( n−1)∗ (n−2)∗sd (x) ∗∗ 3)
7
8 # Position parameter (+) :
9 Xo<−mean(x)−2∗sd (x) /CSG
10
11 # Form parameter (+) :
12 gam<−4/CSG∗∗2
13
14 # Scale Parameter (+) :
15 Beta<−CSG∗sd (x) /2
16 data . frame (Xo, gam, Beta )
Xo gam Beta
1 498.4895 0.452186 1015.283
3 La función de distribución acumulada de la distribución Gamma3P, si se cumple con
la condición: β > 0
1 ### Accumulated Distribution :
2 DNMR<−c (gam)
3 Lga<−gam∗ (gam+1)
4 f or ( i in 1 : ( n−1))
5 {
6 DNMR[ i +1]<−Lga
7 Lga=Lga∗ (gam+i +1)
8 }
9 Gy<−c ()
10 LY<−x/Beta
11 f or ( i in 1: n)
12 {
13 NMDR<−c ()
14 f or ( j in 0 : ( n−1))
15 {NMDR[ j +1]<−LY[ i ] ∗∗ (gam+j ) }
16 Gy[ i ]<−exp(−LY[ i ] ) ∗sum(NMDR/DNMR) /gamma(gam)
17 };Gy
[1] NaN NaN NaN 0.1963155 0.2042440 0.3052061
[7] 0.3184041 0.3539636 0.4021123 0.4139251 0.4661149 0.4942094
[13] 0.5490640 0.5810193 0.6095052 0.6136216 0.6136216 0.6467346
[19] 0.6700193 0.6721739 0.6790426 0.7241820 0.7592202 0.7696310
[25] 0.7947864 0.8402646 0.8853763 0.9471425 0.9908901
HIDROLOGÍA GENERAL
18. CAPÍTULO 2. 2.3. DISTRIBUCIÓN GAMMA 3 PARÁMETROS 17
1 plot (x , Gy, type=" l " , pch=20, col=" red " , l t y =2, xlab="" ,
2 ylab="Cumulative probability " , main="" )
3 l i n e s (x , P_E, pch=18, col=" blue " , type="b" , l t y =1)
4 legend ( ’ bottomright ’ , legend=c ( ’Gamma3P Distribution ’ , ’ Empirical
Distribution ’ ) ,
5 l t y =1:2 , col=c ( ’ red ’ , ’ blue ’ ) , cex =0.8 , text . font =4)
6 grid ()
500 1000 1500 2000 2500 3000 3500
0.20.40.60.81.0
Cumulativeprobability
Gamma3P Distribution
Empirical Distribution
4 Prueba de bondad usando el método Kolmogorov-Smirnov
1 # Kolmogorov−Smirnov t e s t
2 dFP<−abs (P_E−Gy)
3 dFP<−sort (dFP, decreasing = TRUE) ;dFP
4 delta<−dFP [ 1 ] ; delta
5 # Theoretical delta
6 i f (n<35){
7 deltao<−0.000003848186 ∗n∗∗4 −0.00033109622∗n∗∗3+0.010220554∗n∗∗
2 −0.141035449935∗n+1.07518805168
8
9 } e l s e { deltao<−1.36 / sqrt (n)
10
11 }; deltao
12 data . frame ( delta , deltao )
delta deltao
1 0.1157306 0.2272891
1 i f ( deltao>delta ) {
2 print ( "GAMMA3P d i s t r i b u t i o n f i t the curve " )
3 } e l s e { print ( "GAMMA3P d i s t r i b u t i o n doesn ’ t f i t the curve " )
4 }
[1] "GAMMA3P distribution fit the curve"
HIDROLOGÍA GENERAL
19. CAPÍTULO 2. 2.4. DISTRIBUCIÓN LOG-PEARSON TIPO III 18
2.4. DISTRIBUCIÓN LOG-PEARSON TIPO III
2.4.1. Función densidad
La función densidad, de la distribución Log-Pearson tipo III es:
f(x) =
(lnx − xo)γ−1
e−lnx−xo
β
xβγΓ (γ)
(2.22)
para:
xo ≤ x < ∞
−∞ < xo < ∞
0 < γ < ∞
0 < β < ∞
donde:
xo : parámetro de posición, origen de la variable x
γ : Parámetro de forma (+)
β : Parámetro de escala (+)
Γ(γ) : Función gamma completa.
2.4.2. Función Acumulada
F(x) =
x
xo
(x − xo)γ−1
e−x−xo
β
βγΓ (γ)
dx (2.23)
La variable aleatoria reducida Log-Pearson T3, está dada por: y = lnx−xo
β
la cual reduce la
función acumulada a:
G(y) =
y
0
yγ−1
e−y
Γ (γ)
dy (2.24)
La solución a la ecuación de la función acumulada, se puede obtener por el desarrollo de la
serie:
G (y) =
e−y
Γ (y)
yγ
γ
+
yγ+1
γ (γ + 1)
+ ... +
yγ+n+1
γ (γ + 1) ... (γ + n + 1)
(2.25)
2.4.3. Estimación de parámetros, método de momentos
Aplicando el método de momentos se obtienen las siguientes ecuaciones:
γ =
4
C2
Slnx
(2.26)
β =
CSlnx ∗ Slnx
2
(2.27)
xo = Xlnx −
2Slnx
CSlnx
(2.28)
donde:
CSlnx =
N (lnxi−Xlnx)3
(N−1)(N−2)S3
lnx
Slnx =
(lnxi−Xlnx)2
N−1
Xlnx =
lnxi
N
HIDROLOGÍA GENERAL
20. CAPÍTULO 2. 2.4. DISTRIBUCIÓN LOG-PEARSON TIPO III 19
Procedimiento para el cálculo y aplicación en R
1 Los pasos para el cálculo y el gráfico de la distribución de probabilidad empírica son
explicados anteriormente en la distribución Log-Normal 3P, usando los mismos datos.
2 Para el cálculo de los parámetros de la distribución Log-Pearson tipo III se usarán las
ecuaciones 2.26, 2.27 y 2.28
1 ############### Parameter c a l c u l a t i o n ################
2 #Method of Moments :
3
4 # Bias to c a l c u l a t i n g the position parameter
5 CSG<−n∗sum(( log (x , exp (1) )−mean( log (x , exp (1) ) ) ) ∗∗ 3) / (( n−1)∗ (n−2)∗sd ( log (x ,
exp (1) ) ) ∗∗ 3)
6
7 # Position parameter (+) :
8 Xo<−mean( log (x , exp (1) ) )−2∗sd ( log (x , exp (1) ) ) /CSG
9
10 # Form parameter (+) :
11 gam<−4/CSG∗∗2
12
13 # Scale Parameter (+) :
14 Beta<−CSG∗sd ( log (x , exp (1) ) ) /2
15 data . frame (Xo, gam, Beta )
Xo gam Beta
1 5.634817 4.314336 0.2495894
3 La función de distribución acumulada de la distribución Log-Pearson tipo III, si se
cumple con la condición: β > 0
1 ### Cumulative Distribution :
2 DNMR<−c (gam)
3 Lga<−gam∗ (gam+1)
4 f or ( i in 1 : ( n−1))
5 {
6 DNMR[ i +1]<−Lga
7 Lga=Lga∗ (gam+i +1)
8 }
9 Gy<−c ()
10 LY<−( log (x , exp (1) )−Xo) /Beta ;LY
11 f or ( i in 1: n)
12 {
13 NMDR<−c ()
14 f or ( j in 0 : ( n−1))
15 {NMDR[ j +1]<−LY[ i ] ∗∗ (gam+j ) }
16 i f (xo>0){Gy[ i ]<−( exp(−LY[ i ] ) ∗sum(NMDR/DNMR) /gamma(gam) ) }
17 };Gy
[1] 0.01182794 0.01531047 0.05561809 0.18799983 0.19090283
[6] 0.24196779 0.25070361 0.27674124 0.31785714 0.32896379
[11] 0.38261916 0.41438445 0.48129624 0.52262241 0.56045487
[16] 0.56597704 0.56597704 0.61068942 0.64222278 0.64513567
[21] 0.65441066 0.71460003 0.75977243 0.77282873 0.80354416
[26] 0.85557916 0.90199601 0.95622752 0.98930592
HIDROLOGÍA GENERAL
21. CAPÍTULO 2. 2.4. DISTRIBUCIÓN LOG-PEARSON TIPO III 20
1 plot (x , Gy, type=" l " , pch=20, col=" red " , l t y =2, xlab="" ,
2 ylab="Cumulative probability " , main="" )
3 l i n e s (x , P_E, pch=18, col=" blue " , type="b" , l t y =1)
4 legend ( ’ bottomright ’ , legend=c ( ’Log−Pearson I I I Distribution ’ , ’ Empirical
Distribution ’ ) ,
5 l t y =1:2 , col=c ( ’ red ’ , ’ blue ’ ) , cex =0.8 , text . font =4)
6 grid ()
500 1000 1500 2000 2500 3000 3500
0.00.20.40.60.81.0
Cumulativeprobability
Log−Pearson III Distribution
Empirical Distribution
4 Prueba de bondad usando el método Kolmogorov-Smirnov
1 # Kolmogorov−Smirnov t e s t
2 dFP<−abs (P_E−Gy)
3 dFP<−sort (dFP, decreasing = TRUE) ;dFP
4 delta<−dFP [ 1 ] ; delta
5 # Theoretical delta
6 i f (n<35){
7 deltao<−0.000003848186 ∗n∗∗4 −0.00033109622∗n∗∗3+0.010220554∗n∗∗
2 −0.141035449935∗n+1.07518805168
8
9 } e l s e { deltao<−1.36 / sqrt (n)
10
11 }; deltao
12 data . frame ( delta , deltao )
delta deltao
1 0.06045487 0.2272891
1 i f ( deltao>delta ) {
2 print ( "LOG−PEARSON I I I d i s t r i b u t i o n f i t the curve " )
3 } e l s e { print ( "LOG−PEARSON I I I d i s t r i b u t i o n doesn ’ t f i t the curve " )
4
5 }
[1] "LOG-PEARSON III distribution fit the curve"
HIDROLOGÍA GENERAL
22. CAPÍTULO 2. 2.5. DISTRIBUCIÓN GUMBEL 21
2.5. DISTRIBUCIÓN GUMBEL
2.5.1. Función acumulada
La función de distribución acumulada de la distribución Gumbel tiene la forma:
F(x) = e−e−
x−µ
α
(2.29)
para:
−∞ < x < ∞
donde:
0 < α < ∞ , es el parámetro de escala
−∞ < µ < ∞ , es el parámetro de posición
2.5.2. Función densidad
f(x) =
dF(x)
dx
(2.30)
f(x) =
1
α
e−x−µ
α
−e−
x−µ
α
(2.31)
para:
−∞ < x < ∞ La variable aleatoria reducida Gumbel, se define como:
y =
x − µ
α
(2.32)
y la función acumulada reducida Gumbel, es:
G(y) = e−e−y
(2.33)
2.5.3. Estimación de parámetros, método de momentos
Aplicando el método de momentos se obtienen las siguientes ecuaciones:
α =
√
6
π
S (2.34)
µ = X − 0,57721α (2.35)
Procedimiento para el cálculo y aplicación en R
1 Los pasos para el cálculo y el gráfico de la distribución de probabilidad empírica son
explicados anteriormente en la distribución Log-Normal 3P, usando los mismos datos.
2 Para el cálculo de los parámetros de la distribución Gumbel se usarán las ecuaciones
2.34 y 2.35
1 ### Parameter c a l c u l a t i o n :
2 #Method of Moments :
3 alph<−sqrt (6) ∗sd (x) / pi
4 mu<−mean(x) −0.57721∗ alph
5 data . frame ( alph ,mu)
HIDROLOGÍA GENERAL
23. CAPÍTULO 2. 2.5. DISTRIBUCIÓN GUMBEL 22
alph mu
1 532.3182 650.3268
3 La función de distribución acumulada de la distribución Gumbel:
1 ### Cumulative Distribution :
2 F_GM<−c ()
3 f or ( i in 1: n)
4 {
5 F_GM[ i ]<−exp(−exp(−(x [ i ]−mu) / alph ) )
6 }; F_GM
[1] 0.1781196 0.1821799 0.2128442 0.2787604 0.2800990 0.3037260
[7] 0.3078098 0.3201080 0.3400372 0.3455527 0.3731821 0.3904456
[13] 0.4295716 0.4559947 0.4820061 0.4859649 0.4859649 0.5197224
[19] 0.5455585 0.5480389 0.5560486 0.6125948 0.6611179 0.6762813
[25] 0.7142185 0.7866254 0.8606599 0.9542600 0.9973101
1 plot (x , F_GM, type=" l " , pch=20, col=" red " , l t y =2, xlab="" ,
2 ylab="Cumulative probability " , main="" )
3 l i n e s (x , P_E, pch=18, col=" blue " , type="b" , l t y =1)
4 legend ( ’ bottomright ’ , legend=c ( ’Gumbel Distribution ’ , ’ Empirical
Distribution ’ ) ,
5 l t y =1:2 , col=c ( ’ red ’ , ’ blue ’ ) , cex =0.8 , text . font =4)
6 grid ()
500 1000 1500 2000 2500 3000 3500
0.20.40.60.81.0
Cumulativeprobability
Gumbel Distribution
Empirical Distribution
4 Cálculo de probabilidades y cuantiles
1 Tr<−c (2 ,5 ,10 ,15 ,20 ,25 ,50 ,100 ,200 ,250 ,500 ,1000) # Periodos de retorno
2 p<−1−1/Tr ; p
[1] 0.5000000 0.8000000 0.9000000 0.9333333 0.9500000 0.9600000
[7] 0.9800000 0.9900000 0.9950000 0.9960000 0.9980000 0.9990000
HIDROLOGÍA GENERAL
24. CAPÍTULO 2. 2.5. DISTRIBUCIÓN GUMBEL 23
1 Q<− mu−log ((− log (p , exp (1) ) ) , exp (1) ) ∗ alph
2 data . frame (Tr , p ,Q)
Tr p Q
1 2 0.5000000 845.4283
2 5 0.8000000 1448.7722
3 10 0.9000000 1848.2384
4 15 0.9333333 2073.6138
5 20 0.9500000 2231.4159
6 25 0.9600000 2352.9649
7 50 0.9800000 2727.3999
8 100 0.9900000 3099.0701
9 200 0.9950000 3469.3842
10 250 0.9960000 3588.4347
11 500 0.9980000 3957.9433
12 1000 0.9990000 4327.1846
1 plot (Tr ,Q, pch=20, col="#000099" , bg="#FF6666" , type="b" , l t y=1 ,
2 ylab = " Quantile " , xlab = "Return period ( years ) " ,
3 main = " Quantile vs Return period " )
4 grid ()
0 200 400 600 800 1000
1000150020002500300035004000
Quantile vs Return period
Return period (years)
Quantile
5 Prueba de bondad usando el método Kolmogorov-Smirnov
1 # Kolmogorv−Smirnov Test
2 dFP<−abs (P_E−F_GM)
3 dFP<−sort (dFP, decreasing = TRUE) ;dFP
4 delta<−dFP [ 1 ] ; delta
5 # Theoretical delta
6 i f (n<35){
7 deltao<−0.000003848186 ∗n∗∗4 −0.00033109622∗n∗∗3+0.010220554∗n∗∗
2 −0.141035449935∗n+1.07518805168
8
HIDROLOGÍA GENERAL
25. CAPÍTULO 2. 2.6. DISTRIBUCIÓN LOG-GUMBEL 24
9 } e l s e { deltao<−1.36 / sqrt (n)
10
11 }
12 data . frame ( delta , deltao )
delta deltao
1 0.1454271 0.2272891
1 i f ( deltao>delta ) {
2 print ( "GUMBEL d i s t r i b u t i o n f i t the curve " )
3 } e l s e { print ( "GUMBEL d i s t r i b u t i o n doesn ’ t f i t the curve " )
4 }
[1] "GUMBEL distribution fit the curve"
2.6. DISTRIBUCIÓN LOG-GUMBEL
2.6.1. Función acumulada
La función de distribución acumulada de la distribución Gumbel tiene la forma:
F(x) = e−e−
lnx−µ
α
(2.36)
para:
−∞ < x < ∞
donde:
0 < α < ∞ , es el parámetro de escala
−∞ < µ < ∞ , es el parámetro de posición
2.6.2. Función densidad
f(x) =
dF(x)
dx
(2.37)
f(x) =
1
α
e−lnx−µ
α
−e−
lnx−µ
α
(2.38)
para:
0 < x < ∞ La variable aleatoria reducida Gumbel, se define como:
y =
lnx − µ
α
(2.39)
y la función acumulada reducida Gumbel, es:
G(y) = e−e−y
(2.40)
2.6.3. Estimación de parámetros, método de momentos
Aplicando el método de momentos se obtienen las siguientes ecuaciones:
α =
√
6
π
Slnx (2.41)
µ = Xlnx − 0,57721α (2.42)
HIDROLOGÍA GENERAL
26. CAPÍTULO 2. 2.6. DISTRIBUCIÓN LOG-GUMBEL 25
Procedimiento para el cálculo y aplicación en R
1 Los pasos para el cálculo y el gráfico de la distribución de probabilidad empírica son
explicados anteriormente en la distribución Log-Normal 3P, usando los mismos datos.
2 Para el cálculo de los parámetros de la distribución Gumbel se usarán las ecuaciones
2.41 y 2.42
1 ### Parameter c a l c u l a t i o n :
2 # Method of Moments :
3 alph<−sqrt (6) ∗sd ( log (x , exp (1) ) ) / pi
4 mu<−mean( log (x , exp (1) ) ) −0.57721∗ alph
5 data . frame ( alph , mu)
alph mu
1 0.4042117 6.478314
3 La función de distribución acumulada de la distribución Gumbel:
1 # Cumulative probability :
2 F_GM<−c ()
3 f or ( i in 1: n)
4 {
5 F_GM[ i ]<−exp(−exp(−( log (x [ i ] , exp (1) )−mu) / alph ) )
6 }; F_GM
[1] 0.01319426 0.01613748 0.05024631 0.17506832 0.17797572
[6] 0.22990750 0.23892085 0.26596560 0.30911624 0.32084505
[11] 0.37778997 0.41162871 0.48288870 0.52670972 0.56658771
[16] 0.57238471 0.57238471 0.61905731 0.65165000 0.65464575
[21] 0.66416677 0.72524364 0.77019059 0.78302710 0.81293927
[26] 0.86267308 0.90606701 0.95601009 0.98736764
1 plot (x , F_GM, type=" l " , pch=20, col=" red " , l t y =2, xlab="" ,
2 ylab="Cumulative probability " , main="" )
3 l i n e s (x , P_E, pch=18, col=" blue " , type="b" , l t y =1)
4 legend ( ’ bottomright ’ , legend=c ( ’Log−Gumbel Distribution ’ , ’ Empirical
Distribution ’ ) ,
5 l t y =1:2 , col=c ( ’ red ’ , ’ blue ’ ) , cex =0.8 , text . font =4)
6 grid ()
HIDROLOGÍA GENERAL
28. CAPÍTULO 2. 2.6. DISTRIBUCIÓN LOG-GUMBEL 27
0 200 400 600 800 1000
200040006000800010000
Quantile vs Return period
Return period (years)
Quantile
5 Prueba de bondad usando el método Kolmogorov-Smirnov
1 # Kolmogorv−Smirnov Test
2 dFP<−abs (P_E−F_GM)
3 dFP<−sort (dFP, decreasing = TRUE) ;dFP
4 deltat<−dFP [ 1 ]
5
6 # Theoretical delta
7 i f (n<35){
8 deltao<−0.000003848186 ∗n∗∗4 −0.00033109622∗n∗∗3+0.010220554∗n∗∗
2 −0.141035449935∗n+1.07518805168
9
10 } e l s e { deltao<−1.36 / sqrt (n)
11 }
12 data . frame ( deltat , deltao )
deltat deltao
1 0.06658771 0.2272891
1 i f ( deltao>deltat ) {
2 print ( "LOG−GUMBEL d i s t r i b u t i o n f i t the curve " )
3 } e l s e { print ( "LOG−GUMBEL d i s t r i b u t i o n doesn ’ t f i t the curve " )
4 }
[1] "LOG-GUMBEL distribution fit the curve"
HIDROLOGÍA GENERAL
29. 2. CAPÍTULO 2. DISTRIBUCIONES DE PROBABILIDAD 28
Conclusiones
• Las distribuciones estadísticas que más se ajustaron a la serie fueron: Log-Normal
3 Parámetros, Log-Pearson tipo III y la distribución Log-Gumbel con con diferencias
máximas entre la probabilidad de ajuste y la probabilidad empírica de 0.05964, 0.06045
y 0.06658 respectivamente.
• El caudal de diseño para un periodo de retorno de 50 años es, según a la distribución
Gumbel de 2727.3999 m3
/s y según a la distribución log-Gumbel es de 3151.1524 m3
/s
, por lo tanto se concluye que es más creible a la distribución log-Gumbel, por el mismo
hecho de que se ajusta más a la serie.
• La función de distribución de probabilidad Gamma 2 parámetros, presenta la calidad
más baja de los ajustes, pudiendo concluirse que esta función no es la recomendable,
para estimar el comportamiento de los caudales máximos de los datos que se analizan
en el trabajo.
30. 2. BIBLIOGRAFÍA 29
Bibliografía
[1] Máximo Villón Béjar, Hidrología Estadística, segunda edición, MaxSoft, Lima -
Perú, 2002.
[2] Christian Pérez Toro, APLICACIÓN DE MÉTODOS NUMÉRICOS PARA LA
ESTIMACIÓN DE LOS PARÁMETROS DE LA DISTRIBUCIÓN LOG NORMAL
3P MEDIANTE EL MËTODO DE MÁXIMA VERISIMILITUD,Fecha de consulta:
11 de julio de 2016 , URL: http://es.slideshare.net/ChristianPrezToro/parmetros-log-
normal3p