El documento describe diferentes métodos estadísticos para el tratamiento de datos hidrológicos, incluyendo medidas de tendencia central, dispersión y correlación. Explica el cálculo de la media, mediana, moda, varianza, desviación estándar, coeficiente de correlación, y modelo de regresión lineal simple para relacionar variables hidrológicas e identificar patrones. El objetivo es obtener información útil de los datos recolectados para aplicaciones prácticas en hidrología.
REGLAMENTO DEL APRENDIZ SERVICIO NACIONAL DE APRENDIZAJE SENA.pdf
Hidro informe
1. INFORME N° 02 “TRATAMIENTO DE DATOS”
I. MARCO TEORICO
1.1. DATOS GENERALES
En el campo de la investigación científica es común la inquietud por
intentar expresar la evolución de un determinado fenómeno mediante una
serie de medidas, que la introduzcan al lenguaje de los números.
Al transcurrir el tiempo, el investigador tropieza con la dificultad de
encontrase en posesión de una gran cantidad de datos que, perdida su
actualidad, serán de muy poco provecho si no son sometidos a un
tratamiento adecuado.
La estadística se constituye entonces en una herramienta indispensable
para efectuar este tratamiento, a fin de obtener la máxima utilidad en las
aplicaciones prácticas a partir de los registros de diverso tipo de que se
dispone (en especial caudales y precipitaciones).
Son numerosas las definiciones de estadística, no correspondiendo aquí
presentar su nómina ni elegir una que resulte idónea. Si en cambio,
conviene distinguir dos ramas que han evolucionado en forma separada:
a. Estadística Descriptiva:
Es la que intenta obtener toda la información posible de los datos
recogidos, mediante su adecuado ordenamiento. Son producto de ella
las clasificaciones de datos en forma de tablas, procesamiento y archivo
programas de computación.
b. Estadística Matemática:
Pretende ir más lejos, basándose en comparaciones del fenómeno con
modelos probabilísticos teóricos, a fin de obtener una información que
no resulta evidente con el simple ordenamiento de los datos. En este
campo se ha desarrollado una teoría matemática, a veces muy
compleja, basada en la teoría de probabilidades, de la que la Estadística
matemática puede considerarse como una aplicación práctica.
Estos dos conceptos son de importante aplicación en el campo de la
hidrología, sobre todo la de superficie, por corresponder a ella los ciclos
más rápidos de circulación del agua.
[Estadística aplicada a la hidrología. Autor: Ing. Carlos D. SEGERER e Ing.
Rubén VILLODAS]
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 1
2. INFORME N° 02 “TRATAMIENTO DE DATOS”
1.2. MEDIDAS DE DISTRIBUCIONES
Para describir ciertas características de un conjunto de datos, se pueden
usar números simples, llamados estadísticos, De ellos se puede obtener un
conocimiento más preciso de los datos, que el que se obtiene a partir de las
tablas y gráficas.
1.2.1. MEDIDA DE TENDENCIA CENTRAL
Se define una medida de tendencia central, como un índice de localización
central empleado en la descripción de las distribuciones de frecuencias.
En términos generales se tiene tres medidas: la μmedia, la mediana, y la
moda.
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 94]
1.2.1.1. LA MEDIA ARITMETICA:
Dada la muestra compuesta de n datos: X1, X2, X3,…Xn; la media se define
como la suma algebraica de ellas, dividida entre el número de datos.
Cuando se calcula la media para una población, esta se denota por μ. Y
cuando se trata de una muestra por x .
x
1 2 1 ...
n
x x
x
n
x
n
i
i
n
Dónde:
x : Media muestral.
Xi: valor i-ésimo de la muestra.
n: número de datos de la muestra o población.
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 95]
1.2.1.2. LA MEDIANA:
Es un único valor de un conjunto de datos que mide al elemento central de
ellos. Este único elemento de los datos ordenados, es el más cercano a la
mitad, o el más central en el conjunto de números. La mitad de los
elementos quedan por encima de ese punto, y la otra mitad por debajo de
él.
Sean: X1, X2, X3,…Xn datos ordenados por magnitud creciente o
decreciente. La mediana es el dato situado en el centro, es decir:
( 1/ 2) n Med x
, para n impar.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 2
3. INFORME N° 02 “TRATAMIENTO DE DATOS”
n n x x
Med
( / 2) ( / 21)
2
, para n par.
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 98]
1.2.1.3. LA MODA:
Es aquel valor que se repite más frecuentemente en un conjunto de datos,
se denota por Mo.
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 100]
1.2.2. MEDIDAS DE DISPERSION
Las medidas de dispersión o variabilidad permiten observar cómo se
reparten o dispersan los datos a uno y otro lado del centro. Si la dispersión
es poca, indica gran uniformidad de los datos en la distribución. Por el
contrario, gran dispersión indica poca uniformidad.
1.2.2.1. RANGO:
Es una medida de distancia y representa la diferencia entre el mayor y el
menor de los valores observados, es decir:
max. min. R x x
. m ax x
: Valor máximo de los datos.
. min x
: Valor mínimo de los datos.
El rango o amplitud es una manera conveniente de escribir la dispersión,
sin embargo, no da medida alguna de la dispersión entre los datos con
respecto al valor central
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 102]
1.2.2.2. VARIANZA:
1.2.2.2.1. VARIANZA POBLACIONAL(σ2):
La varianza poblacional, se define como la suma de cuadrados de las
desviaciones de os datos con respecto a la media, dividida entre el número
total de datos, es decir:
2
i
n
x
n
i
1
2
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 102]
1.2.2.2.2. VARIANZA MUESTRAL (S2):
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 3
4. INFORME N° 02 “TRATAMIENTO DE DATOS”
Se obtiene dividiendo la suma de cuadrados de las observaciones de los
datos con respecto a la media, entre el número total de datos menos uno,
es decir:
x
x
1
n
1
2
2
i
n
S
i
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 103]
1.2.2.3. DESVIACION ESTANDAR(S):
La desviación estándar, se define como la raíz cuadrada positiva de la
varianza, es decir:
2
i
n
x
n
i
2
1
(Desviación estándar Poblacional).
x
x
1
n
1
2
2
i
S S
n
i
(Desviación estándar Muestral).
Generalmente en Hidrología se suele trabajar con información muestral
debido a que no se tiene información de toda la población.
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 103]
1.3. CORRELACIÓN Y REGRESIÓN
1.3.1. CORRELACION (r):
La correlación se define como la asociación entre dos o más variables.
1.3.1.1. COEFICIENTES DE CORRELACIÓN(r):
Es el estadístico que nos permite medir el grado de asociación de dos
variables linealmente asociadas. Para el caso de una muestra está dada por:
r xy
xy nx y
nS S
S
S S
x y x y
Dónde:
x x
i
n
S
n
i
x
1
2
y y
i
n
S
n
i
y
1
2
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 4
5. INFORME N° 02 “TRATAMIENTO DE DATOS”
n
i
1
n
x
x
n
i
1
n
y
y
Variación de valores de r: -1<r < 1; describen los varios grados de
asociación.
Si x e y son independientes: Sxy= 0, Luego r = 0
1.3.1.2. COEFICIENTE DE DETERMINACIÓN (r2):
Es la proporción o porcentaje, de la variación total de la variable
dependiente y, que es explicada o depende de la variable independiente x,
por lo cual, es un criterio para explicar la importancia de la variable
independiente dentro del modelo.
Además; 0 <r2< 1; de 0-100%.
1.3.2. REGRESIÓN:
1.3.2.1. REGRESION LINEAL SIMPLE:
En Hidrológica el modelo más simple y común, está basada en la suposición
de que dos variables se relacionan en forma lineal, como por ejemplo:
Caudales y precipitaciones de una misma cuenca
Precipitaciones de una estación, con precipitaciones de otra estación.
Caudal de una estación con caudal de otra estación.
Precipitación con la altitud de una cuenca
Este hecho, permite correlacionar estas variables para completar datos o
extender un registro.
Ecuación de regresión:
La ecuación general de la regresión lineal es: y a bx
Dónde:
x = Variable independiente, variable conocida.
y = Variable dependiente, variable que se trata de predecir.
a = Intercepto, punto donde la línea de regresión cruza el eje y, es decir
valor de y cuando x = 0.
b = Pendiente de la línea o coeficiente de regresión, es decir, es la cantidad
de cambio de y asociada a un cambio unitario de x.
Estimación de los parámetros:
Dada la ecuación de regresión lineal y a bx; donde a y b son los
parámetros de la ecuación. El método más utilizado para la estimación de
los parámetros a y b es el de mínimos cuadrados.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 5
6. INFORME N° 02 “TRATAMIENTO DE DATOS”
Por tanto los parámetros estarán dadas por las formulas:
2
y x
x y x
i i i i i
n x x
2 2
i i
a
n x y
x y
i i i i
n x x
2 2
b
y
i i
En los cálculos resulta más cómodo calcular b con la ecuación anterior para
b y luego calcula a como sigue:
a y bx
1.3.2.2. REGRESION NO LINEAL SIMPLE:
Existen varias relaciones no lineales, que con un artificio adecuado pueden
reducirse a relaciones lineales, dentro de las cuales se pueden mencionar:
Relaciones no
lineales
1 w a bx
a bx
y
1
y a bw
x
y a b
Linealizando
x y ab w a b x 1 1 w ln y
b y ax w a bz 1 w ln y
2 y ax bx w a bx
1.3.2.3. ANALISIS DE REGRESION:
Relaciones
lineales
Donde
1
y
w
1
x
w
z ln x
y
x
w
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 6
7. INFORME N° 02 “TRATAMIENTO DE DATOS”
Es una técnica determinística, que permite determinar la naturaleza de la
relación funcional entre dos o más variables, permite predecir los valores
de y = f(x) con un cierto grado de aproximación.
COMO REALIZAR EL ANALISIS DE REGRESION:
a) Seleccionar una función de relación correlativa, simple o múltiple, lineal o
no lineal
y
1
y bxa, a
bx y a b
1
, x
,
x ab y ,
bax y ,
2 bx ax y
b) Estimación de los dos parámetros que miden el grado de asociación
correlativa.(r2 , r)
c) Prueba de significación de los parámetros estadísticos que miden la
asociación correlativa, para lo cual se aplica la prueba "t".
Para ello se plantea la siguiente hipótesis:
H0: r = 0
Ha: r ≠ 0
( r es el coeficiente de correlación poblacional y su valor varía entre -1 y 1)
Calculo de t calculado (tc):
Se utiliza la ecuación:
2
r
r n
2 1
tc
Dónde:
r = Coeficiente de correlación.
n = Número de pares de valores.
Calculo de t tabular (tt):
El tt se obtiene de las tablas preparadas para este efecto, con un nivel de
significación α o una probabilidad de (1- α), y con un grado de libertad (ν =
n-2), donde n es el número de pares de valores.
Criterios de decisión:
Si c t t t
, se acepta la hipótesis nula, por lo que r = 0, y por lo tanto
no hay correlación significativa.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 7
8. INFORME N° 02 “TRATAMIENTO DE DATOS”
Si c t t t
, se rechaza la hipótesis nula por lo que r ≠ 0, indicándose
que es significativo y por lo tanto existe correlación entre las
variables.
Estimación de los parámetros de la ecuación o función de regresión. (a, b).
1.4. COMPLETACION Y EXTENSIÓN DE DATOS
La extensión de información, es el proceso de transferencia de información
desde una estación con "largo" registro histórico a otra con "corto"
registro.
La completación de datos, es el proceso por el cual, se llenan "huecos" que
existen en un registro de datos. La completación es un caso particular de la
extensión.
A. TECNICAS:
a. Las técnicas que se utilizan para la completación, en orden de prioridad
son:
Regresión lineal simple, entre estas:
Correlación cruzada entre dos o más estaciones
Auto-correlación.
Rellano con criterios prácticos.
b. Para la extensión se usan modelos de:
Regresión lineal simple.
Regresión lineal múltiple.
B. PROCESO:
El proceso a seguir para la completación y extensión, es como se indica:
1. Obtener la serie de tamaño N1, a completar o extender (y1 , y2 , …, yn)
2. Seleccionar la estación, guarde una buena relación con la estación con la que
se está trabajando, y cuya longitud de la serie sea mayor, como por ejemplo:
N= N1+N2
(x1, x2, ….xN1, xN1+1, xN1+ 2 …, xN1+N2)
3. Seleccionar un modelo de correlación, en este caso, la ecuación de
regresión lineal.
4. Estimación de los parámetros (a, b, r)
5. Ecuación de completación o extensión.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 8
9. INFORME N° 02 “TRATAMIENTO DE DATOS”
Esta dada por la ecuación:
y
x x
S
y y r
1( )
t
y
t
S
S
1
1( )
1
y
2
x x r S
y y r
1( )
1 .
1( )
t y t
y
t
S
1
1( )
1
Dónde:
- 1 1 y y x
= Son los estimados de las medias.
- ) ( 1) ( 1 , y x S S
= Varianza.
- r = Coeficiente de correlación
- t
= Variable aleatoria normal e independiente, con media
cero y varianza unitaria.
- = 0; Se usa en completación ( en este caso el ruido
aleatorio no es considerado)
- = 1; Se usa en extensión.( en este caso el ruido o factor
aleatorio si es considerado)
- ( , ) 1 2 f N N ; Corrige el sesgo en la varianza del proceso.
N N N
4 1
2 1 1
N 1 N 3 N
2
2 1 1
6. Criterios de confiabilidad.
Es verificar si estadísticamente está dentro de lo permitido; para esto se
procede de la siguiente forma:
a. Calculo del estadístico (tc):
Se utiliza la ecuación:
2
r
2
1
r N
1
tc
Dónde:
tc = Valor del estadístico t calculado.
r = Coeficiente de correlación.
N1 = Numero de pares de valores.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 9
10. INFORME N° 02 “TRATAMIENTO DE DATOS”
b. Calculo de tt :
El valor critico de t, se obtiene de las tablas t de Student (tt), con 95% de
probabilidad, o con un nivel de significación del 5%, es decir:
/
2
0 . 0251 N L G
.
2 c. Comparación de tc con el tt :
Si
t c t t
r no es significativo, por lo tanto no hay
correlación significativa.
Si
c t t t
r es significativa, por lo que sí existe correlación
significativa entre las variables yt y xt, y se pueden hacer uso
de la ecuación para la completación y extensión.
1.5. ANÁLISIS DE CONSISTENCIA
Cualquier cambio en la ubicación como en la exposición de un pluviómetro
puede conllevar un cambio relativo en la cantidad de lluvia captada por el
pluviómetro. El registro completo publicado representará condiciones
inexistentes. Un registro de este tipo se dice que es inconsistente.
[Hidrología para Ing. Civiles. Autor: Wendor Chereque Moran PUCP. Pág.
26]
El análisis de consistencia de la información hidrológica, se realiza mediante
los siguientes procesos.
- Análisis visual gráfico.
- Análisis doble masa.
- Análisis estadístico.
1.5.1. ANÁLISIS VISUAL GRÁFICO:
En coordenadas cartesianas se plotea la información hidrológica histórica,
ubicándose en las ordenadas, los valores de la serie y en las abscisas el
tiempo (años, meses, días, etc.)
Un gráfico de esta naturaleza sirven para analizar la consistencia de la
información hidrológica en forma visual, e indicar el periodo o periodos en
los cuales la información es dudosa, lo cual se puede reflejar como "picos"
muy altos o valores muy bajos, saltos y/o tendencias, los mismos que
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 10
11. INFORME N° 02 “TRATAMIENTO DE DATOS”
deberán comprobarse, si son fenómenos naturales que si efectivamente
han ocurrido, o si son producto de errores sistemáticos.
Para conocer la causa del fenómeno detectado, se pueden analizar de diversas
formas:
1. Cuando se tienen estaciones vecinas, se comparan los gráficos de las series
históricas, y se observa cual periodo varía notoriamente uno con respecto al otro.
2. Cuando se tiene una sola estación, esta se divide en varios periodos y se compara
la información de campo obtenida.
3. Cuando se tienen datos de precipitación y escorrentía, se comparan los diagramas,
los cuales deben ser similares en su comportamiento.
1.5.2. ANÁLISIS ESTADÍSTICO:
Después de obtener los gráficos construidos para el análisis visual, los
periodos de posible corrección, y los periodos de dados que se mantendrán
con sus valores originales se proceden al análisis estadístico de saltos, tanto
en la media, como en la desviación estándar.
1.5.3. ANÁLISIS DOBLE MASA:
Una forma de detectar las inconsistencias es mediante las curvas doble
másicas.
Una curva doble másica se construye llevando en ordenadas los valores
acumulados de la estación en estudio y en abscisas los valores acumulados
de un patrón, que consiste en el promedio de varias estaciones índice.
1.6. ANÁLISIS DE SALTOS
1.6.1. CONSISTENCIA DE LA MEDIA
El análisis estadístico consiste en probar, mediante la prueba t (prueba de
hipótesis), si los valores medios ( x1 , x2 ) de las sub muestras, son
estadísticamente iguales o diferentes con una probabilidad del 95% o con
5% de nivel de significación, de la siguiente manera.
a. Cálculo de la media y la de la desviación estándar
2
1
2
1
n
n
1 1
x S
i x x x
i
n
1
1
1( )
;
1 1
1
n
1
x
1
1
i
i
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 11
12. INFORME N° 02 “TRATAMIENTO DE DATOS”
2
1
2
1
n
2 2
n
x S
j x x x
j
n
1
2
2( )
;
1 2
1
n
2
2
1
j
j
x
Dónde:
xi = Valores de la serie del periodo 1.
xj = Valores de la serie del periodo 2.
21, x x = Media de los periodos 1 y 2 respectivamente.
) ( 2) ( 1 , x x S S = Desviación estándar de los periodos 1 y 2 respectivamente.
n=Tamaño de la muestra (n1 +n2)
b. Cálculo del t calculado tc
Según:
t 1 2 1 2
d
x x
c S
Dónde:
0 1 2 (Por hipótesis, la hipótesis es que las medias son iguales)
Quedando:
x 1 x
2
d
t
c S
Además:
1
2
1 1
S S d p
n n
1 2
Y
1
n 1 S 2
n
1
S
2
1 1
n n
1 2
2
2 2
2
S p
Siendo:
d S
= Desviación de las diferencias de los promedios.
p S
= Desviación estándar ponderada.
c. Cálculo del t tabular tt
El valor critico de t, se obtiene de las tablas t de Student (tt), con 95% de
probabilidad, o con un nivel de significación del 5%, es decir:
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 12
13. INFORME N° 02 “TRATAMIENTO DE DATOS”
/ 2
0.025
1 2 G L n n
.
2
d. Comparación de tc con el tt
Si t t (95%) x1 x2 c t
(estadísticamente) En este caso,
siendo las medias x1 x2 estadísticamente, no se debe realizar
proceso de corrección.
Si t t (95%) x1 x2 c t
(estadísticamente) En este caso,
siendo las medias x1 x2 estadísticamente, se debe corregir la
información.
1.6.2. CONSISTENCIA DE LA DESVIACIÓN ESTÁNDAR.
El análisis consiste en probar, mediante la prueba F, si los valores de la
desviación estándar de las sub-muestras son estadísticamente iguales o
diferentes, con un 95% de probabilidad o con un 5% de nivel de
significación, de la siguiente forma:
a. Cálculo de las varianzas de ambos periodos
2
2
1
n
n
1 2
x i x x
x i
1
2
2
2
2( )
x x 1
S
1
n
1
2
1( )
1
;
1
1
j
i
n
S
b. Cálculo del F calculado tc
Según:
2
2
1( x
)
si S S
S
,
x x
2 1( )
2( )
2
x
2
2( x
)
si S S
S
S
2
2( )
2
2( )
,
x x
2 1( )
1( x
)
F
c
F
c
S
c. Cálculo del F tabular (valor critico de F ó Ft)
Se obtiene de las tablas F para una probabilidad del 95%, o con un nivel de
significación del 5%, y grados de libertad:
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 13
14. INFORME N° 02 “TRATAMIENTO DE DATOS”
G L N n
. . 1
2
1( )
Si S S
G L D n
. . 1
G L N n
. . 1
x x
2
2( )
,
Si S S
1
2
2
G L D n
. .
1
2
2( )
2
1( )
1
,
x x
Dónde:
G.L.N = Grados de libertad del numerador
G.L.D = Grados de libertad del denominador.
d. Comparación del Fc con el Ft
Si 1( ) 2( ) (95%) c t x x F F S S
(estadísticamente).
Si 1( ) 2( ) (95%) c t x x F F S S
(estadísticamente), por lo que se debe
corregir.
1.6.3. CORRECCIÓN DE DATOS:
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 270]
En los casos en que los parámetros media y desviación estándar de las sub-muestras
de las series de tiempo, resultan estadísticamente iguales, la
información original no se corrige, por ser consistente con 95% de
probabilidad. En caso contrario, se corrigen los valores de las sub-muestras
mediante las siguientes ecuaciones.
S
x
2( x
) 2
S
x
x
x
/ t
1
( )
S
x
1( )
x
x
t
/ 2
( )
...(
)
...( )
1( ) 1
x
2( )
t
S
X
X
x
t
Dónde:
/
(t ) X = Valor corregido de saltos.
t x = Valor a ser corregido.
o La ecuación ) ( se utiliza cuando se debe corregir los valores de la sub-muestra
de tamaño n1.
o La ecuación ( ) se utiliza cuando se debe corregir los valores de la sub-muestra
de tamaño n2.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 14
15. INFORME N° 02 “TRATAMIENTO DE DATOS”
1.7. ANÁLISIS DE TENDENCIA
Antes de realizar el análisis de tendencias, se realiza el analizas de saltos y
con la serie libre de saltos, se procede a analizar las tendencias en la media
y en la desviación estándar.
1.7.1. TENDENCIA A LA MEDIA (Tm)
La tendencia en la media Tm, puede ser expresada en forma general por la
ecuación polinomial:
2 3 .... T A B t C t D t m m m m m
Y en forma particular por la ecuación de regresión lineal simple:T A B t m m m
Dónde:
t = Tiempo en años, tomado como la variable independiente de la
tendencia. (t = 1, 2, 3,…, n)
Tm = Tendencia en la media, para este caso:
Tm =
/
(t ) X
Valor corregido de saltos es decir, datos a usarse para el cálculo
de los parámetros.
, , , ,... m m m m A B C D
= Coeficiente de los polinomios de regresión, que deben
ser estimados con los datos.
El cálculo de la tendencia en la media, haciendo uso de la ecuación T A B t m m m
y se realiza mediante el siguiente proceso.
a. Calculo de los parámetros de la ecuación de regresión lineal simple.
m m m A T t.B
b. Evaluación de la tendencia Tm
Para averiguar si la tendencia es significativa, se analiza el coeficiente de regresión
Bm o también el coeficiente de correlación R.
El análisis de R según el estadístico t, es como sigue:
R n
tc
1. Calculo de estadístico tc según: 2 1
2
R
Dónde:
tc= Valor del estadístico t calculado.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 15
16. INFORME N° 02 “TRATAMIENTO DE DATOS”
n = Número total de datos.
R = Coeficiente de correlación.
2. Calculo de tt
El valor critico de t, se obtiene de la tabla de t Student, con 95% de probabilidad o
con un nivel de significación del 5%, es decir:
/ 2 0.025
G L n
.
2
3. Comparación de tc con el tt :
Si t t R c t (95%) no es significativo. En este caso, la tendencia no
es significativa y hay que corregir.
Si t t R c t (95%) Si es significativo. En este caso, la tendencia es
significativa y hay necesidad de corregir la información de tendencia en la
media.
4. Correlación de la información.
La tendencia en la media se elimina haciendo uso de la ecuación:
Y X T ó
/
( )
t t m
( ) /
( )
Y X A
B t
t t m m
Dónde:
/
(t ) X =serie corregida de saltos.
mT = Tendencia en la media.
t Y =Serie sin tendencia en la media.
Para que el proceso t X preserve la media constante, se devuelve el promedio de
las /
t X luego las ecuaciones anteriores toman la forma:
/
( )
Y X T T
t t m m
Y X A B t T
( ) /
( )
t t m m m
Dónde:
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 16
17. INFORME N° 02 “TRATAMIENTO DE DATOS”
T m : Es el promedio de la tendencia en la media o promedio de los valores
corregidos de saltos.
1.7.2. TENDENCIA A LA DESVIACIÓN ESTÁNDAR:
[Hidrología Estadística. Autor: Máximo, VILLON BEJAR. Pág. 275]
La tendencia en la desviación estándar Ts, se expresa en forma general por la
ecuación polinomial:
.... 2 3 T A B t C t D t S S S S S
Y en forma particular, por la ecuación de regresión lineal simple: t B A T S S S
Dónde:
t = Tiempo en años (t = 1, 2, 3,…, n)
TS = Tendencia en la desviación estándar
Tm = (t ) Y
Valor corregido d tendencia en la media, es decir, datos a usarse
para el cálculo de los parámetros.
, , , ,... S S S S A B C D = Coeficiente de los polinomios de regresión, que deben
ser estimados con los datos
Para calcular y probar si la tendencia en la desviación estándar es significativa, se
sigue el siguiente proceso.
a. La información ya sin tendencia en la media Yt, se divide en periodos de datos
anuales.
b. Se calcula las desviaciones estándar para cada periodo de toda la información.
1
12
p Y 2
P p p S Y Y
1
2
1
11
p
Dónde:
SP = Desviación estándar del año p, es decir e los datos mensuales del año p
Yp= Serie sin tendencia en la media
Y p =Promedio de datos mensuales del año p (p = 1, 2, 3, ….., 12)
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 17
18. INFORME N° 02 “TRATAMIENTO DE DATOS”
c. Se calculan los parámetros de la ecuación, a partir de las desviaciones estándar
anuales y el tiempo t (en años), utilizando las ecuaciones dadas para la tendencia
en la media.
d. Se realiza la evaluación de Ts siguiendo el mismo proceso descrito para Tm.
Si en la prueba R resulta significativo, la tendencia en la desviaron estándar es
significativa, por lo que se debe eliminar de la serie aplicando la siguiente
ecuación.
/
( )
X
T
t m
t T
S
Z
Dónde:
Zt = Serie sin tendencia en la media ni en la desviación estándar. Las
demás variables han sido definidas en párrafos anteriores.
Para que el proceso preserve la media y la desviación estándar constante, la
ecuación toma la forma:
/
( )
X
T
Z
t T T
S m
t m
.
T
S
Dónde:
m S TT, Son los promedios de la tendencia en la desviación estándar y la
media respectivamente.
La serie Zt en una serie homogénea y consistente al 95% de probabilidad.
1.8. TABLA DE FRECUENCIAS
Los datos se clasifican de la siguiente forma:
a) Ordenar los datos en forma descendente.
b) Calcular el rango o la amplitud de la muestra con la siguiente ecuación.
푅 = 푋푚푎푥 − 푋푚푖푛
c) Calcular el número de intervalos de clase con la ecuación de Sturges .
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 18
19. INFORME N° 02 “TRATAMIENTO DE DATOS”
푘 = 1.33 푙푛(푛) + 1
Dónde:
k: número de intervalo de clase.
n: número de datos de la muestra.
d) Calcular la amplitud de cada intervalo de clase; con la siguiente fórmula.
Δ푋 =
푅
푘
e) Calcular los límites de clase de cada intervalo de clase.
퐿퐼푖 = 퐿퐼푖−1 + Δ푋
퐿푆푖 = 퐿퐼푖 + Δ푋
Dónde:
퐿 푛: 푙푖푚푖푡푒 푖푛푓푒푟푖표푟 푑푒푙 푖푛푡푒푟푣푎푙표 푛 푑푒 푐푙푎푠푒.
퐿푆1: 푙푖푚푖푡푒 푠푢푝푒푟푖표푟 푑푒푙 푖푛푡푒푟푣푎푙표 n 푑푒 푐푙푎푠푒.
f) Calcular las marcas de clase.
푀푐푖 =
퐿퐼푖 + 퐿푆푖
2
g) Tabular la tabla de frecuencia.
N° de clase
o intervalo
de clase
Intervalo
de clase
Marca
de
clase
푴풄풊
Frecuencia
absoluta
풇풂풊
Frecuencia
absoluta
acumulada
푭풂풊
Frecuencia
relativa
풇풓풊
Frecuencia
relativa
acumulada
푭풓풊
Función
densidad
empírica
풇풆풊
푳푰풊 푳푺풊
1 푛1
2 푛21
푛푘
k 퐧
푘
푛 = Σ푛푖
푘
푘
UNASAM/FACULTAD DE INGENIERIA 푖=1
CIVIL Página 19
퐹푟푖 = Σ푓푟푖
푖=1
퐹푎푖 = Σ푓푎푖
푖= 1
푓푒푖 =
푓푟푖
Δ푋
푓푟푖 =
푛푖
푛
20. INFORME N° 02 “TRATAMIENTO DE DATOS”
h) Graficamos las siguientes distribuciones:
Distribución de frecuencias absolutas.
Histograma de frecuencias absolutas.
Polígono de frecuencias absolutas.
Distribuciones de frecuencias relativas.
Histograma de frecuencias relativas.
Polígono de frecuencias relativas.
Distribuciones de frecuencias absolutas acumuladas (ojiva).
Distribuciones de frecuencias relativas acumuladas (ojiva).
Función de densidad empírica.
Coeficiente de asimetría (sesgo).
a) Aplicaremos la siguiente fórmula:
품 = 푪풔 =
풏ퟐ × 풎ퟑ
(풏 − ퟏ) × (풏 − ퟐ) × 풔ퟑ
Para datos no agrupados:
푚3 =
1
푛
푛
× Σ(푥푖 − 푥)3
푖 =1
Para datos agrupados:
푚3 =
1
푛
푛
× Σ(푥푖 − 푥)3 × 푛푖
푖=1
El resultado se tendrá que verificar con lo siguiente
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 20
21. INFORME N° 02 “TRATAMIENTO DE DATOS”
푪풔 < ퟎ ; Es una distribución sesgada a la izquierda (polígono de frecuencias
con cola más larga hacia la izquierda).
푪풔 = ퟎ ; Es una distribución simétrica.
푪풔 > ퟎ ; Es una distribución sesgada a la derecha ( polígono de frecuencias con
cola más larga hacia la derecha).
Medida de apuntamiento (curtosis).
a) Aplicaremos la siguiente fórmula:
푪풌 =
풏ퟑ × 풎ퟒ
(풏 − ퟏ) × (풏 − ퟐ) × (풏 − ퟑ) × 풔ퟒ
Para datos no agrupados:
m4 =
1
n
n
× Σ(xi − x)4
i=1
Para datos agrupados:
m4 =
1
n
n
× Σ(xi − x)4 × ni
i=1
El resultado se tendrá que verificar con lo siguiente:
푪풌 < ퟑ ; Es una distribución platicurtica (achatada o plana)
푪풌 = ퟑ ; Es una distribución mesocurtica o moderada (curva normal)
푪풌 > ퟑ ; Es una distribución leptocurtica (picuda o puntiaguda)
II. MATERIALES Y EQUIPOS
Plano digital de la cuenca del rio santa.
Computadora Intel Core i7.
Impresora hp laser 300.
Software AutoCAD 2014.
Software Microsoft Excel 2013.
Software Microsoft Word 2013.
Cuaderno de apuntes y lapiceros.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 21
26. INFORME N° 02 “TRATAMIENTO DE DATOS”
IV. RESULTADOS DEL TRATAMIENTO DE DATOS
4.1. COMPLETACIÓN Y EXTENSIÓN DE DATOS
“Se tomaron los datos a partir de 1970 hasta 1984 y se contaban con datos
completos”.
4.2. ANÁLISIS VISUAL Y GRÁFICO
4.2.1. ESTACIÓN QUILLCAY (SERIE HISTORICA)
Se puede observar que hay valores muy bajos entre 1989 y 1991.
4.2.2. ESTACIÓN CHANCOS (SERIE HISTORICA)
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 26
41. INFORME N° 02 “TRATAMIENTO DE DATOS”
1.6000
1.4000
1.2000
1.0000
0.8000
0.6000
0.4000
0.2000
0.0000
FUNCION GUMBEL
RESUMEN
Función de Gumbel
0.00 0.50 1.00 1.50 2.00 2.50 3.00
MARCA DE CLASE
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 41
42. INFORME N° 02 “TRATAMIENTO DE DATOS”
1.6000
1.4000
1.2000
1.0000
0.8000
0.6000
0.4000
0.2000
0.0000
Función de Gumbel FUNCION DE DENSIDAD NORMAL
FUNCION EXPONENCIAL Polígono de Frecuencia Relativa
FUNCION DE DENSIDAD EMPIRICA
0.50 1.00 1.50 2.00 2.50 3.00
MARCA DE CLASE
La función que más se ajusta a los datos de la estación Querococha es la función
gumbel.
1.1.2. DESCRIPCIÓN DE DATOS ESTADÍSTICOS DE OLLEROS
a) Ordenar los datos CORREGIDOS en forma descendente
ORDEN AÑOS M. ANUAL
1 1982 7.185
2 1988 6.590
3 1970 6.231
4 1973 6.023
5 1983 5.928
6 1992 5.665
7 1987 5.649
8 1978 5.455
9 1975 5.288
10 1971 5.277
11 1985 5.177
12 1993 4.993
13 1974 4.823
14 1986 4.722
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 42
43. INFORME N° 02 “TRATAMIENTO DE DATOS”
15 1972 4.718
16 1990 4.584
17 1995 4.576
18 1980 4.508
19 1981 4.444
20 1976 4.396
21 1994 4.391
22 1977 4.327
23 1979 4.277
24 1984 4.260
25 1989 4.134
26 1991 3.929
b) Calcular el rango o la amplitud de la muestra.
Rmáx 7.185
Rmin 3.929
R 3.256
c) Calcular el número de intervalos de clase con la ecuación de Sturges.
n 26
k 5.3332684 6
d) calcular la amplitud de cada intervalo de clase; con la siguiente fórmula.
Δx 0.54263889
k Lim inf. Lim sup.
1 3.929 4.472
2 4.472 5.014
3 5.014 5.557
4 5.557 6.100
5 6.100 6.642
6 6.642 7.185
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 43
51. INFORME N° 02 “TRATAMIENTO DE DATOS”
EN RESUMEN:
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0 2 4 6 8
Marca de clase
Función de Densidad
Función Normal
Función Exponencial
Función de Gumbel
la función que más se ajusta a los datos de la estación olleros es la función
gumbel.
1.1.3. DESCRIPCIÓN DE DATOS ESTADÍSTICOS DE QUILLCAY
a) Ordenamientos de forma descendente
ORDEN AÑO MEDIA
ANUAL
1 1970 8.97
2 1982 8.41
3 1992 8.28
4 1973 8.19
5 1980 8.08
6 1978 7.64
7 1987 7.56
8 1983 7.53
9 1986 7.49
10 1993 7.48
11 1971 7.47
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 51
52. INFORME N° 02 “TRATAMIENTO DE DATOS”
12 1981 7.45
13 1988 7.43
14 1994 7.24
15 1995 7.14
16 1974 7.08
17 1991 7.04
18 1990 7.03
19 1976 6.92
20 1989 6.77
21 1972 6.73
22 1975 6.50
23 1977 6.47
24 1979 6.14
25 1985 5.90
26 1984 5.11
b) Calculo del rango o la amplitud de la muestra.
푹 = 푿풎풂풙 − 푿풎풊풏
Rmáx 8.97
Rmin 5.11
R 3.86
c) Calcular el número de intervalos de clase con la ecuación de sturges
풌 = ퟏ. ퟑퟑ 퐥퐧(풏) + ퟏ
n 26
k 5.333268396 6
d) calcular la amplitud de cada intervalo de clase; con la siguiente fórmula.
Δ푿 =
푹
풌
ΔX 0.6425
e) Calcular los límites de clase de cada intervalo de clase
k Lim. Inf. Lim. Sup.
1 5.11 5.75
2 5.75 6.40
3 6.40 7.04
4 7.04 7.68
5 7.68 8.32
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 52
53. INFORME N° 02 “TRATAMIENTO DE DATOS”
6 8.32 8.97
f) calcular las marcas de clase.
k
Marca de
clase
1 5.43
2 6.07
3 6.72
4 7.36
5 8.00
6 8.64
g) Tabular la tabla de frecuencia.
k Intervalo de Clase Marca de
Clase
Frecuencia
Absoluta
Frecuencia
Abs. Acum.
Frecuencia
Relativa
Frecuencia
Rel. Acum.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 53
Densidad
Lim. Inf. Lim. Sup. Empirica
1 5.11 5.75 5.43 1 1 0.038 0.038 0.05986232
2 5.75 6.40 6.07 2 3 0.077 0.115 0.11972463
3 6.40 7.04 6.72 6 9 0.231 0.346 0.3591739
4 7.04 7.68 7.36 12 21 0.462 0.808 0.7183478
5 7.68 8.32 8.00 3 24 0.115 0.923 0.17958695
6 8.32 8.97 8.64 2 26 0.077 1.000 0.11972463
N 26
62. INFORME N° 02 “TRATAMIENTO DE DATOS”
Función de Gumbel
0.5435
0.6000
0.5000
0.4000
0.3000
0.2000
0.1000
0.0200.07007.07029 0.0000 0.0011
0.0000 2.0000 4.0000 6.0000 8.0000 10.0000
n) Superposición de funciones.
0.3181
0.1398
0.0545
Función de Gumbel
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-0.1
0 2 4 6 8 10
Marca de clase
Función de Densidad
Función Normal
Función Exponencial
Función de Gumbel
La función que más se ajusta a los datos de la estación Quillcay es la función
normal
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 62
63. INFORME N° 02 “TRATAMIENTO DE DATOS”
II. DISCUSION DE RESULTADOS
Cuando se realizó en Análisis Visual gráfico no se observó ningún salto ni tendencia
resaltante en ninguna de la Estaciones (Querococha, Olleros y Quillcay), esto se
confirmó realizando los análisis estadísticos de consistencia y tendencia de los
mismos, cuando resultaba que no se realizaba ninguna corrección de datos.
III. CONCLUSIONES
3.1. Las lecturas de caudales medios anuales de las estaciones Querococha,
Olleros y Quillcay son correctas.
3.2. La función que más se ajusta a los datos de la estación Olleros es la función
Gumbel.
IV. BIBLIOGRAFIA REFERENCIADA
4.1. Ing. Carlos D. SEGERER e Ing. Rubén VILLODAS. ”Estadística aplicada a la
hidrología”. Pág. 123
4.2. REYES CARRASCO, Luis V. “HIDROLOGIA BÁSICA”, Editorial del CONCYTEC,
Lima-Perú, 1992.
4.3. VILLON BEJAR, Máximo. “HIDROLOGIA”, Publicaciones del Instituto
Tecnológico de Costa Rica, 2º Edición, 2002.
4.4. VILLON BEJAR, Máximo. “HIDROLOGIA ESTADISTICA”, Instituto Tecnológico
de Costa Rica, 3º Edición, Lima-Perú, 2005. Pág. 94-103, 270-275.
4.5. CHEREQUE MORAN, Wendor. “HIDROLOGIA PARA INGENIEROS CIVILES”,
PUPC. Pág. 26.
UNASAM/FACULTAD DE INGENIERIA CIVIL Página 63