1. UNIVERSIDAD NACIONAL DE TRUJILLO
ING. HANSELL SOTO CASTRO
INGENIERIA AGRÍCOLA
DISTRIBUCIÓN ESPACIAL DE LAS PRECIPITACIONES
GEOESTADÍSTICA
2. El movimiento del agua entre los subsistemas del sistema
climático constituyen el ciclo hidrológico.
Hasta hace poco, el ciclo hidrológico era estudiado de manera
fragmentada considerando sólo la parte del suelo de la rama
terrestre. Esto se debía a una limitada disponibilidad de los datos
atmosféricos distribuidos.
La mejora del conocimiento del estado del agua en la atmósfera
ha contribuido a caracterizar el ciclo hidrológico para varias
escalas temporales y espaciales.
CICLO HIDROLÓGICO
3.
4. PRECIPITACIÓN
• En determinada circunstancias el agua contenida en a atmósfera cae sobre la tierra. Esta caída
o precipitación puede ser en forma de lluvia, nieve o granizo.
• La precipitación es la fuente de agua por excelencia, de ella se origina la escorrentía superficial
y subterránea
• La precipitación normalmente tiene una marcada distribución espacial. Hay lugares donde
llueve mucho y otros donde casi no llueve, aun dentro de una misma cuenca.
6. INTRODUCCIÓN
• Los datos hablan más claramente cuando ellos están organizados.
• La estadística es el arte de aprender a partir de los datos.
• Supone recopilar, describir y analizar datos.
• Si los datos están asociados a una localización en el espacio: Descripción espacial.
Algunas de las características más interesantes
e importantes de los datos de las ciencias de la
tierra son las relaciones entre los varios
atributos. (conjunto con más de una variable)
8. Diagrama de probabilidades acumuladas
Un diagrama de probabilidades
acumuladas es un gráfico x-y en el cual
las probabilidades acumuladas de
dos distribuciones son representados
unas versus las otras.
MÉTODOS GRÁFICOS PARA LA DESCRIPCIÓN
BIVARIADA
9. Diagrama de dispersión
Un diagrama de dispersión es un gráfico x-y en el
cual la coordenada x corresponde a los valores
de una variable y la coordenada y a los de otra.
Un diagrama de dispersión es un buen indicador
visual de la relación que existe entre dos
variables.
MÉTODOS GRÁFICOS PARA LA DESCRIPCIÓN
BIVARIADA
10. Una utilidad de los
diagramas de dispersión
Permite detectar valores
que se encuentran
sospechosamente fuera del
rango de los datos
Diagrama de dispersión
MÉTODOS GRÁFICOS PARA LA DESCRIPCIÓN
BIVARIADA
11. • Covarianza.
• Coeficiente de correlación.
• Momento de inercia.
MÉTODOS NUMÉRICOS PARA LA DESCRIPCIÓN
BIVARIADA
La correlación indica la fuerza y la dirección de una
relación lineal y proporcionalidad entre dos variables
estadísticas
12. • Una particularidad de las bases de datos utilizadas en las ciencias del terreno,
es que la información esta asociada a una localización en el espacio.
• El objetivo de la descripción espacial es describir y cuantificar la relación entre
medidas del mismo atributo y/o de atributos distintos en dos localizaciones.
DESCRIPCIÓN ESPACIAL
13. • La descripción espacial de la información comienza por una representación grafica que
tenga en cuenta la localización de los datos.
• Las herramientas mas habituales son:
Mapas con la localización de los datos.
Mapas de isolíneas.
Mapas de símbolos.
Mapas de indicadores.
VISUALIZACIÓN ESPACIAL DE DATOS
16. • Las herramientas para realizar la descripción univariada de la información no son
capaces de capturar las características espaciales de un atributo.
• Las herramientas utilizadas para describir la relación entre dos variables pueden
utilizarse para describir la relación entre el valor de una variable y los valores de la
misma variable en localizaciones cercanas.
• El diagrama de dispersión es utilizado para mostrar la continuidad espacial.
• Los estadísticos bivariados clásicos sirven para sumarizar la información contenida
en un diagrama de dispersión.
CONTINUIDAD ESPACIAL
17. • En la practica difícilmente dispongamos de un conjunto de datos exhaustivamente
conocido como el utilizado hasta ahora en nuestro análisis.
• En su lugar dispondremos de un conjunto de datos que en general es una pequeña
fracción del conjunto de datos exhaustivo y que se encuentran casi siempre
irregularmente distribuidos en el espacio.
• Las herramientas para realizar la descripción espacial de datos exhaustivamente
conocidos deben ser adaptadas para que sean útiles a la hora de analizar la continuidad
espacial de datos escasamente muestreados e irregularmente distribuidos en el espacio.
DATOS IRREGULARMENTE ESPACIADOS
19. • La expresión del variograma nos permite cuantificar la continuidad espacial para una serie
de distancias de separación y direcciones determinando as el vario-grama experimental.
• Los métodos geoestadísticos requieren conocer el variograma para cualquier distancia de
separación y cualquier dirección en la cual es considerada dicha separación, por lo que es
necesario ajustar un modelo al variograma experimental.
VARIOGRAMA
20. Terminología
• a es el alcance: distancia a la cual el
variograma alcanza la meseta.
• C es la meseta: valor del variograma cuando
la distancia de separación se hace igual al
alcance.
• C0 es el efecto pepita: valor del variograma
para pequeñas escalas.
VARIOGRAMA
27. • La exploración de la información disponible es el paso mas importante en cualquier
estudio relacionado con las ciencias de la tierra.
• El análisis de la continuidad espacial de un conjunto de datos es frustrante y constituye
una tarea ardua y desalentadora.
• El desarrollo de casos prácticos es el mejor camino para familiarizarnos con las
herramientas presentadas.
• El variograma es la piedra angular de la geoestadística.
ALGUNAS CONSIDERACIONES
29. • La descripción de la información no es el último objetivo de un estudio estadístico.
• El principal interés suele estar en las inferencias acerca de las características de la
realidad a partir de la información registrada.
• El análisis estadístico descriptivo es un primer paso que permite obtener una serie de
estadísticos a partir de los cuales podemos construir un modelo (una representación)
acerca de la realidad desconocida que se quiere investigar.
• Todas las aplicaciones geoestadísticas requieren de la construcción de un modelo y por
eso se dejará bien claro cual es ese modelo.
GEOESTADÍSTICA
30. • El término geoestadística designa el estudio estadístico de fenómenos naturales.
• G. Matheron fue el primero en utilizarlo extensamente proponiendo la siguiente definición.
.
La geoestadística es la aplicación del formalismo de las funciones aleatorias al
reconocimiento y estimación de fenómenos naturales
• Un fenómeno natural puede ser caracterizado por la distribución en el espacio de una o
más variables llamadas variables regionalizadas.
GEOESTADÍSTICA
31. GEOESTADÍSTICA
El objeto de la geoestadística es describir cuantitativamente variables
naturales distribuidas en el espacio, por ejemplo:
• La concentración de un mineral en una mina (oro y diamantes).
• La profundidad y el espesor de un estrato geológico.
• La porosidad y la permeabilidad de un medio poroso.
• Las propiedades del suelo en una región (fósforo).
• La lluvia caída sobre una cuenca.
• Las concentraciones de un soluto en una zona contaminada
• (isótopos radiactivos).
• El número de peces en un área de producción determinada.
• La presión, temperatura y velocidad del viento en la atmósfera.
32. Sea un conjunto de mediciones de un
atributo sobre un dominio de estudio
determinado.
33. ¿Qué sucede con el atributo en las
localizaciones donde no ha sido medido?
Sea un conjunto de mediciones de un
atributo sobre un dominio de estudio
determinado.
34. La necesidad de modelizar la
distribución espacial de un parámetro
surge del hecho de que la información
disponible no es exhaustiva.
Sin un modelo, no podemos realizar
ninguna inferencia acerca del
fenómeno en las localizaciones donde
éste no ha sido registrado
¿Qué sucede con el atributo en las
localizaciones donde no ha sido medido?
Sea un conjunto de mediciones de un
atributo sobre un dominio de estudio
determinado.
35. • El objetivo de un estudio geoestadístico no es solamente describir la información y
construir un modelo de continuidad espacial.
• La información acerca de los datos y el modelo de continuidad espacial nos
permiten realizar la estimación de los valores de una o varias variables donde ellas
no fueron muestreadas.
TÉCNICAS DE ESTIMACIÓN DE UNA SOLA
VARIABLE
36. • Existen diferentes aproximaciones para dar valor a los pesos, las cuales dan
origen a distintas técnicas de estimación:
Estimación global y local.
Estimación de una media y de una distribución completa.
Estimación puntual y de bloque.
TIPOS DE ESTIMACIONES
37. • Una estimación sobre un área grande dentro de la cual hay muchos datos es una
estimación global.
• Una estimación local es una que se lleva a cabo sobre un área pequeña en la cual
tenemos pocos datos, incluso ninguno, y para la cual tenemos que utilizar la
información cercana que se encuentra fuera del área de estimación.
• Ejemplo:
la estimación del valor medio de la permeabilidad sobre todo el campo de Berea
(estimación global) y la estimación del valor medio de la permeabilidad sobre un
área de 5 por 5 celdas (estimación local).
ESTIMACIÓN GLOBAL Y LOCAL
38. La idea básica del krigeado ordinario es estimar el
valor desconocido de un atributo z en el punto de
coordenadas u, a partir de n valores conocidos de z,
cuyas coordenadas son u; con = 1; ……; n.
El estimador por krigeado ordinario tiene la forma
siguiente:
EL KRIGEADO ORDINARIO
45. Descripción de la información
• El objetivo de este paso es organizar los datos para conocer la información de la que
disponemos y en la cual basaremos nuestro modelo.
• Para ello utilizamos las herramientas clásicas de la estadística descriptiva, algunas
de las cuales son adaptadas para que sean capaces de realizar la descripción
espacial de las variables estudiadas.
• El tiempo dedicado a esta etapa es generalmente recompensado en las etapas
posteriores.
• No existe una secuencia única de pasos en los que aplicamos siempre las mismas
herramientas.
• Ante cualquier sorpresa inicial debemos investigar utilizando diferentes herramientas
hasta que la duda sea aclarada.
RESUMEN FINAL
46. • En el análisis univariado, la media y la varianza son los estadísticos más utilizados para
valorar la localización y la dispersión de una distribución.
• Otros estadísticos basados en cuantiles son menos sensibles a valores extremos.
• En el análisis bivariado, el diagrama de dispersión es una herramienta adecuada para
mostrar la relación entre variables y constituye la base para el análisis de la continuidad
espacial.
• El coeficiente de correlación de Pearson es la medida más empleada para valorar la
correlación lineal entre variables.
• Es un estadístico fuertemente influenciado por valores extremos e incapaz de valorar una
relación no lineal entre variables.
• Eduardo
DESCRIPCIÓN DE LA INFORMACIÓN
47. • El objetivo de este paso es construir un modelo matemático que capture las
características espaciales más relevantes de los atributos estudiados.
• El aspecto más importante de los datos de las ciencias de la tierra es su localización
espacial.
• El análisis de la continuidad espacial de un conjunto de datos es el paso que más
tiempo insume en todo análisis geoestadístico.
• El variograma es la herramienta más ampliamente utilizada, pero no la única, para la
descripción espacial de la información.
• El uso de los diagramas de dispersión es esencial para diagnosticar el
comportamiento errático del variograma.
MODELIZACIÓN DE LA CONTINUIDAD ESPACIAL
48. • El ajuste de un modelo a un variograma experimental es para el principiante un arte
un tanto oscuro.
• Esta tarea se va haciendo menos misteriosa conforme vamos desarrollando más
casos prácticos.
• Existe una tendencia a sobreajustar los variogramas entre los nuevos
geoestadísticos.
• La simplicidad es un buen principio para modelizar variogramas.
• Si existe una explicación razonable, por ejemplo en relación a la génesis del
fenómeno, que suponga un comportamiento especial del variograma, sí vale la
pena utilizar un modelo que lo incorpore.
MODELIZACIÓN DE LA CONTINUIDAD ESPACIAL
49. • Ajustar un modelo a una sola dirección es un ejercicio de prueba y error bastante
sencillo donde interviene unos pocos parámetros.
• Para ajustar un modelo a varias direcciones es necesario ser más cuidadosos:
debemos utilizar los mismos modelos, con las mismas mesetas pero diferentes
rangos.
MODELIZACIÓN DE LA CONTINUIDAD ESPACIAL
50. • El objetivo de este paso es estimar valores de la o las variables estudiadas en
localizaciones donde ellas no han sido muestreadas.
• Existen diferentes problemas de estimación para los cuales se han desarrolladas
distintas técnicas.
• Este curso se ha centrado en presentar técnicas de estimación local y puntual, tanto
valores únicos como distribuciones completas.
• Existen problemas de otra naturaleza en el ámbito de la estimación como la estimación de
parámetros globales o la estimación de valores desconocidos cuyo soporte no es el mismo
que el de los datos disponibles que no hemos tratado.
PREDICCIÓN ESPACIAL
51. • En la estimación local la distancia a los datos vecinos es lo más esencial.
• El krigeado es matemática y computacionalmente más tedioso que las técnicas
tradicionales de estimación.
• Es capaz de considerar tanto el agrupamiento de los datos como su distancia a la
posición siendo estimada.
• Las distancias en krigeado son distancias estadísticas o estructurales y vienen dadas
por el variograma.
• La calidad de los resultados del krigeado dependen de una adecuada elección del modelo
de continuidad espacial.
PREDICCIÓN ESPACIAL
52. • Hay muchas aplicaciones en las cuales las estimaciones pueden ser mejoradas si la
correlación entre diferentes variables es explotada.
• En este curso mostramos la técnica del cokrigeado y algunas de sus variantes.
• El cokrigeado es una fuerte mejora sobre el krigeado cuando la variable primaria está
insuficientemente muestreada.
• El cokrigeado supone una mayor carga de trabajo para el modelizador dada la
necesidad de obtener el modelo de corregionalización lineal.
• Si la variable secundaria está exhaustivamente conocida la alternativa del cokrigeado
colocalizado es la más adecuada.
PREDICCIÓN ESPACIAL
53. • La geoestadística es un conjunto de herramientas que nos ayuda a tomar decisiones y
no un proceso automático de predicción.
• No se debe hablar de geoestadística sin una referencia, esto es, los métodos
geoestadísticos están orientados hacia un objetivo.
• La geoestadística ofrece soluciones prácticas a problemas prácticos.
• Los datos siempre deben ir “delante” del modelo.
• En geoestadística se realizan elecciones subjetivas explícitas y se analizan sus
consecuencias.
• El sentido común es más importante que el formalismo.
CONSIDERACIONES FINALES
55. • Los datos de precipitación son la principal información de entrada para los modelos
hidrológicos.
• Las redes pluviograficas registran medidas puntuales de la precipitación las cuales suelen
ser interpoladas para obtener una estimación de la distribución espacial de la misma.
• Estas interpolaciones son buenas estimaciones de la lluvia total sobre grandes áreas pero
no modelizan adecuadamente la compleja estructura espacial de la tormenta.
• Tradicionalmente, las técnicas de interpolación aplicadas para obtener campos de la
precipitación han sido el método de los polígonos de Thiessen y el método de la inversa
de la distancia al cuadrado.
• Se propone la aplicación de técnicas geoestadísticas que, además de capturar
eficientemente el patrón de variabilidad espacial del fenómeno, permiten combinar
distintos tipos de información.
LA ESTIMACIÓN DE LA PRECIPITACIÓN
56. Las técnicas evaluadas son:
• Krigeado ordinario.
• Krigeado con una deriva externa.
• Cokrigeado ordinario completo.
• Cokrigeado colocalizado.
Los resultados de las estimaciones obtenidas con estos métodos son comparados con
los derivados de aplicar el método de los polígonos de Thiessen y el método de la
inversa de la distancia al cuadrado.
ESTIMACIÓN DE LA PRECIPITACIÓN COMBINANDO DATOS DE
PLUVIOGRAFOS Y DATOS DE UN MODELO DIGITAL DEL TERRENO
58. • Medidas de lluvia anual en 69 pluviografos y un mapa exhaustivo de la altitud del
terreno derivado de un MDT cubriendo un área de 14850 km2.
• El área de trabajo se discretizó en 198 por 75 celdas cuadradas de 1 km por 1 km.
• Las celdas correspondientes al Océano Atlántico son inactivas de manera que el
numero total de celdas activas es 11407.
INFORMACIÓN DISPONIBLE
64. • Insesgabilidad global: el histograma de los errores debe ser simetrico, con media cero y
varianza mínima.
• Insesgabilidad condicional: la representación gráfica de los errores versus los valores
estimados debe ser simétrica alrededor de la linea correspondiente al error cero, y debe
tener una dispersión uniforme (la varianza del error no depende de si el valor estimado es
bajo o alto).
• Errores espacialmente no correlacionados: el variograma de los errores debe ser un efecto
pepita puro.
ANÁLISIS DE LOS RESULTADOS VS VALIDACIÓN
CRUZADA
68. • Por comparación visual, es evidente que los datos de elevación aportan información
adicional al proceso de estimación.
• La evaluación cuantitativa va validación cruzada no es concluyente como
esperábamos a priori.
• El krigeado con una deriva externa es el método que mejor funciona.
• No debemos olvidar que estas conclusiones son especificas de este ejercicio y que el
algoritmo de validación cruzada mide cuan bien funciona una técnica de estimación
pero solo en las localizaciones donde hay información.
CONCLUSIONES
75. Isaaks, E. y Srivastava, R. M.
An Introduction to Applied Geostatistics.
Oxford University Press, New York, 1989.
Goovaerts, P.
Geostatistics for Natural Resources Evaluation.
Oxford University Press, New York, 1997.
BIBLIOGRAFÍA RECOMENDADA
Gómez-Hernández, J. Jaime.
Geostatistics and Hydrology: An Overview.
Second Joint Conference and Exhibition on Geographical
Information volumen I, Barcelona 1996.