Trabajo sobre el desarrollo de un modelo climático bajo el lenguaje de programación R.
MSc work about a climate model developped with computer language R.
Modelización de variables climáticas e integración con información ambiental en el Parque Natural de Cabo de Gata-Níjar
1. TRABAJO FIN DE MÁSTER
MODELIZACIÓN DE VARIABLES CLIMÁTICAS E
INTEGRACIÓN CON INFORMACIÓN AMBIENTAL
Lucas Sevilla García
Máster Universitario en Tecnologías de la información geográfica para la ordenación del
territorio: sistemas de información geográfica y teledetección
Noviembre de 2009
Departamento de Geografía y Ordenación del Territorio
UNIVERSIDAD DE ZARAGOZA
2. Resumen
Los procesos de desertización pueden identificarse mediante una pérdida de capacidad de los ecosistemas para
producir biomasa. El presente trabajo es una contribución al sistema de monitoreo de la eficiencia con la que la
vegetación usa la precipitación para producir biomasa. Este indicador puede utilizarse dentro de sistemas de
seguimiento de áreas protegidas semiáridas para identificar procesos de desertización. En concreto, este trabajo
persigue automatizar la asimilación y procesamiento de datos climáticos mensuales para generar mapas climáticos
a partir de una red de estaciones meteorológicas alrededor del Parque Natural de Cabo de Gata-Níjar (Almería).
El método consiste, en primer lugar, en una depuración y homogeneización de los datos climáticos y, a
continuación, en interpolaciones espaciales de los datos homogeneizados. Los datos de entrada necesarios son las
series temporales de las estaciones meteorológicas presentes en el área de influencia del parque y un modelo digital
de elevaciones. El modelo utiliza regresiones múltiples y métodos de interpolación espacial de forma automática
mediante el lenguaje R de programación estadística. Como resultado, se obtienen una serie temporal de mapas
mensuales de precipitación y temperatura. No obstante, se identificaron pasos en los que se podría mejorar aun
más el proceso de automatización y aun es necesario acoplarlo con las series temporales de imágenes de
productividad primaria del parque natural.
Palabras clave: Cabo de Gata; interpolación; automatización; lenguaje R; mapa mensual de precipitación.
Abstract
Desertification processes can be identified in an ecosystem by its dimished ability to produce biomass. The
following work is a contribution to the monitoring system that measures the efficiency of the vegetation in using
rainfall to produce biomass. This indicator can be included in monitoring systems in protected semi-arid areas to
spot desertification processes. This work aims to automate the acquisition and processing of monthly climate data to
generate climate maps from a network of weather stations surrounding the Cabo de Gata-Níjar Nature reserve
(Almería). The method comprises the following: firstly, the climate data are purged and homogenised and, secondly
the homogenised data are spatially interpolated. The required input data come from the temporal sequences
recorded by weather stations located within the influence area of the reserve and a digital elevation model. As a
result, a temporal sequence of monthly precipitation and temperature maps is obtained. Nevertheless, the steps in
which the automation process could be improved were identified and the temporal sequences of primary
productivity images from the nature reserve are yet to be coupled with the system.
Key words: Cabo de Gata; interpolation; automation; R language; monthly precipitation map.
3. Índice
1. Introducción ........................................................................................................... pág. 1
2. Documentación....................................................................................................... pág. 2
2.1. Área de estudio.............................................................................................. pág. 2
2.2. Monitorización: Concepto y aplicación ........................................................ pág. 5
2.3. Eficiencia en el uso de agua de lluvia (RUE)................................................ pág. 7
3. Objetivos ................................................................................................................ pág. 8
4. Material .................................................................................................................. pág. 10
5. Metodología ........................................................................................................... pág. 11
5.1. Datos climáticos ............................................................................................ pág. 11
5.2. Homogeneización de datos............................................................................ pág. 14
5.2.1. Escala temporal ................................................................................. pág. 14
5.2.2. Inicio y final de la serie temporal...................................................... pág. 15
5.2.3. Ausencia de datos.............................................................................. pág. 15
5.3. Estructura base de datos climáticos............................................................... pág. 18
5.4. Modelización de variables climáticas ........................................................... pág. 19
5.4.1. Variables dependientes...................................................................... pág. 20
5.4.2. Variables independientes................................................................... pág. 20
5.4.3. Métodos de interpolación .................................................................. pág. 21
5.5. Automatización del modelo climático........................................................... pág. 25
5.5.1. Estructura del proceso de automatización......................................... pág. 25
5.5.2. Automatización en la importación de datos ...................................... pág. 26
5.5.3. Automatización en el proceso de interpolación ................................ pág. 27
5.5.3. Automatización en la exportación de mapas climáticos ................... pág. 37
6. Resultados .............................................................................................................. pág. 38
7. Conclusiones .......................................................................................................... pág. 44
8. Bibliografía............................................................................................................. pág. 49
9. Anexo ..................................................................................................................... pág. 51
4.
5. 1. INTRODUCCIÓN
La protección de los ecosistemas del planeta es un tema que en las últimas décadas ha ido
adquiriendo un mayor protagonismo por parte de la sociedad. Hoy en día, en cualquier toma de
decisión o acción se tiene en cuenta al medio ambiente, no solo por el impacto que producirá
sobre este, sino por que cualquier acción sobre el medio ambiente genera una respuesta por su
parte que afecta a la sociedad. El mayor conocimiento del planeta, en concreto de sus distintos
ecosistemas, ha descubierto la dependencia que existe entre hombre y el planeta. Los servicios y
recursos que generan los ecosistemas son los que condicionan la calidad de vida humana y el mal
uso o aprovechamiento de estos sistemas y recursos, genera un efecto cadena que deteriora la
calidad del planeta y de la sociedad.
Es por ello que preservar la variedad de ecosistemas del planeta resulta importante para
asegurar que generaciones futuras puedan hacer uso de los servicios y recursos del planeta. Las
distintas figuras de protección establecidas en todos los países van encaminadas a conseguir
mantener un equilibrio entre hombre y naturaleza, sin embargo, delimitar determinadas zonas del
planeta con una etiqueta de protección no es suficiente para que estos ecosistemas sobrevivan. Y
es que, los ecosistemas no actúan como unidades independientes, sino que, como un tejido vivo,
esta conectado a otros ecosistemas y por lo tanto, se ve alterado por cualquier influencia externa.
Así, la comunidad científica, en las últimas décadas, realiza un gran esfuerzo con el fin de
obtener un mayor y mejor conocimiento del medio natural. A mayor información y compresión
del funcionamiento de los ecosistemas, mejor y más eficiente será la forma de actuar sobre los
ecosistemas. Así, el seguimiento de las áreas protegidas resulta imprescindible si se desea que
los ecosistemas de la tierra perseveren en el futuro y mantengan su calidad.
Los sistemas de seguimiento que existen en la actualidad son de todo tipo pero todos
persiguen el mismo objetivo, que es el de profundizar en el conocimiento del engranaje del
funcionamiento de los ecosistemas. La eficacia de muchos de estos sistemas de seguimiento
radica en el uso de herramientas de gran potencial como son los sistemas de información
geográfica (a partir de ahora SIG) y una ciencia como es la teledetección. El uso de imágenes de
satélite acompañadas de SIG y teledetección ha facilitado el trabajo de la comunidad científica
en numerosos campos, ya que permite ajustar la escala espacial y temporal según la necesidad
del trabajo, lo que, por ejemplo en casos de seguimiento de grandes extensiones ha sido esencial.
La importancia que ha adquirido la teledetección y SIG en el conocimiento del planeta es tal, que
se ha convertido en un pilar básico a la hora de desarrollar cualquier plan de seguimiento y
actuación, ya que por la información que proporcionan las imágenes de satélite, ya no solo
permiten una mejor comprensión de cómo actúan los ecosistemas, si no que además, facilita la
toma de decisiones, de tal forma que cualquier actuación sobre los ecosistemas sea lo más eficaz
posible evitando repercusiones negativas.
El trabajo presente en esta memoria es un ejemplo del uso de los Sistemas de Información
Geográfica y la teledetección como herramientas de seguimientos de áreas protegidas con el
objetivo de construir un sistema sencillo y económico que se encargue de almacenar variada
información sobre el área protegida del Parque Natural del Cabo de Gata-Níjar y mediante
modelos de estimación de variables e índices analice la información de entrada, proporcionando
una serie de resultados que serán útiles a la hora de crear un plan de conservación o actuación
sobre este área protegida.
1
6. 2. DOCUMENTACIÓN
2.1. Área de estudio
El Parque Natural Marítimo-Terrestre de Cabo de Gata-Níjar, es un espacio protegido
situado en la costa este de la provincia de Almería. El buen estado de conservación del espacio
terrestre (37.500 hectáreas) y sus extraordinarias características naturales, tanto geológicas como
biológicas, hicieron que Cabo de Gata fuese declarado Parque Natural en 1987, por la Junta de
Andalucía. En 1995, la secretaría General de Pesca Marítima (SGPM), del Ministerio de
Agricultura, Pesca y Alimentación (MAPA), declaró la zona como Reserva Marina. En 1997 la
UNESCO declaró el espacio como Reserva de la Biosfera y en 2001, dentro del Convenio de
Barcelona, su parte marina ha sido incluida dentro del listado de Zonas Especialmente Protegidas
de Importancia para el Mediterráneo (ZEPIM) (Moreno Lampreave, 2001). En el año 2003 se
clasificó como Zona de Especial Protección para Aves (ZEPA) y en el año 2006 fue declarado
Geoparque Europeo y Geoparque Mundial de la UNESCO. Ha recibido también la mención de
Lugar de Interés Comunitario de la Red Natura 2000. Todas estas distinciones ponen de
manifiesto el alto valor de su patrimonio natural (Mendoza, 2008).
Figura 1. Localización del Parque Natural del Cabo de Gata-Níjar (Almería).
2
7. En cuanto a su condición de espacio marino protegido, se trata del más extenso del
continente europeo declarado sobre la costa continental. El área marina protegida como Parque
Natural de Cabo de Gata-Níjar tiene más de 60 Km. de longitud, con una anchura de una milla
desde la costa, y una superficie total de 12.000 hectáreas (ha) (Moreno Lampreave, 2001).
Es un territorio afectado por un vulcanismo neógeno que se desarrolló en la franja litoral
que va desde el Cabo de Gata (Almería) hasta el cabo de Palos (Murcia), y por una falla de
desgarre a nivel cristal conocida como “accidente de Carboneras”.
El parque presenta dos zonas bien diferenciadas: una montañosa, en forma de alineación
costera de dirección SO-NE, denominada sierra del Cabo de Gata, y otra constituida por colinas
y llanuras que recibe el nombre de Campos de Najar (Ferre & Senciales, 2001).
Climatología
El levante de la provincia de Almería se caracteriza por ser una de las zonas más áridas de
España. La ubicación de la provincia en el ámbito meridional de la Zona Templada del Oeste
Europeo, implica un régimen térmico bastante dulcificado, unos totales pluviométricos bastante
bajos y una alternancia climática estacional bastante contrastada. Por otro lado, la posición de la
provincia de Almería en el borde oriental de las Cordilleras Béticas, le sitúa a sotavento de la
Circulación Zonal de Poniente, recibiendo de forma muy débil las precipitaciones procedentes
del Atlántico (Capel, 1990).
El clima es de tipo mediterráneo, con acusada sequía estival y, frecuentemente invernal. Las
precipitaciones registradas rondan en una media de 200 mm. al año; lo que se refleja en un
paisaje ocre que da un aspecto semidesértico al territorio.
A pesar de esta escasez de precipitaciones, hay que tener en cuenta las criptoprecipitaciones
(condensación por nieblas fundamentalmente, y el hecho de que la elevada humedad ambiental
puede hacer descender la evapotranspiración, por lo que la disponibilidad de agua para las
plantas es mucho mayor que lo que aparenta (Martínez Lirola et al, 1997).
Las lluvias, aparte de ser escasas, son en forma de aguaceros violentos; lo que conlleva a
una escorrentía hídrica superficial espasmódica con temidas crecidas y acusados estiajes, siendo
esto un elemento fundamental en el modelado del relieve y del paisaje de la región.
El contacto directo de la provincia con el Mediterráneo a lo largo de un frente costero de
más de 200 Km., incide en la dulcificación de las temperaturas a través del mecanismo de brisas
y en la configuración estacional del régimen de precipitaciones, con sus máximos durante el final
del verano, otoño y primavera.
La temperatura media anual muestra valores uniformes y altos en el litoral, oscilando entre
17º y 21º. Las temperaturas mínimas ronda los 14º y las temperaturas máximas medias rondan
los 21º (Capel, 1990).
3
8. Geología y Edafología
Geológicamente la región es parte integrante de las cordilleras béticas. La zona del Parque
Natural presente una gran extensión de afloramientos de rocas volcánicas limitados por un
sistema de fracturas NE-SW.
La composición litológica del Parque Natural se caracteriza por una presencia dominante de
rocas volcánicas. Este tipo de rocas pertenecen al volcanismo post-orogénico. Se trata,
principalmente, de un volcanismo calcoalcalino, aunque hay algo de volcanismo potásico y
basáltico. Se data entre el mioceno medio y el plioceno inferior. Los tipos principales de rocas
son predominantemente sódicas.
Otros materiales presentes en el área son arenas, areniscas y margas y en menor medida
formaciones conglomeráticas, que pueden ser de tres tipos:
- Conglomerados, arcillas y limos, de carácter continental, con espesores de 15 a 40
metros.
- Conglomerados, arenas y limos con canales discordantes de los primeros y potencia de la
formación de 400 a 500 metros.
- Depósitos continentales de conglomerados y arenas poco cementados, con elementos
angulosos y heterómetricos, y con potencia desde 80 hasta unos pocos metros.
La diversidad litológica no siempre se corresponde con la edafológica. La aridez disminuye
el lavado de sales en tal medida, que muchos suelos originados sobre rocas silíceas son
francamente básicos, mientras que muchos otros sufren acusados procesos de salinización. Los
suelos dominantes en el Parque Natural son litosoles, xerosoles lúvicos, cálcicos, fluvisoles
calcáreos e inclusiones de regosoles calcáreos y fluvisoles calcáreos (Martínez Lirola et al,
1997).
Flora
En el ámbito del Parque, y en lo que al medio terrestre se refiere, se han citado alrededor de
1.000 taxones vegetales cormofíticos, a los que hay que añadir un número considerable de
talófitos reconocidos. En el medio marino existen tres especies fanerógamas y unas 260 de algas
(Martínez Lirola et al, 1997).
Las condiciones de extrema aridez y falta de precipitaciones, un sustrato predominantente
volcánico, y una influencia marina notable, han hecho de la flora de Cabo de Gata una de las más
notables de Europa. La vegetación, carente de estrato arbóreo de forma natural, se caracteriza por
la dominancia de palmitos (Chamaerops humilis) y de arbustos con fuertes adaptaciones a la
xericidad, como la cornicabra (Periploca laevigata). Por otra parte existen numerosos ejemplos
de especies de origen africano que en esta zona encuentran las únicas o las mejores poblaciones
europeas, como el azufaifo (Ziziphus lotus), gran arbusto pinchoso de las costas bajas y arenosas,
y por otra numerosos endemismos, algunos de ellos exclusivos, como el dragoncillo del Cabo
(Antirrhinum charidemi). Los fondos marinos están dominados por fondos blandos, ya sean de
arena, ya sean de praderas de fanerógamas marinas. La especie característica de estos fondos es
la Posidonia oceanica (Moreno Lampreave, 2001).
4
9. Fauna
Hasta el momento se ha descrito alrededor de 1.600 especies de invertebrados. Hay una rica
avifauna donde destacan aves migratorias como son el flamenco rosado (Phoenicopterus ruber),
o aves propias de la zona como es el halcón peregrino (Falco Peregrinus).
En el medio marino se conocen más de 1.350 especies marinas. Se encuentran algunos
grupos con una buena representación general, como en las algas, poliquetos, los moluscos y los
decápodos, mientras que en otros grupos es muy baja, como en distintos grupos de gusanos, en
pequeños crustáceos y en briozoos.
Entre los vertebrados, los peces forman el grupo más numeroso y diversificado; se han
citado unas 150 especies, donde destacan el salmonete de roca (Mullus surmulletus), la lecha
(Seriola dumerilii) y al mero (Epinephelus marginatus).
En reptiles, sólo se conocen dos especies, la tortuga boba (Caretta caretta) y la tortuga laúd
(Dermochelys coriacea).
Entre los cetáceos, destacan por su abundancia el delfín común (Delphinus delphis), el
delfín listado (Stenella coeruleoalba) y el delfín mular (Tursiops truncatus) (Moreno
Lampreave, 2001).
2.2. Monitorización: Concepto y aplicación
El monitoreo es una serie intermitente (regular o irregular) de observaciones en el tiempo,
llevado a cabo para mostrar la extensión de conformidad entre una formulación estándar o grado
de desviación y una norma esperada (Hellawell, 1991).
Esta definición de monitorización expone lo que se pretende conseguir en el caso particular
del Parque Natural Cabo de Gata. La monitorización del Parque Natural Cabo de Gata, es un
proyecto propuesto por la Oficina del Parque Natural Cabo de Gata-Níjar (Almería), la
Consejería de Medio Ambiente de la Junta de Andalucía y la Universidad de Almería en el
Convenio de Cooperación “Desarrollo rural y la sostenibilidad ambiental: diseño y ejecución de
programas de seguimiento”. Este sistema persigue como objetivo obtener información sobre el
parque en cuanto a su situación actual, variación en el tiempo y estado de sus ecosistemas,
mediante un seguimiento con imágenes de satélite, que permitan vigilar el parque y en caso de
actuar, facilitar la toma de decisiones (Oyonarte et al, 2008).
Como muestra la figura 2, la estructura de este proceso es sencilla, y se divide en tres
niveles. El primer nivel, que constituye la base del sistema es la recopilación de información en
distintos campos, como son la cartografía del parque, imágenes de satélite y datos climáticos
(precipitación o temperatura entre otras variables). A destacar en este paso, la información
procedente de las imágenes de satélite, que proporcionan información sobre la Productividad
Primaria Neta (PPN) en forma de índice verde de vegetación.
5
10. Figura 2. Estructura del sistema. Se muestran los 3 niveles en los que se ha diseñado el sistema de
monitoreo. Un primer nivel de adquisición de datos de distintas fuentes. Un segundo nivel de
almacenamiento de datos y un último nivel de análisis de resultados.
El segundo nivel consiste en almacenar los datos obtenidos en bases de datos. Las bases de
datos son almacenes que registran los datos, ofreciendo una estructura y presentación de fácil
compresión, de tal forma, que cualquier persona que acceda a una base de datos, sea capaz de
interpretar y hacer uso de estos datos.
El paso intermedio entre el segundo y tercer nivel, es un proceso reservado para la
generación de modelos, que a partir de los datos iniciales, permitan realizar estimaciones,
tendencias de los datos o encontrar anomalías. Estos resultados de los modelos se recogen en el
último nivel. Este nivel se encarga de analizar los resultados ofrecidos por los modelos con el fin
de facilitar la toma de decisiones.
Sin duda la información más importante dentro del sistema de monitoreo son las imágenes
de satélite, su origen y tratamiento resultan ser aspectos importantes en este paso. Las imágenes
proceden del sensor MODIS (Moderate Resolution Imaging Spectroradiometer), que se
encuentra en el satélite Terra. De los productos ofertados, se utiliza la serie temporal del EVI
(Enhanced Vegetation Index), que es un índice de vegetación obtenido de las imágenes de
satélite. La resolución que ofrecen las imágenes MODIS son suficientes para el trabajo que se
pretende llevar a cabo, pero sin duda, el hecho de que se puedan obtener las imágenes de forma
gratuita desde un servidor, favorece aún más esta elección, ya que uno de los objetivos del
sistemas monitoreo es que sea económico.
El índice EVI es uno de los más comunes calculados a partir de observaciones satelitales
para el seguimiento de la vegetación, y está directamente relacionado con el índice de área foliar
al basarse en la propiedad espectral de la vegetación verde de absorber diferencialmente la
radiación fotosintéticamente activa.
6
11. El sensor MODIS combina una resolución espacial media (tamaño de píxel <6 ha) y una
alta resolución temporal (frecuencia de observación prácticamente diaria), con procesos de
georeferenciación, correcciones atmosféricas y detección de nubosidad notablemente mejorados
respecto a los utilizados anteriormente por otros sensores (Oyonarte et al, 2008).
Otro aspecto a destacar en este sistema es la automatización en los procesos de obtención y
cálculo de información. Lo que se busca con la automatización, es hacer aún más sencillo y
económico este sistema de monitoreo, en donde un mínimo número de personas serían
necesarias para controlar este sistema. La automatización estará presente en los dos primeros
niveles, desde la adquisición y depuración de datos hasta la presentación de resultados, dejando
el último nivel a un personal encargado de analizar los resultados arrojados por el sistema.
En el caso de las imágenes de satélite, la automatización va encaminada a la obtención y
almacenamiento de estas imágenes. Por ello, se ha construido un modelo usando el software
ENVI, el cual se encarga de descargar las imágenes, a las que posteriormente aplica un filtro de
calidad, seleccionando aquellas imágenes que mejor calidad presenten. Finalmente, las imágenes
seleccionadas son almacenadas en una base de datos para su posterior uso.
2.3. Eficiencia en la utilización del agua de lluvia (RUE)
Aunque la tendencia de la degradación de suelos en zonas áridas no ha sido evaluada de una
forma local, recientemente han surgido metodologías que permiten estudiar, a un nivel local,
como se ven afectados los suelos por la degradación sobre todo en zonas áridas. El mayor
obstáculo para conocer la tendencia de la productividad de un suelo en zonas áridas, es la fuerte
dependencia de la productividad primaria neta sobre la lluvia, junto con la irregularidad de
precipitaciones anuales que presentan estas zonas en concreto. Estas metodologías pretenden
diferenciar los cambios producidos en la productividad primaria neta entre la actividad del
hombre y la lluvia. Un simple método para controlar el efecto de la lluvia es usando el índice
RUE (Rain Use Efficiency) y seguir su comportamiento a través de un periodo de tiempo.
Este índice relaciona la producción primaria neta (PPN) y la precipitación anual. Le
Houérou, in 1984, fue quien propuso este indicador como una forma útil de medir la
productividad de un ecosistema mediante un uso eficiente del agua en zonas áridas.
En general, el índice RUE tiende a decrecer espacialmente al aumentar la aridez y al
aumentar la evapotranspiración potencial (ETo), ambos parámetros están relacionados con el
balance hídrico de un ecosistema.
Para un ecosistema dado, varios estudios han demostrado un descenso del índice RUE al
producirse un aumento de la precipitación anual. Además, estos estudios sugieren que el índice
RUE se ve afectado por varios factores incluyendo la composición de la vegetación, la condición
del suelo y limitaciones biogeoquímicas (Yongfei Bai et al, 2008):
7
12. Aquellas comunidades con una mayor diversidad en especies vegetales y en grupos
funcionales presentan un mayor índice RUE a través de un aumento de la productividad
primaria neta (PPN) y una menor variabilidad temporal a través de una combinación de
factores de selección (comunidades con mayor diversidad de especies tienden a tener
mayor probabilidad de tener especies que sean más productivas) y factores
complementarios (comunidades más diversas tienden a ser más productivas ya que hay
un mayor uso de recursos y una mayor interacción sinérgica entre especies.
La convivencia con especies de plantas y grupos funcionales dominantes puede afectar
tanto a la productividad primaria neta como al índice RUE de forma importante. Por
ejemplo, las praderas dominadas por especies mesofíticas son más productivas y menos
variables que aquellas praderas dominadas por especies xerofíticas o arbustos.
La productividad primaria neta en ecosistemas áridos y semiáridos esta limitada por la
disponibilidad de nitrógeno, factor limitante junto con la disponibilidad de agua en estás
regiones. Es más, características del suelo como la textura, permeabilidad o grosor tienen
efectos importantes en el índice RUE.
Aunque la metodología basada en la RUE resulta bastante útil para valorar la productividad
de un ecosistema y también relacionad, la desertificación, este índice está limitado por otros
aspectos que no han recibido suficiente atención hasta el momento (Verón et al, 2006):
Por un lado esta la falta de un área de referencia. La desertificación es el resultado de la
comparación de una situación pasada con una situación actual. Sin una referencia pasada
que permita comparar la situación actual de una zona, los resultados referentes a la
desertificación pueden no ser correctos. Así pues, los cambios en la RUE en un
determinado sitio pueden ser indicadores para medir la desertización siempre que el área
de referencia no haya cambiado su estado. Por lo tanto, seleccionar un área de referencia
es un aspecto importante a tener en cuenta, como es el caso de áreas comparables a
Parques Naturales o áreas protegidas.
La desertificación no implica necesariamente una reducción en la Productividad Primaria
Neta. Algunos casos de desertificación no conllevan una reducción en la Productividad
Primaria Neta, lo cual convertiría la RUE en un indicador muy pobre.
El uso de este indicador en el Parque Natural de Cabo de Gata-Níjar, resulta ideal si
tenemos en cuenta las condiciones de aridez en las que se encuentra el Parque. La disponibilidad
de información de precipitación y PPN a una adecuada escala temporal y espacial permite
analizar y valorar el estado en el que se encuentran muchos ecosistemas. Con la información
recogida en las bases de datos, es posible construir el índice RUE para todo el Parque (Verón et
al, 2006).
3. OBJETIVOS
El objetivo de estas prácticas es llevar a cabo el diseño de un sistema de automatización que,
a partir de un información de entrada, lleve a cabo el cálculo del índice RUE (Rain Use
Efficiency) con el fin de analizar la productividad de los ecosistemas presentes en el Parque.
8
13. Se pretende así estudiar la tendencia de la RUE en los últimos años con el fin de conocer
como evolucionan los ecosistemas del Parque Natural y como se ven afectados por la acción del
hombre en los límites de este espacio protegido.
Como muestra la figura 3, el desarrollo de este trabajo se ha establecido por niveles, en los
que durante el periodo de prácticas, se pretende ir abordando y completando cada nivel. Por lo
tanto, el objetivo final de este periodo de prácticas no es el de obtener unos resultados definitivos
con este proyecto, si no el de desarrollar un proceso automático dentro del sistema de monitoreo
del Parque, con ayuda de conocimientos adquiridos en Sistemas de Información geográfica y
teledetección.
El índice RUE es una relación entre la productividad primaria neta y la precipitación anual.
En el caso de la productividad primaria neta, la información viene proporcionada por las
imágenes de satélite ofrecidas por el sensor MODIS en forma de índices de vegetación. La
precipitación anual viene proporcionada por las estaciones meteorológicas situadas dentro o en
las proximidades del Parque Natural. Por un lado, se desea automatizar un proceso que se
encargue de extraer la información de índice verde de las imágenes de satélite. Por otro lado, el
proceso de automatización se debe encargar extraer los datos de precipitación, depurarlos y
convertirlos de datos puntuales a datos continuos, obteniendo mapas de precipitación para el
Parque. Finalmente, se superpondrán las imágenes de satélite y los mapas de precipitación, de tal
forma que se obtenga un mapa resultante donde en cada celda se recoja un valor RUE resultante
de la relación entre índice verde y precipitación.
Para que la superposición de ambos mapas (índice verde y precipitación) encaje de forma
adecuada, hay que tener en cuenta la escala en la que se encuentran ambos mapas. Las imágenes
de satélite del sensor MODIS presentan una resolución espacial de 250 metros y una resolución
temporal de 16 días. Los mapas de precipitación se construyen usando un modelo digital de
elevaciones que posee una resolución espacial de 20 metros. Por otro lado, la escala temporal de
las estaciones meteorológicas es mensual. Por lo tanto, se ajustará la escala espacial a 250 metros
y la temporal a mensual.
Aunque para el cálculo del índice RUE es necesario la variable climática de precipitación, el
proceso de automatización generará mapas también de otras variables climáticas (Temperatura
media, temperatura máxima, etc.), ya que pueden ser útiles en el análisis de otros índices de
estudio.
Sin embargo, dado que esta fase del proyecto esta aún en desarrollo, en principio se hará uso
de una sola variable climática, la precipitación, y de esta forma se observara que resultados se
obtienen en cada nivel de sistema. Una vez desarrollado un proceso definitivo de automatización
para cada nivel del sistema, que se encargue de la homogeneización y modelización de los datos,
entonces se incluirán las restantes variables climáticas.
9
14. Figura 3. Diagrama con el diseño del proceso de obtención de mapas del índice RUE.
4. MATERIAL
En el plano práctico de este trabajo, se destaca el uso de distintos programas software para
realizar distintas tareas a lo largo del diseño del proceso de automatización. El software utilizado
es el siguiente:
EXCEL – Herramienta de cálculo cuyo uso se da principalmente en el proceso de
homogeneización de datos y con el que se ha llevado a cabo una depuración, ordenación y
almacenamiento de datos climáticos.
10
15. SPSS – Potente programa estadístico con el que se ha llevado a cabo el análisis de modelos
de regresión calculados para toda la serie temporal del estudio, el análisis de los índices
estadísticos correspondientes a cada modelo de regresión y el cálculo de matrices de correlación
para el proceso de homogeneización de datos de entrada.
ARCGIS – Como herramienta de análisis espacial, su uso ha permitido analizar el modelo
digital de elevaciones del área de estudio y realizar estimaciones climáticas mediante mapas
climáticos con modelos de regresión generados con el software SPSS.
ENVI – Herramienta para el procesamiento de imágenes. Gracias a este software es posible
visualizar y analizar los mapas climáticos generados en el proceso de interpolación climática.
R – lenguaje de programación dedicado al cálculo estadístico. Destaca por su sencillez,
robustez y amplia variedad de recursos en distintas temáticas científicas. Gracias a este lenguaje
ha sido posible desarrollar un proceso de automatización que toma datos climáticos y genera,
mediante método de interpolación, mapas climáticos. El uso de librerías es esencial para poder
llevar a cabo un trabajo de este estilo. Las librerías utilizadas han sido las siguientes:
Librería “MASS” – Permite llevar a cabo operaciones estadísticas complejas como por
ejemplo regresión por pasos (o también conocida como Stepwise) mediante la orden
stepAIC usando como criterio para discriminar variables el criterio de Akaike.
Librería “rgdal” – Lleva a cabo operaciones de proyección y transformación. Puede
asignar una proyección espacial a puntos o matrices y de esta forma conocer su posición
mediante coordenadas.
Librería “qpcR” – Realiza ajuste de modelos y selección de modelos más adecuados.
Dentro de las diferentes funciones, posee la función para obtener el índice estadístico R
cuadrado ajustado.
Librería “gstat” – Esta librería ha sido seleccionada por llevar a cabo modelos
geoestadísticos. Entre sus funciones están la modelización de variogramas, o la
posibilidad de aplicar distintos tipos de krigeado (simple, ordinario o universal).
Librería “caTools” – Entre sus funciones, las que son de interés en este trabajo son la de
importar y/o exportar los datos calculados en el proceso de automatización a archivos que
puede ser visualizados en el software ENVI.
Librería “matlab” – Esta librería permite emular el código MATLAB y de esta forma
realizar operaciones con matrices y generar gráficos.
5. METODOLOGÍA
5.1. Datos climáticos
El punto de partida de este trabajo son los datos procedentes de las estaciones
meteorológicas. El trabajo con este tipo de datos es el paso más importante ya que establece las
bases de la estructura de todo el trabajo en conjunto. Sin el correcto tratamiento de los datos en
esta fase, no servirá de nada continuar en el trabajo ya que los resultados que se obtendrán serán
erróneos.
11
16. En primer lugar, es necesario conocer las estaciones meteorológicas disponibles dentro del
Parque Natural o próximas a los límites de éste y que puedan aportar datos climáticos en un
registro temporal lo suficientemente amplio como para poder conocer la tendencia de los datos
en el tiempo. Como muestra la figura 4, contamos con un total de 10 estaciones que cumplen el
requisito de localización. Hay que indicar que las estaciones pertenecen a distintas instituciones,
por lo que es algo a tener en cuenta, ya que aunque todas registran las mismas variables
climáticas, lo hacen en distintas escalas temporales, por lo que es algo que es necesario conocer
antes de recoger los datos.
Figura 4. Localización de las estaciones meteorológicas de partida.
Las estaciones vienen recogidas en tablas donde cada columna corresponde a una
característica de la estación (WMO, 2003):
Nombre – Nombre de la estación. Hace referencia a la ciudad o municipio donde se
encuentra. El nombre debe ser claro y no dejar duda a sitio pertenece. Si hay más de una estación
en la ciudad o municipio, es necesario incluir una referencia para indicar a donde pertenece en
concreto (por ejemplo “Almería Aeropuerto”). En otros casos, se puede utilizar los puntos
cardinales.
Código – Es el código o número de la estación. La Organización Mundial de Meteorología
(WMO) identifica aquellas estaciones que intercambian información a nivel internacional con un
código de 5 dígitos. Los dos primeros dígitos hacen referencia a la región en el planeta y el país
donde se encuentra la estación. Sin embargo, no todas las estaciones meteorológicas tienen un
código asignado por la Organización Mundial de Meteorología. Estas estaciones presentan un
código que las identifican a un nivel nacional, regional o provincial.
12
17. Altitud – Indica la elevación sobre el nivel del mar.
Coordenadas X e Y – Hacen referencia a la longitud y latitud. Se puede presentar en forma
de minutos y segundos o en formato decimal. La precisión de la localización debe ser tal que se
encuentre en un radio de unos varios cientos de metros. Por último, con el fin de aclarar la
localización de la estación en caso de exportar la información a observadores que no conocen la
estación, se debe indicar el hemisferio donde se encuentra la estación, así como indicar la
longitud norte o sur y las latitudes este u oeste. En este caso, las coordenadas se presentan en
formato decimal, georreferenciadas al sistema de coordenadas UTM 30N y transformadas al
datum ED50.
Provincia – Nombre de la provincia a la que pertenecen las estaciones.
La clasificación de las estaciones es la siguiente:
- Estaciones meteorológicas del Instituto Nacional de Meteorología (INM). Como se aprecia
en la tabla 1, son 6 estaciones y recogen los datos de cada variable climática de forma mensual.
Tiene un código asignado por la Organización Mundial de Meteorología (WMO).
Tabla 1. Características de las estaciones del Instituto Nacional de Meteorología.
Nombre Código Altitud (metros) Coord. X Coord. Y Provincia
Almería 6325O 20 554563 4077703 Almería
Aeropuerto
Níjar 6327 356 570795 4091537 Almería
Michelín 6328N 50 571059 4074743 Almería
Cabo de Gata 6329 41 572307 4064892 Almería
Mesa Roldán 6332 202 597535 4088967 Almería
Carboneras 6332I 41 597706 4093438 Almería
Las variables recogidas por estas estaciones son:
Precipitación total mensual, Precipitación máxima diaria mensual, Primer día de la
precipitación máxima, Días de lluvia, días de tormenta, Días de rocío, Días de
precipitación apreciable, Días con precipitación mayor o igual a 10 décimas, Días con
precipitación mayor o igual a 100 décimas, Días con precipitación mayor o igual 300
décimas.
Temperatura máxima absoluta mensual, Primer día de la temperatura máxima absoluta,
Media mensual de la temperatura máxima diaria, Temperatura máxima de las mínimas,
Días de temperatura máxima >=25°C, Días de temperatura máxima >=30°C,
Temperatura mínima absoluta mensual, Primer día de la temperatura mínima absoluta,
Media mensual de la temperatura mínima diaria, Temperatura mínima de las máximas,
Días de temperatura mínima <=0°C (días de helada), Días de temperatura mínima
>=20°C (noches tropicales), Temperatura media mensual.
- Estación de la Consejería de agricultura y pesca de la Junta de Andalucía. En este
caso, se dispone de una única estación (tabla 2). Estas estaciones recogen los datos de forma
diaria.
13
18. Tabla 2. Características de la estación de la Consejería de agricultura.
Nombre Código Altitud (metros) Coord.X Coord.Y Provincia
Níjar CAP - 183 575091 4089921 Almería
Las variables recogidas por esta estación son:
Precipitación total mensual, Precipitación máxima diaria mensual, Precipitación mayor o
igual a 10 décimas, Días de precipitación. Evapotranspiración potencial.
Media mensual de la temperatura máxima diaria, Temperatura máxima absoluta, Día del
mes con temperatura máxima, Temperatura máxima de las mínimas, Días de temperatura
máxima >=25°C, Días de temperatura máxima >=30°C, Media mensual de la temperatura
mínima diaria, Temperatura mínima absoluta, Día del mes con temperatura mínima, Días
de temperatura mínima <=0°C, Días de temperatura mínima >=20°C, Temperatura media
mensual, Radiación neta.
- Estaciones de la Universidad de Almería. Son 3 estaciones, localizadas dentro del
Parque Natural. Recogen los datos cada media hora. Estas estaciones, de tipo experimental,
carecen de código.
Tabla 3. Características de las estaciones de la Universidad de Almería.
Nombre Código Altitud Coord. X Coord. Y Provincia
(metros)
Cuenca Paraíso - 266 582488 4076687 Almería
Balsablanca - 200 586118 4088863 Almería
Amoladeras - 59 566860 4076797 Almería
Las variables recogidas por estas estaciones son:
Temperatura media, Humedad relativa, Velocidad del viento, Dirección del viento,
Precipitación media, Radiación global, Radiación neta, Radiación fotosinteticamente
activa.
5.2. Homogeneización de los datos
Una vez que disponemos de los datos de todas las estaciones, hay que analizar los registros
para conocer las fechas de inicio y final de registro de datos, periodicidad con que se registran
los datos o ausencia de datos en el registro. Antes de comenzar con este tratamiento de
homogeneización de datos, conviene establecer una serie de criterios de calidad con el fin de
obtener una buena corrección de los datos.
5.2.1. Escala temporal
Como ya se ha comentado, cada institución ha programado sus estaciones para que registren
los datos a distinta escala temporal. Las estaciones del Instituto Nacional de Meteorología (INM)
presentan un registro mensual de los datos. Dado que no conviene en este caso reducir la escala
temporal, ya que los datos resultantes no serian correctos, la escala temporal de un mes será con
la que se trabajará.
14
19. La transformación para el resto de las estaciones será la siguiente:
Para las estaciones de la Consejería de agricultura y pesca de la Junta de Andalucía, se
transformarán los datos de día a mes.
Para las estaciones de la universidad de Almería, se transformarán los datos registrados
cada media hora a día. Una vez hecho, se hará una segunda transformación de los datos
de día a mes.
5.2.2. Inicio y final de la serie temporal
El siguiente paso es el de conocer la serie temporal con la que se trabajará. El final de
registro será la fecha en la que todas las estaciones hayan registrado los datos, en este caso será
Mayo del año 2009. En el caso del comienzo de registro, no es tan claro, ya que algunas
estaciones llevan operativas décadas mientras que otras comenzaron a registrar datos hace menos
de un década. Así pues, se estableció como inicio de la serie temporal Enero del año 2004, ya
que a partir de ese año, todas las estaciones han hecho un registro de los datos.
Por otro lado, será necesario actualizar los datos de aquellas estaciones para las que no se
tengan registros de los últimos años. En el caso de las estaciones del Instituto Nacional de
Meteorología, los datos del último registro corresponden al año 2006, por lo que se incluirán los
datos climáticos para los años 2007, 2008 y 2009. Para las estaciones de la Consejería de
agricultura y pesca se actualizarán los datos desde el año 2007 hasta el año 2009.
5.2.3. Ausencia de datos
Por diversas razones, las estaciones pueden dejar de registrar dando lugar a vacíos en los
datos de registro. Esta falta de operatividad de las estaciones puede deberse a distintos motivos
como puede ser la relocalización de una estación a otro punto o bien por encontrarse expuestos
los instrumentos de medida al medio externo pueden quedar inutilizados. En otros casos, aún
funcionando de forma correcta el instrumento de medida, la lectura no es correcta. Esto puede
darse por ejemplo en días donde la precipitación es muy débil y por lo tanto el pluviómetro no es
capaz de registrar la cantidad de lluvia para ese día. En cualquier caso, es necesario conocer
como tratar estos datos ausentes ya que se trata de un problema bastante común (WMO, 2003).
Para poder completar aquellos huecos presentes en toda la serie temporal es necesario
conocer cual es el nivel de ausencia de datos en cada estación. Si la ausencia de datos es baja
para una estación, es posible completar los registros vacíos con ayuda de las estaciones vecinas.
Pero si, la ausencia de datos es muy grande, de ninguna forma se podrá hacer una estimación con
ayuda de estaciones vecinas, ya que en estos casos no se obtendrían datos fiables de
precipitación. Así pues, si la ausencia de datos en una estación es menor al 30%, se hará una
estimación de la precipitación para los datos ausentes. Aquellas estaciones con una ausencia de
datos mayor al 30% se desechan y no se tienen en cuenta.
Como se puede observar en el anexo, se recogen los datos mensuales de precipitación de
cada estación meteorológica para toda la serie temporal, desde el año 2004 hasta el año 2009.
Las estaciones experimentales de la Universidad de Almería (Cuenca Paraíso, Balsablanca y
Amoladeras) no registraron valores de precipitación en casi todos los meses de toda la serie
temporal. Esto supone una ausencia de datos superior al 30%, por lo que se descartaron estas tres
estaciones. Por otro lado, las otras 7 estaciones, solo presentan ausencia de datos a partir del año
15
20. 2007 y sólo en algunos meses, por lo que en este caso si es posible hacer un tratamiento para
completar los datos ausentes con ayuda de las estaciones vecinas.
El método utilizado para completar los datos ausentes es mediante una matriz de
correlación. Una matriz de correlación es una tabla de doble entrada con una lista multivariable
horizontal y la misma lista en disposición vertical. En cada celda se muestra el coeficiente de
correlación r, indicando dependencia entre pareja de variables. El intervalo en el que se mueve
el valor de r es entre 0 y 1, por lo que, cuanto mayor sea el coeficiente de correlación, mayor será
la correlación entre las variables.
Tomando como ejemplo el dato ausente en el mes de enero en el año 2007 para la estación
de Carboneras, como se aprecia en la tabla 4.
Tabla 4. Datos de precipitación para el mes de enero en el año 2007. Ausencia de registro de
precipitación para la estación de Carboneras.
Estación Precipitación
Enero
Carboneras -
Mesa Roldán 35,2
Cabo de Gata 14
Michelín 33,5
Níjar 55,5
Almería 'Aeropuerto' 35,2
Níjar CAP 53,6
La matriz de correlación se recoge en la tabla 5. Como se aprecia, hay una doble entrada,
por un lado se encuentra la estación de Carboneras en disposición horizontal. En disposición
vertical se encuentran las restantes estaciones meteorológicas con sus respectivos valores de
correlación con respecto a la estación de Carboneras.
Tabla 5. Matriz de correlación entre la estación de Carboneras y las restantes estaciones.
Carboneras
Carboneras -
Mesa Roldán 0.785
Cabo de Gata 0.669
Michelín 0.712
Níjar 0.803
Almería “Aeropuerto” 0.744
Níjar CAP -0.146
En este caso Níjar es la estación con mayor correlación con la estación de Carboneras. La
estimación del dato de precipitación para la estación de Carboneras se hace mediante una
ecuación lineal de tipo “Y = a*X + b” donde “Y” es la variable dependiente (la estación de
Carboneras en este caso). “X” es la variable independiente (la estación de Níjar), “a” es la
pendiente y “b” la constante. A partir del valor de precipitación de la estación de Níjar se estima
el valor de precipitación para la estación de Carboneras como se muestra en la tabla 6.
16
21. Tabla 6. Datos de precipitación para todas las estaciones, incluida Carboneras, a la que se ha obtenido su
valor tras aplicar la matriz de correlación.
Estación Precipitación
Enero
Carboneras 31,5
Mesa Roldán 35,2
Cabo De Gata 14
Michelín 33,5
Níjar 55,5
Almería 'Aeropuerto' 35,2
Níjar CAP 53,6
Este método se repetirá para todos aquellos meses que no tienen registrado un valor de
precipitación.
Tras aplicar todos los criterios de homogeneización, el volumen inicial de datos con el que
se cuenta, se reduce drásticamente. Se reduce la serie temporal, contando con datos desde el año
2004 hasta el año 2009, se reduce el número de variables climáticas, contando únicamente con la
precipitación y se reduce el número de estaciones, de las 10 estaciones iniciales a las 7 estaciones
finales. La tabla 7 muestra las características de las estaciones que se utilizarán a partir de ahora
y la figura 5 muestra la localización de cada estación.
Sin embargo, hay que matizar que a partir del año 2008, solo se contará con 6 estaciones ya
que, la estación de Carboneras dejó de ser operativa para ese año. Para evitar trabajar con tan
pocas estaciones, se pretende recuperar las estaciones experimentales de la universidad de
Almería en un periodo de tiempo a corto plazo con el objetivo que proporcionen datos
climáticos a la serie temporal y sustituyan a la estación de Carboneras. Por otro lado, la presencia
de estas estaciones favorecería la distribución espacial de los datos puntuales. A continuación se
muestran los datos de las estaciones que se utilizarán en el siguiente nivel.
Tabla 7. Estaciones meteorológicas resultantes tras el proceso de homogeneización.
Nombre Código Altitud (metros) Coord. X Coord. Y Provincia
Almería 6325O 20 554563 4077703 Almería
Aeropuerto
Níjar 6327 356 570795 4091537 Almería
Michelín 6328N 50 571059 4074743 Almería
Cabo de Gata 6329 41 572307 4064892 Almería
Mesa Roldán 6332 202 597535 4088967 Almería
Carboneras 6332I 41 597706 4093438 Almería
Níjar CAP - 183 575091 4089921 Almería
17
22. Los datos de precipitación obtenidos tras el proceso de homogeneización se muestran en el
anexo.
Figura 5. Localización de las estaciones tras el proceso de homogeneización.
5.3. Estructura base de datos climáticos
Una vez depurada la información inicial y obtener los datos útiles con los que se va a
trabajar, hay que diseñar la estructura de la base de datos donde se almacenarán estos datos
depurados. Hay que tener en cuenta que el sistema de seguimiento va a estar automatizado, por
lo que todos los niveles deben encajarse de forma perfecta, y en este caso, esa conexión entre el
nivel de almacenamiento de información en base de datos e nivel de modelización de los datos,
implica que la estructura de la base de datos sea sencilla y clara, ya que el modelo necesitará
importar los datos desde estas bases de datos para poder ejecutarse de forma correcta.
Dado que el diseño de cada fase no es aún definitivo, en principio se tomará como base de
datos el software EXCEL.
La base de datos consistirá en un archivo EXCEL, donde cada hoja corresponde a un año,
así pues, habrá 6 hojas, desde el año 2004 hasta el año 2009 (figura 6).
18
23. Figura 6. Estructura de la base de datos.
Dentro de cada hoja, los datos se estructuran por columnas. Las primeras 5 columnas
contienen información referente a la identificación y localización de las estaciones
meteorológicas.
Código Estación Longitud Latitud Altitud
Donde la columna de “Código” hace referencia al código de identificación de la estación
meteorológica y la columna “Estación” contiene el nombre de la estación.
Las siguientes columnas contienen datos de precipitación para cada mes, desde el mes de
Enero hasta el mes de Diciembre. Hay una última columna que contiene los datos anuales de
precipitación.
Enero Febrero Marzo ... Noviembre Diciembre Anual
5.4. Modelización de variables climáticas
Un modelo se define como la representación gráfica, matemática, física, verbal o una
versión simplificada de un concepto, fenómeno, relación, estructura, sistema o aspecto del
mundo real. Los objetivos de un modelo incluyen: (1) facilitar la comprensión de lo que se
pretende modelizar eliminando los componentes innecesarios, (2) ayudar en la toma de
decisiones con escenarios simulados, (3) explicar, controlar y predecir los eventos en base de
observaciones pasadas. Ya que muchos objetos y fenómenos son muy complicados (al estar
compuestos de muchas partes) y demasiado complejos (al estar esas partes intercomunicadas)
para comprenderlos en su totalidad, un modelo contiene solo aquellas características que de
primaria importancia para el propósito al que esta diseñado el modelo.
Modelizar una variable climática reporta una gran cantidad de información para proyecto en
el que se trabaje, sin embargo, es necesario tratar una serie de aspectos si se desea que los
resultados obtenidos de la estimación de una variable climática sean coherentes. Por un lado, esta
el problema de la disponibilidad de información climática en una zona determinada. Esto se debe
a la distribución espacial de carácter heterogéneo de las estaciones meteorológicas. Las zonas
llanas o de carácter agrícola suelen presentar más estaciones que las zonas de montaña. Por otro
lado, los datos proporcionados por las estaciones meteorológicas son de carácter puntual, por lo
que es importante que las series de datos proporcionados por las estaciones meteorológicas sean
19
24. depuradas antes de aplicar técnicas de interpolación para plasmar la variable climática en el
espacio.
La escala de trabajo en estos casos es otro aspecto importante a tener en cuenta. El clima es
el resultado de un conjunto de variables, pero dependiendo a la escala que nos encontremos no
todas las variables tendrán el mismo peso. Por ejemplo, una variable como es la distancia a
mares y océanos, a una escala regional tendrá más peso y explicará mejor el comportamiento del
clima que a una escala local donde un área pequeña como un parque natural no sería suficiente
para abarcar una variable climática de esa magnitud. Es por ello que, es necesario conocer la
zona de trabajo y comprobar que variables climáticas tienen una mayor influencia.
5.4.1. Variables dependientes
El objetivo principal en este nivel del sistema es desarrollar una serie de mapas mediante
interpolación que tenga en cuenta las variables climáticas geográficas y que permitan modelar
variables como temperatura máxima, mínima o la precipitación. Sin embargo, dado que esta fase
se encuentra en desarrollo, el análisis y diseño del modelo estará basado en una sola variable que
será la precipitación. Por lo tanto, la precipitación será la variable dependiente y a partir de los
datos depurados en el nivel anterior, se modelizará la precipitación mensual y anual.
5.4.2. Variables independientes
Las variables seleccionadas en este caso son la Latitud, Longitud y Altitud. Seleccionar
estas variables viene dado por varias razones. El uso de modelos climáticos para estudiar y
pronosticar el comportamiento del clima en la península ibérica ha demostrado que estas tres
variables explican de una forma importante la distribución espacial del clima, sobre todo la
altitud y la longitud como indican Ninyerola y Pons (2000) en su trabajo sobre la modelización
de variables climáticas.
En el caso de la altitud, esta demostrado que es una variable directamente relacionada con la
distribución de las lluvias. La altitud respecto al nivel del mar influye en el mayor o menor
calentamiento de las masas de aire. Un aumento de la altitud favorece el enfriamiento de las
masas de aire, favoreciendo la precipitación. Por lo que hay una relación directa entre la
precipitación y la altitud.
La longitud explica el comportamiento de la precipitación debido a la disposición SW-NE
de la orografía andaluza. Esta disposición del relieve determina que haya una gran influencia del
océano atlántico que encuentra su entrada por el valle del Guadalquivir, canalizándose al interior
con ayuda de los vientos W y SW. La trascendencia biogeográfica de las alineaciones
topográficas (Sistema Ibérico y Cordilleras Béticas), en su sector oriental, se deja sentir
negativamente con respecto a los flujos húmedos superficiales procedentes del océano,
sometiéndolos a un intenso efecto “foehn”, lo que se traduce en un debilitamiento de la
influencia atlántica con lluvias débiles en la provincia de Almería (Pita, 2003). Por el contrario,
La influencia mediterránea queda reducida a un ámbito costero pero en el caso de Almería
alcanza un cierto desarrollo y amplitud en la zona de levante de la provincia. Los vientos de
levante originarios del Mediterráneo, actúan en este flanco oriental con ascensionalidad,
detención y precipitaciones (Capel, 1995).
20
25. La latitud determina la localización de los centros de acción que dan origen a los vientos:
anticiclones (centros de altas presiones) y ciclones (áreas de baja presión o depresiones). Los
anticiclones son áreas de alta presión, donde el aire desciende de cierta altura por ser frío y seco
(el aire frío y seco es más pesado que el cálido y húmedo). Esto tendrá una importancia
significativa en la precipitación del área de estudio. La latitud nos aproxima a la variabilidad
generada por la circulación atmosférica (Ninyerola & Pons, 2000).
Otra razón por la que se tienen en cuenta estas tres variables es su disponibilidad. Por
tratarse de un área no muy extensa, con tan pocas estaciones, es difícil obtener datos de variables
como podrían ser la orientación o la nubosidad. Sin embargo, un modelo digital de elevaciones
recoge datos para la longitud, latitud y altitud para toda el área sin importar la escala de trabajo.
Así pues, los datos para las tres variables independientes vienen dados por el modelo digital de
elevaciones que proporciona la Consejería de Medio Ambiente de la Junta de Andalucía (figura
7). Este modelo digital de elevación presenta una resolución espacial de 20 metros. Las
dimensiones del modelo digital de elevaciones son: 2190 filas y 2282 columnas.
Figura 7. Vista general del modelo digital de elevaciones del Parque Natural del Cabo de Gata-Níjar
(Almería).
5.4.3. Métodos de interpolación
La interpolación es una conversión que transforma datos puntuales a superficies continuas a
través de estimación de valores en puntos espaciales donde no hay datos medidos de una variable
climática. La interpolación se trata así de un proceso estadístico conocido como estadística
espacial.
21
26. La interpolación toma información procedente de puntos que quedan fuera del área de
estudio previamente definida, ampliando el área donde pondremos en práctica los métodos de
interpolación elegidos con objeto de mejorar la calidad final de la cartografía de nuestra área de
estudio.
Obviamente, cuanto mayor sea el número de datos puntuales, mejor será la transformación a
una superficie continúa. Sin embargo, en este proyecto, se cuenta únicamente con 7 estaciones
meteorológicas para todo el Parque Natural. Además la distribución de las estaciones no es muy
propicia ya que encontramos una concentración de estaciones al oeste del Parque Natural y otra
concentración al Este (figura 8). Esta concentración puede afectar a la estimación de los datos de
precipitación, favoreciendo la estimación para la zona este y oeste del Parque Natural, mientras
que la zona central del parque presentaría una peor estimación. Estos dos aspectos limitan el
proceso de interpolación, por lo que habrá que ver los resultados de la interpolación para
comprobar si los resultados son coherentes.
Figura 8. Como se aprecia en la imagen, la distribución no es homogénea por todo el Parque Natural,
sino que se pueden apreciar agrupaciones que pueden afectar al proceso de interpolación en la zona oeste
y este del Parque Natural.
Se utilizarán dos métodos de interpolación: Modelos de regresión y métodos geoestadísticos
(krigeado).
El método de interpolación principal será el modelo de regresión ya que por el reducido
número de estaciones con el que trabajamos, el modelo de regresión ofrece una mejor estimación
de la precipitación que el krigeado.
22
27. El modelo de regresión se construye a partir de las tres variables independientes (Latitud,
Longitud y Altitud), generando una ecuación que se ajusta a los datos de precipitación y de esta
forma permite generar mapas de precipitación mensuales y anuales. No en todos los casos las
tres variables independientes tienen la misma influencia en el reparto espacial de las
precipitaciones. Por lo tanto, hay que elegir las variables que mejor estimen la precipitación.
Una vez que se tiene la ecuación del modelo de regresión, se aplicará al modelo digital de
elevaciones de tal forma que se podrá hacer una estimación de la precipitación para cada
coordenada del mapa. Dado que el modelo digital de elevaciones, es simplemente una matriz en
la que cada celda contiene valores de longitud, latitud y altitud, la interpolación consistirá en
desplazar la ecuación a cada celda con el fin de calcular el valor de precipitación en cada celda.
Debido a las características del modelo digital de elevaciones, hay celdas de la matriz que no
contienen valores de las tres variables. En estos casos, no se producirá un valor de precipitación
en estas celdas (figura 9).
Figura 9. El modelo digital de elevaciones (MDE) es una matriz de 2190 filas y 2282 columnas. Las
celdas pertenecientes al MDE contienen valores de las variables de latitud, longitud y altitud. Las celdas
de la matriz que no corresponden al MDE no contienen valores.
En aquellos casos en los que las tres variables no sean capaces de ofrecer un buen ajuste a
los datos, se descartará usar una ecuación de regresión múltiple para interpolar y se utilizará el
método de interpolación krigeado.
El krigeado es un método de regresión aplicado en la estimación/interpolación de datos
espacialmente localizados o correlacionados. Hay una serie de características que separa este
método de otros relacionados como son las superficies de tendencia o técnicas más clásicas. En
primer lugar, las localizaciones de las muestras reflejan información importante o una aparente
correlación espacial cuantificable en términos de distancia y dirección. Las muestras que se
23
28. encuentran más próximas se esperan que sean más parecidas que las que se encuentran más
alejadas. El volumen o área de la muestra es igualmente un aspecto importante y muestra la
existencia de un pequeño intervalo sin homogeneidad (Myers, 1992).
El krigeado consiste en tres pasos: (1) un examen de la covarianza de los datos dependiendo
de sus distancias; (2) ajuste teórico de los datos; y (3) uso de estos modelos para calcular los
pesos para un conjunto de puntos vecinos y así determinar el valor interpolado. El primer paso se
realiza mediante el cálculo de un semivariograma. Todos los posibles pares de puntos son
examinados, los pares son agrupados por distancia y por último se representan los datos
gráficamente donde el eje Y muestra la varianza de los diferentes valores mientras que el eje X
muestra la distancia. En el segundo paso, se ajusta el variograma a los puntos considerados
mediante varias técnicas pero la mejor es mediante un método de validación cruzada. En el
último paso, este modelo generado determina los pesos utilizados por cada punto para calcular
los valores interpolados (Phillips et al, 1991).
Figura 10. Ejemplo de un gráfico un variograma. El gráfico representa la varianza estimada para cada
punto frente a la distancia estimada entre los puntos.
Dentro del krigeado existe distintos tipos: ordinario, simple, universal y cokriging. La
diferencia entre estos métodos radica en como se calculan los pesos, que se asignan a los puntos
muestrales, necesarios para realizar la interpolación.
Hay que tener cuenta que la complejidad de la distribución de la precipitación debido a la
orografía puede traducirse en heterogeneidad y anisotropía, lo que puede ser un inconveniente a
la hora de representar mediante un krigeado ordinario.
Por último, comentar que en regiones con una densidad pobre de datos, para cualquier
método de interpolación, incluso para un método tan sofisticado como es el krigeado, pueden
sufrir pérdida de información (Prudhomme & Reed, 1999) y la estimación no es tan precisa
como se espera.
24
29. 5.5. Automatización del modelo de interpolación de variables climáticas
Uno de los aspectos que se persigue con el sistema de monitoreo es que sea capaz de
realizar todo el proceso, desde la adquisición de información y su tratamiento hasta la
exportación de resultados de forma automática. En el caso de la interpolación de los datos
climáticos, dado que se trata de una serie temporal, el proceso es repetitivo, es decir, se va a
aplicar una transformación de datos puntuales a datos continuos a cada mes de cada año. De
forma manual, este proceso puede resultar muy tedioso, dado que sería generar muchos
resultados y significaría mucho tiempo. Por eso, la automatización por un lado busca evitar la
tarea realizara por operadores humanos y por otro lado se busca reducir el tiempo en la obtención
de resultados.
5.5.1. Estructura del proceso de automatización
A la hora de diseñar un proceso de automatización hay que tener presente que debe ser
rápido y eficaz, proporcionando la información que se necesita. Por ello, es necesario analizar y
diseñar una estructura básica del proceso.
Como se puede apreciar en la figura 10, el proceso se divide a grandes rasgos en tres
niveles. El primer nivel, empieza con una importación de los datos climáticos. Una vez depurado
los datos climáticos y almacenados en la base de datos, el proceso de automatización debe
importar las tablas de toda la serie temporal de la base de datos. A continuación, se llevará a
cabo, con los datos importados, una interpolación climática usando los dos métodos comentados
anteriormente: modelos de regresión múltiple y métodos geoestadísticos, entre los que se
encuentran el krigeado. Por último, una vez obtenidos los mapas de interpolación de una variable
climática, estos se exportan a otra base de datos.
Figura 10. Diseño inicial del proceso de automatización.
25
30. 5.5.2. Automatización en la importación de datos climáticos
Ya se ha comentado que la base de datos de las variables climáticas (en este caso, de
momento solo tratamos una sola variable climática que es la precipitación), es un archivo
EXCEL, formado por 6 hojas. Cada hoja corresponde a un año de la serie temporal 2004-2009, y
dentro de cada hoja se encuentra información sobre la localización de las estaciones
meteorológicas y los datos de precipitación mensual y anual registrados por cada estación. Por lo
tanto, el proceso de automatización debe ser capaz de reconocer una base de datos de este tipo.
El objetivo en este nivel es el de analizar cada hoja de la base de datos.
Como se aprecia en el diagrama de la figura 11, este análisis se lleva a cabo mediante dos
bucles. Un primer bucle se encargará de identificar cada año de la serie temporal. Una vez
identificado un año, empezará otro bucle que se encargará de leer los datos de precipitación
mensual y anual para ese año en cuestión.
Figura 11. Diagrama del funcionamiento de la importación de datos.
Como se aprecia en la figura 12 en forma de pseudocódigo, la implementación de estos
bucles en el lenguaje de programación R, será mediante bucles “For”. Los bucles de tipo “For”
se caracterizan por ser más rápidos, en los cálculos de tipo repetitivo, que otros bucles de tarea
repetitiva como pueden ser los bucles “while”.
Figura 12. Pseudocódigo para la lectura de los datos de precipitación en la base de datos.
26
31. 5.5.3. Automatización en el proceso de interpolación climática
Una vez que se tienen los datos de precipitación comienza la segunda fase en la que se
transformarán los datos puntuales de precipitación a datos de tipo continuo en forma de mapa.
Este nivel es probablemente el más complejo, en donde se incluyen una serie de subniveles
encargados de hacer tareas específicas dentro del proceso de automatización. Estos subniveles
son:
Subnivel 1: Cálculo de un modelo inicial de regresión múltiple con las tres variables
independientes (latitud, longitud y altitud), y cálculo de índices estadísticos.
Subnivel 2: Clasificación del tipo de interpolación según un criterio basado en un índice
estadístico y aplicación de una regresión por pasos para obtener un segundo modelo con
mejor ajuste.
Subnivel 3: Almacenamiento de los coeficientes asociados a las variables asociadas al
segundo modelo.
Subnivel 4: Interpolación de los datos climáticos usando el segundo modelo.
Subnivel 1 – Cálculo de un modelo inicial de regresión múltiple
Una vez obtenidos los datos de precipitación para un mes determinado, se lleva a cabo una
regresión múltiple. En esta ecuación de regresión múltiple, la variable dependiente es la
precipitación mensual o precipitación anual, mientras que las variables independientes son la
longitud, latitud y altitud. La ecuación obtenida en esta regresión múltiple no es definitiva, en
realidad, su cálculo va destinado a obtener una serie de índices estadísticos.
Estos índices son:
Valor P de la ecuación de regresión.
R cuadrado ajustada de la ecuación de regresión.
F estadístico de la ecuación de regresión.
La figura 12 muestra como se comporta el subnivel 1 y como conecta con el subnivel 2.
Figura 12. Diagrama subnivel 1, en el que se muestra el proceso de importación de datos climáticos y
obtención de una ecuación de regresión a partir de los datos importados.
27
32. En lenguaje R, la función “lm” (linear mode) permite aplicar una regresión usando más de
dos variables independientes. A partir de la ecuación obtenida se pueden obtener los índices
estadísticos deseados, sin embargo, es necesario usar paquetes estadísticos que contienen las
funciones para calcular estos índices específicos (figura 13).
Figura 13. Pseudocódigo Subnivel 1.
Por último, dentro de este subnivel, hay que hacer mención a aquellos casos especiales en
los que no es posible obtener los índices deseados. Estos casos especiales son aquellos meses en
los que ninguna estación ha registrado un valor de precipitación, es decir, todos los registros de
precipitación son cero. Para estos casos, obviamente, el mapa resultante de precipitación es el de
una malla en la que todas las posiciones presentan el valor cero. En estos casos, no es posible
determinar los índices Valor-P y Estadístico F, por lo que directamente se considerará que estos
meses poseen un Valor-P igual a 1 y método de interpolación asignado será el krigeado.
Subnivel 2 – Clasificación del modelo de regresión y obtención de un segundo modelo de
regresión
Una vez obtenidos los tres índices en el subnivel 1, entra en juego el subnivel 2 en donde,
según el nivel de significación obtenido en el subnivel 1, se indicará el camino que ha de tomar
el proceso bien para obtener una ecuación de una, dos o tres variables (ya que en principio se
trabaja con 3 variables independientes) que ofrezcan un mejor ajuste de los datos y hacer una
regresión por pasos o bien llevar a cabo una interpolación mediante un krigeado y en este caso
solo es necesario tener en cuenta los datos de precipitación registrados por las estaciones y las
variables de longitud y latitud. En los casos en que se aplica una regresión por pasos la selección
de la ecuación con mejor ajuste se hará mediante dos índices: R cuadrado ajustado y F
estadístico.
La presencia de todas las variables independientes en una ecuación no implica siempre el
mejor ajuste, en muchos casos, eliminar alguna variable de la ecuación, mejora el nivel de
significación de la ecuación. La regresión por pasos se encarga de analizar que conjunto de
variables son las que ofrecen un mejor ajuste a los datos.
28
33. Este tipo de regresión actúa en dos direcciones:
Regresión hacia atrás – a partir de la sustracción de variables comprueba como varía el
nivel de significación de la ecuación
Regresión adelante – a partir de la adición de variables comprueba como varía el nivel de
significación de la ecuación.
Por lo tanto, los criterios para la clasificación serán los siguientes (figura 14):
Si Valor-P es menor o igual a 0.05 (Valor-P <= 0.05), se esta tratando con un modelo
inicial que tiene muy buen ajuste y si se realiza una regresión por pasos es para
comprobar si es posible, variando el número de variables, mejorar aún más ese ajuste. Se
utilizará el índice R cuadrado estadístico para obtener la ecuación con mejor ajuste. Se
elegirá aquella ecuación que tenga mayor R cuadrado ajustado. El método de
interpolación a utilizar en este caso será el modelo de regresión obtenido en la regresión
por pasos.
Si Valor-P es mayor a 0.05 y menor a 0.1 y R cuadrado ajustada es mayor o igual a 0.6
(0.05 <= Valor-P < 0.1 y R >= 0.6), en este caso el modelo inicial presenta un ajuste no
tan bueno como el primer criterio. Se practica una regresión por pasos con el fin de
aproximar el modelo a un nivel de significación de 0.05. Se utilizará el índice F
estadístico para obtener la ecuación con mejor ajuste ya que este índice es más “sensible”
para diferenciar modelos y ofrecer el mejor. Así, se elegirá aquella ecuación que tenga
mayor F estadístico. En estos casos, se aplicará también una interpolación mediante un
modelo de regresión.
Si Valor-P es mayor a 0.1 o Valor-P es menor a 0.1 y R cuadrado ajustada es menor a 0.6
(Valor-P >= 0.1 o Valor-P < 0.1 y R <0.6), en estos casos, el modelo inicial presenta un
ajuste muy pobre a los datos. En estos casos, se realizará regresión múltiple con el fin de
obtener un nivel de significación por debajo de 0.1 y un R cuadrado ajustada por encima
de 0.6. Si se cumple, entonces se llevará a cabo una interpolación mediante un modelo de
regresión y si no se cumple entonces se llevará a cabo una interpolación mediante un
krigeado.
29
34. Figura 14. Diagrama subnivel 2. (*) Para los casos en los que no hay precipitación registrada se
consideró que Valor-P sería 1 y por lo tanto el método de interpolación utilizado será el krigeado.
Para implementar este subnivel en lenguaje R, se han utilizado condicionantes “if” de esta
forma es posible construir los distintos criterios. El proceso comprueba el primer criterio, si se
cumple entra en el criterio, si no, comprueba el siguiente criterio y así sucesivamente. El proceso
encontrará siempre un criterio al que entrar ya que se han descrito todos los casos posibles. El
pseudocódigo muestra la estructura de los condicionantes usados en cada criterio (figura 15).
Figura 15. Pseudocódigo subnivel 2.
30
35. En los casos en los que se ha llevado a cabo una interpolación por un krigeado el proceso no
continúa por los subniveles 3 y 4. En estos casos, se realiza la interpolación en este subnivel y se
obtiene como resultado una matriz de datos de precipitación que terminará exportándose a un
formato de salida que permita almacenar esta matriz en una base de datos.
Antes de llevar a cabo la interpolación por el krigeado, se crea una matriz con las mismas
dimensiones que el modelo digital de elevaciones. Así, la matriz donde se lleva a cabo la
interpolación tiene unas dimensiones de 2190 filas y 2282 columnas, como el modelo digital de
elevaciones. A continuación se indica al krigeado que haga la interpolación en los límites de la
matriz creada.
La implementación de este proceso en lenguaje R viene dada por la librería “gstat”, la cual
permite llevar a cabo krigeado de tipo ordinario:
1 - Tomar datos de precipitación registrados por las estaciones en la variables “mes” y sus
correspondientes posiciones de longitud y latitud con las variables “clima$X” y “clima$Y”.
Utiliza la longitud y latitud para crear puntos con coordenadas UTM, con la orden “coordinates”.
2 - Crear una matriz de igual dimensión que el modelo digital de elevaciones y con una
resolución espacial de 20 metros. A partir de las coordenadas UTM indicadas en el código
mediante las variables “Left, Rigth, Top, Bottom”, R crea una matriz usando como puntos x,y.
Cada punto es una coordenada UTM, de esta forma, es posible localizar los puntos creados en el
punto anterior.
3 - A continuación comienza a trabajar la librería “gstat”. Comienza calculando un variograma
simple a partir de los datos de precipitación. Cuando se calcula un variograma simple, se puede
elegir calcular la diferencia de cuadrados para cada par de observaciones u obtener la media de la
diferencias de cuadrados sobre la distancia de los intervalos para un número dado de intervalos
(Pebesma & Wessling, 1998).
Se introducen los valores de precipitación de las estaciones en la librería.
Se calcula el variograma a partir de los valores introducidos
El resultado es una representación de la varianza frente a la distancia de los puntos introducidos
(figura 16). Las características de los 4 puntos representados se muestran en la figura
31
36. Figura 16. Representación gráfica del variograma.
Debido a las pocas estaciones con las que se trabaja y que los valores de precipitación son
próximos a cero, en principio, el ajuste en estos mapas no será del todo bueno y la distribución
de los puntos será parecida a la de la figura 16, sin embargo, en los meses de verano donde las
precipitaciones son prácticamente nulas se espera que la estimación de la precipitación en todo el
área sea próxima a cero.
4 - En gstat, los modelos de variogramas están definidos como un modelo de un variograma
simple o como la suma de dos o más variogramas simples. Un modelo de un variograma simple
consiste en un tipo de modelo y un factor de escala para la varianza. Los modelos utilizados son
lineal, esférico, exponencial, Gausiano, circular, pentaesférico y logarítmico. El parámetro
referido al rango puede definirse como una elipse de dos dimensiones o un elipsoide de tres
dimensiones (Pebesma & Wessling, 1998).
En este caso, debido a la distribución de los puntos, no hay un modelo que se ajuste mejor,
por lo que se ha cogido el modelo lineal por defecto. Se ajusta el variograma:
5- Por último se lleva a cabo la estimación de la precipitación a partir del modelo obtenido. La
predicción puede ser global, usando todas las observaciones para cada predicción, o local,
usando solo un conjunto de observaciones para un área en concreto. En este caso de predicción
local, el conjunto de puntos seleccionados puede ser definido en términos de máxima distancia o
por proximidad entre estaciones, o combinación. El criterio de la distancia puede ser bien
geográfico (Euclidiano) o tomar la distancia del variograma. El máximo número de
observaciones más próximas puede ser especificado por cuadrante (dos dimensiones) o octante
(tres dimensiones) (Pebesma & Wessling, 1998).
32
37. A partir del modelo obtenido en el variograma y los datos de precipitación se lleva a cabo la
estimación:
Finalmente, se extraen los datos estimados de precipitación y se introducen en una matriz de
igual dimensión que el modelo digital de elevaciones, donde la variable mapa contiene los datos
de precipitación estimados y las variables “row” y “column” contienen el número de filas y
columnas de la matriz.
Subnivel 3 - Almacenamiento de coeficientes de las variables de la ecuación de regresión
El resultado del subnivel 2 puede ser de dos tipos: Una ecuación de una, dos o tres variables
que se utilizará para llevar a cabo una interpolación mediante un modelo de regresión lineal o
una interpolación mediante el krigeado que hace uso de las tres variables independientes. El
subnivel 3 se centra en el primer resultado, ya que, al tratarse de una interpolación mediante un
modelo de regresión es necesario conocer los coeficientes asociados a las variables
independientes, para el posterior cálculo de precipitación.
En este apartado, se comprueba el número de variables independientes que contiene la
ecuación de regresión. Las tres variables con las que trabaja el modelo son latitud, longitud y
altitud. Los criterios de almacenamientos son los siguientes (figura 17):
Si el número de variables es uno, almacena el coeficiente de la única variable con la que
trabajo. En primer lugar, se identifica la variable de la ecuación (latitud, longitud o
altitud) y a continuación se almacena su coeficiente.
Si el número de variables es dos, almacena los coeficientes de cada variable. En este caso
es necesario identificar las dos variables. Dado que trabajamos con tres variables, la
identificación se hace mediante la comprobación de las siguientes combinaciones de dos
variables:
Latitud y longitud.
Latitud y altitud.
Longitud y altitud.
Una vez conocida la combinación, se procede a almacenar los coeficientes.
Si el número de variables es tres, en ese caso no hay que hacer ninguna identificación ya
que se conocen las tres variables independientes, por lo que se almacenan
correspondientes coeficientes.
33
38. Figura 17. Diagrama subnivel 3. En función del número de variables que contenga la ecuación, la
identificación y almacenamiento de coeficientes tomará un camino distinto en el proceso.
La implementación de este subnivel en lenguaje R se ha hecho mediante condicionantes “if”
en los que se ha ido comprobando el número de variables que presenta la ecuación. A
continuación se almacenan los coeficientes en un vector de “n” posiciones, que se usará
posteriormente en el cálculo para la interpolación climática (figura 18).
Figura 18. Pseudocódigo subnivel 3.
34
39. Este vector contiene cuatro posiciones que almacena los coeficientes de las variables
independientes. Cada posición del vector esta reservado para el coeficiente de una variable
independiente. En caso, de que alguna variable se haya suprimido, se almacenará entonces un
valor de cero en el vector (figura 19).
Figura 19. Representación gráfica del almacenamiento de los coeficientes de las variables en un vector.
Subnivel 4 – Interpolación de datos climáticos
Este último subnivel consiste en el cálculo de la precipitación para el área de estudio. Como
se comentó anteriormente, este proceso de interpolación consistirá en desplazar la ecuación, con
las variables que la componga y sus correspondientes coeficientes, por cada celda del modelo
digital de elevaciones y de esta forma obtener un dato de precipitación en cada celda.
Como se puede apreciar en el diagrama de la figura 20, el proceso comienza con una matriz
de entrada que será el modelo digital de elevaciones. Cada celda del modelo digital de
elevaciones tiene un valor de longitud, latitud y altitud. El procedimiento consistirá en recorrer la
matriz, celda a celda. Para poder recorrer la matriz, se hará uso de dos bucles. Un primer bucle se
encargará de leer las filas de la matriz y un segundo bucle leerá las columnas de la matriz. El
primer bucle lee la fila “m” de la matriz de entrada. A continuación, comienza un segundo bucle
que lee la columna “n”. De esta forma, el segundo bucle lee todas las celdas de la fila “m”.
Cuando termina de leer todas las celdas de la fila “m”, pasa a la siguiente fila “m+1”, y así
sucesivamente hasta completar toda la matriz.
35
40. Figura 20. Diagrama subnivel 4. Proceso de estimación de la precipitación tomando valores de una matriz de
entrada y a partir de la ecuación de regresión calcula y exporta los valores a una matriz de salida.
Cuando el proceso se encuentra en la celda (m,n), extrae los valores de longitud, latitud y
altitud y los introduce en la ecuación siguiente:
Los valores de cada variable, son multiplicados por los coeficientes que se obtuvieron en el
subnivel 3 y que se almacenaron en un vector. La ecuación toma los coeficientes de la posición
indica en el vector:
En aquellos casos en los que el modelo esta formado por una o dos variables, el vector
almacena un valor de cero para aquellas variables suprimidas. De esta forma, la variable
suprimida se multiplica por cero y no se tiene en cuenta en la suma.
El valor de precipitación obtenido se almacena en una nueva matriz de salida. La matriz de
salida tiene la misma dimensión que la matriz de entrada. En la matriz de salida, el valor de
precipitación se almacenará en la misma posición (m,n), la misma posición que la matriz de
entrada.
36
41. 5.5.4. Automatización en la exportación de los mapas climático
La matriz resultante del proceso de interpolación se exporta a formato reconocible por el
software ENVI. La librería “CaTools” permite importar y exportar resultados generado en R al
software ENVI y de esta forma poder visualizarlos en forma de imagen.
La figura 21 muestra el diagrama final con todos los niveles del proceso de automatización
unidos, formando una estructura que tiene un comienzo con la importación de los datos de
precipitación del primer mes y del primer año y finaliza cuando ha generado el mapa de
precipitación para el último mes y del último año.
Figura 21. Diagrama final del proceso de automatización con todos los niveles ensamblados.
37
42. 6. RESULTADOS
El modelo construido genera un total de 70 mapas, 13 mapas por cada año. De los 13 mapas
totales, 12 mapas corresponden a los 12 meses del año (65 mapas de precipitación mensual en
total) y el último mapa corresponde a la precipitación anual (5 mapas de precipitación anual en
total). La tabla 8 muestra la clasificación de los meses según el modelo de interpolación
utilizado.
Tabla 8. Clasificación del total de mapas generados según el modelo de interpolación.
Año Mapas precipitación mensual Mapas precipitación anual
Modelo de Krigeado Modelo de Krigeado
regresión regresión
2004 8 4 1 -
2005 7 5 1 -
2006 4 8 - 1
2007 5 7 1 -
2008 5 7 1 -
2009 3 2 - -
Total 32 33 4 1
Ya sea una interpolación por un modelo de regresión o por un krigeado, el mapa resultante
tiene una dimensión de 2190 filas y 2282 columnas con un tamaño de celda de 20 metros. La
diferencia entre los métodos radica en la interpolación. Un modelo de regresión hace una
estimación de la precipitación sobre el polígono proporcionado por el modelo digital de
elevaciones, quedando las demás celdas de la matriz sin ningún valor numérico (figura 22).
Figura 22. Matriz de precipitación mediante un modelo de regresión. Se puede apreciar el polígono
utilizado que representa el Parque Natural del Cabo de Gata-Níjar (Almería). Dentro de este polígono se
incluyen valores de precipitación. Las celdas situadas fuera del polígono no presentan valores y se
representan de color negro.
38
43. Sin embargo, el krigeado genera una interpolación a partir de datos puntuales, no se hace
uso del modelo digital de elevaciones y por lo tanto hace una estimación en toda la matriz.
Tomando como ejemplo el mapa de julio del 2004, representado en la figura 23, el mapa resalta
zonas en forma de circunferencias que coinciden con la localización de las estaciones
meteorológicas que han registrado algún valor.
Figura 23. Matriz de precipitación mediante un krigeado obtenido para el mes de Julio del año 2004. La
interpolación se extiende a toda la matriz. Las circunferencias blancas corresponden a las estaciones
meteorológicas de Carboneras, Najar y Michelín.
Las celdas situadas en el centro de las circunferencias blancas recogen el valor máximo de
precipitación mientras que las celdas situadas en el centro de las circunferencias negras recogen
el mínimo valor de precipitación. A partir de este valor máximo y mínimo se lleva a cabo una
interpolación. Conforme se aleja de las circunferencias los valores de precipitación son
intermedios encontrándose entre el máximo y mínimo y quedando representados por tonos
grises.
Otro aspecto a destacar en los mapas climáticos generados por un modelo de regresión, es
que en función de las variables utilizadas, el mapa resultante varía. El clima del área de estudio,
por su localización y su orografía, no responde siempre a las mismas variables, es decir, en
algunos casos las tres variables climáticas (latitud, longitud y altitud) explican la distribución de
lluvias, en otros casos, solo una o dos variables explican el comportamiento de la precipitación
(tabla 9). Como se puede apreciar en la tabla 10, donde aparece el número de veces utilizado
cada variable en un año, las variables que predominan cada año no son siempre las mismas, el
modelo de regresión elige en cada caso las variables que mejor pueden explicar la distribución de
precipitación. Los meses en los que aparece la letra K corresponden a los meses en los que se ha
aplicado un krigeado.
39