Se presenta a continuación un ejemplo de uso básico de WEKA mediante el análisis de datos relacionados con la ocurrencia de incendios forestales ocurridos en el Parque natural de Montesinho en Portugal durante 2007.
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Analisis de incendios forestales mediante WEKA
1. MINERIA DE DATOS
Analisis mediate WEKA
de Incendios Forestales
MAESTRIA EN
SISTEMAS COMPUTACIONALES
Catedrático: Dr. Diego Uribe Agundis
Expone: Ing. Fernando Alfonso Casas De la Torre
2. Analisis mediate WEKA
WEKA (Waikato Environment for Knowledge Analysis, en español «entorno para análisis del
conocimiento de la Universidad de Waikato») es una plataforma de software para el aprendizaje
automático y la minería de datos escrito en Java y desarrollado en la Universidad de Waikato para
la extracción de conocimientos desde bases de datos.
Weka es software libre distribuido bajo la licencia GNU-GPL.
3. Analisis mediate WEKA
Se presenta a continuación un ejemplo de uso básico de WEKA mediante el análisis de
datos relacionados con la ocurrencia de incendios forestales ocurridos en el Parque
natural de Montesinho en Portugal durante 2007.
http://archive.ics.uci.edu/ml/index.php
4. Analisis mediate WEKA
El Parque Natural de Montesinho (PNM) se sitúa en el nordeste Transmontano (Portugal).
Tiene una dimensión de cerca de 75 mil hectáreas. En él existe una extensa biodiversidad,
habitando especies como el lobo ibérico, el corzo o el venado. El PNM limita con España,
recorriendo la frontera las comunidades autónomas de Galicia y de Castilla y León.
Presenta un relieve heterogéneo, con mesetas onduladas
cortadas por profundos valles encajados, así como algunas
sierras, de las cuales las dos más importantes son la Sierra
de Montesinho, al norte de Bragança, y la Serra da Coroa, al
norte de Vinhais. Las altitudes varían entre los 1.486
metros, en la Sierra de Montesinho y los 438 metros en el
cauce del río Mente.
5. Analisis mediate WEKA
Este es un ejemplo de uso de información con Data Mining mediante la aplicación de tareas
de análisis, donde el objetivo es predecir el área quemada de los incendios forestales en la
región noreste de Portugal, mediante el uso de información meteorológica en combinación
con otro tipo de datos históricos.
Este parque contiene una flora y fauna diversa. Esta
insertado dentro de una zona de clima supra-mediterraneo
con una temperatura anual promedio del rango de 8 a 12◦
en invierno hasta 37 ◦ e verano. Los datos utilizados fueron
colectados desde enero del 2000 hasta diciembre del 2003 a
partir de información de las mismas autoridades del parque
así como de estaciones meteorológicas.
7. Analisis del Problema
Mapa del Parque Natural Montesinho
El problema del parque es que sufre constantemente de
incendios, los cuales a pesar muchas veces de ser de pequeño
tamaño pueden salirse de control y provocar daños en el
ecosistemas y hasta perdidas humanas y materiales. Este analisis
permitiria predecir la ocurrencia de los incendios en base a las
condiciones meteorologicas y de afluencia al parque y los sitios
donde mas frecuentemente se dan a fin de tomar medidas
preventivas. Los investigadores ubicaron el area del Parque de
Montesihno en un cuadrante de 9x9 para acotar incendios y
relacionarlos en base a su tiempo, lugar, hora, intensidad y otras
caracteristicas.
9. Relaciones
Mapa del parque al que se le aplico una
cuadricula de 9x9 para la investigacion y
ubicar los incendios.
Mapa del parque Montesinho en el que se
observan los principales accesos y rutas
para transitarlo.
10. Descripcion del Dataset
Caracteristicas del Data Set Variado
Caracreristicas de los atributos Real
Tareas asociadas Regresivo
Area: Física
Numero de Instancias 517
Numero de Atributos 13
Valores perdidos N/A
Fecha de los datos 2008-02-29
Fuentes de los datos:
Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems, University of Minho, Portugal.
Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems, University of Minho, Portugal.
11. Algoritmos de Analisis
El análisis estadístico es un componente del análisis de datos. En el
contexto de la inteligencia de negocios (BI), el análisis estadístico requiere
recoger y escudriñar cada muestra de datos individual en una serie de
artículos desde los cuales se puede extraer las muestras. Para realizar
estos analisis es necesario aplicar ALGORITMOS.
Un algoritmo es básicamente una regla abstracta que permite encontrar y
expresar aquello que buscamos (en el mundo del big data, generalmente
la búsqueda de patrones y relaciones entre variables). Estos algoritmos
son desarrollados con el único objetivo de automatizar un camino óptimo
que ayude al ser humano a tratar la ingente cantidad de datos que se
genera diariamente. De hecho, los algoritmos, junto con el hardware y las
redes constituyen los tres pilares sobre los que sustenta la
transformación digital de muchas industrias.
12. Algoritmos de Analisis
El análisis estadístico puede optar para iniciar con el analisis
dependiendo del tipo de informacion entre los ALGORITMOS DE
CLASIFICACIÓN y los de REGRESIÓN.
• La REGRESIÓN tiene el objetivo de predecir valores continuos
(Números pues, como el 1, 2.3, 3.1416 etc…)
• La CLASIFICACIÓN tiene la tarea de asignar una clase, es decir predecir
a que clase pertenece un conjunto de datos, aquí es muy importante
entender que en los problemas de clasificación los valores son
discretos .
U ejemplo puede ser el de fijar el precio de una casa o propiedad, que se
hace por lo general basado en una serie de parámetros como la cantidad
de baños, metros cuadrados, habitaciones, etc. Al final lo que se busca es
que el algoritmo arroje un dato continuo, en este caso el valor de la casa.
13. Atributos
Fuentes de los datos:
Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems, University of Minho, Portugal.
Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems, University of Minho, Portugal.
1. X – Eje X o Coordenada X en la cuadricula de 9x9, valores de 1 a 9
2. Y – Eje Y o Coordenada Y en la cuadricula de 9x9, valores de 2 a 9
3. MES – Mes del año del incendio : ‘ene' a 'dic'
4. DIA – Dia de la semana del incendio : ‘lun' to ‘dom'
5. FFMC - FFMC index from the FWI system: 18.7 to 96.20
6. DMC - DMC index from the FWI system: 1.1 to 291.3
7. DC - DC index from the FWI system: 7.9 to 860.6
8. ISI - ISI index from the FWI system: 0.0 to 56.10
9. TEMP –Temperatura en grados Celsius: 2.2 to 33.30
10. RH – Porcentaje de humedad %: 15.0 to 100
11. VIENTO- Velocidad del viento en km/h: 0.40 to 9.40
12. LLUVIA – Precipitaciones por lluvia en mm/m2 : 0.0 to 6.4
13. AREA – Area quemada en la foresta (has): 0.00 to 1090.84
(this output variable is very skewed towards 0.0, thus it may make
sense to model with the logarithm transform).
14. Formato archivo WEKA
Un archivo ARFF (Attribute-Relation File Format) es un fichero de texto en formato ASCII que
describe la lista de instancias que conformaran un grupo de atributos a evaluar mediate
WEKA. Los archivos ARFF se dividen en dos partes, la CABECERA de la informacion y los datos
(DATA).
% 1. Titulo: EstudiosFluoroscopio
% 2. Fuentes: http://www.direccion.dominio.xx
% Creador: Fernando Casas y Raul Lopez
% Contacto fernando.casas@imss.gob.mx
% (c) Fecha: 07/03/2018
%
@RELATION Fluoroscopio
@ATTRIBUTE cornea NUMERIC
@ATTRIBUTE pupilawidth NUMERIC
@ATTRIBUTE pupilalength NUMERIC
@ATTRIBUTE macula NUMERIC
@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}
@DATA
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
CABECERA o
Descripcion
de datos
DATA
16. REFERENCIAS
P. Cortez and A. Morais.
A Data Mining Approach to Predict Forest Fires using Meteorological Data.
In J. Neves, M. F. Santos and J. Machado Eds., New Trends in Artificial Intelligence,
Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence,
December, Guimaraes, Portugal, pp. 512-523, 2007. APPIA, ISBN-13 978-989-95618-
0-9.
• http://www.dsi.uminho.pt/~pcortez/forestfires
• http://www3.dsi.uminho.pt/pcortez/fires.pdf
Diario EL PAIS
• https://elpais.com/internacional/2017/10/19/actualidad/1508410409_311317
.html
Fuentes de los datos:
• Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems,
University of Minho, Portugal.
Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems,
University of Minho, Portugal