SlideShare una empresa de Scribd logo
1 de 16
MINERIA DE DATOS
Analisis mediate WEKA
de Incendios Forestales
MAESTRIA EN
SISTEMAS COMPUTACIONALES
Catedrático: Dr. Diego Uribe Agundis
Expone: Ing. Fernando Alfonso Casas De la Torre
Analisis mediate WEKA
WEKA (Waikato Environment for Knowledge Analysis, en español «entorno para análisis del
conocimiento de la Universidad de Waikato») es una plataforma de software para el aprendizaje
automático y la minería de datos escrito en Java y desarrollado en la Universidad de Waikato para
la extracción de conocimientos desde bases de datos.
Weka es software libre distribuido bajo la licencia GNU-GPL.
Analisis mediate WEKA
Se presenta a continuación un ejemplo de uso básico de WEKA mediante el análisis de
datos relacionados con la ocurrencia de incendios forestales ocurridos en el Parque
natural de Montesinho en Portugal durante 2007.
http://archive.ics.uci.edu/ml/index.php
Analisis mediate WEKA
El Parque Natural de Montesinho (PNM) se sitúa en el nordeste Transmontano (Portugal).
Tiene una dimensión de cerca de 75 mil hectáreas. En él existe una extensa biodiversidad,
habitando especies como el lobo ibérico, el corzo o el venado. El PNM limita con España,
recorriendo la frontera las comunidades autónomas de Galicia y de Castilla y León.
Presenta un relieve heterogéneo, con mesetas onduladas
cortadas por profundos valles encajados, así como algunas
sierras, de las cuales las dos más importantes son la Sierra
de Montesinho, al norte de Bragança, y la Serra da Coroa, al
norte de Vinhais. Las altitudes varían entre los 1.486
metros, en la Sierra de Montesinho y los 438 metros en el
cauce del río Mente.
Analisis mediate WEKA
Este es un ejemplo de uso de información con Data Mining mediante la aplicación de tareas
de análisis, donde el objetivo es predecir el área quemada de los incendios forestales en la
región noreste de Portugal, mediante el uso de información meteorológica en combinación
con otro tipo de datos históricos.
Este parque contiene una flora y fauna diversa. Esta
insertado dentro de una zona de clima supra-mediterraneo
con una temperatura anual promedio del rango de 8 a 12◦
en invierno hasta 37 ◦ e verano. Los datos utilizados fueron
colectados desde enero del 2000 hasta diciembre del 2003 a
partir de información de las mismas autoridades del parque
así como de estaciones meteorológicas.
Parque Natural de Montesinho
Analisis del Problema
Mapa del Parque Natural Montesinho
El problema del parque es que sufre constantemente de
incendios, los cuales a pesar muchas veces de ser de pequeño
tamaño pueden salirse de control y provocar daños en el
ecosistemas y hasta perdidas humanas y materiales. Este analisis
permitiria predecir la ocurrencia de los incendios en base a las
condiciones meteorologicas y de afluencia al parque y los sitios
donde mas frecuentemente se dan a fin de tomar medidas
preventivas. Los investigadores ubicaron el area del Parque de
Montesihno en un cuadrante de 9x9 para acotar incendios y
relacionarlos en base a su tiempo, lugar, hora, intensidad y otras
caracteristicas.
Parque Natural de Montesinho
Relaciones
Mapa del parque al que se le aplico una
cuadricula de 9x9 para la investigacion y
ubicar los incendios.
Mapa del parque Montesinho en el que se
observan los principales accesos y rutas
para transitarlo.
Descripcion del Dataset
Caracteristicas del Data Set Variado
Caracreristicas de los atributos Real
Tareas asociadas Regresivo
Area: Física
Numero de Instancias 517
Numero de Atributos 13
Valores perdidos N/A
Fecha de los datos 2008-02-29
Fuentes de los datos:
Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems, University of Minho, Portugal.
Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems, University of Minho, Portugal.
Algoritmos de Analisis
El análisis estadístico es un componente del análisis de datos. En el
contexto de la inteligencia de negocios (BI), el análisis estadístico requiere
recoger y escudriñar cada muestra de datos individual en una serie de
artículos desde los cuales se puede extraer las muestras. Para realizar
estos analisis es necesario aplicar ALGORITMOS.
Un algoritmo es básicamente una regla abstracta que permite encontrar y
expresar aquello que buscamos (en el mundo del big data, generalmente
la búsqueda de patrones y relaciones entre variables). Estos algoritmos
son desarrollados con el único objetivo de automatizar un camino óptimo
que ayude al ser humano a tratar la ingente cantidad de datos que se
genera diariamente. De hecho, los algoritmos, junto con el hardware y las
redes constituyen los tres pilares sobre los que sustenta la
transformación digital de muchas industrias.
Algoritmos de Analisis
El análisis estadístico puede optar para iniciar con el analisis
dependiendo del tipo de informacion entre los ALGORITMOS DE
CLASIFICACIÓN y los de REGRESIÓN.
• La REGRESIÓN tiene el objetivo de predecir valores continuos
(Números pues, como el 1, 2.3, 3.1416 etc…)
• La CLASIFICACIÓN tiene la tarea de asignar una clase, es decir predecir
a que clase pertenece un conjunto de datos, aquí es muy importante
entender que en los problemas de clasificación los valores son
discretos .
U ejemplo puede ser el de fijar el precio de una casa o propiedad, que se
hace por lo general basado en una serie de parámetros como la cantidad
de baños, metros cuadrados, habitaciones, etc. Al final lo que se busca es
que el algoritmo arroje un dato continuo, en este caso el valor de la casa.
Atributos
Fuentes de los datos:
Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems, University of Minho, Portugal.
Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems, University of Minho, Portugal.
1. X – Eje X o Coordenada X en la cuadricula de 9x9, valores de 1 a 9
2. Y – Eje Y o Coordenada Y en la cuadricula de 9x9, valores de 2 a 9
3. MES – Mes del año del incendio : ‘ene' a 'dic'
4. DIA – Dia de la semana del incendio : ‘lun' to ‘dom'
5. FFMC - FFMC index from the FWI system: 18.7 to 96.20
6. DMC - DMC index from the FWI system: 1.1 to 291.3
7. DC - DC index from the FWI system: 7.9 to 860.6
8. ISI - ISI index from the FWI system: 0.0 to 56.10
9. TEMP –Temperatura en grados Celsius: 2.2 to 33.30
10. RH – Porcentaje de humedad %: 15.0 to 100
11. VIENTO- Velocidad del viento en km/h: 0.40 to 9.40
12. LLUVIA – Precipitaciones por lluvia en mm/m2 : 0.0 to 6.4
13. AREA – Area quemada en la foresta (has): 0.00 to 1090.84
(this output variable is very skewed towards 0.0, thus it may make
sense to model with the logarithm transform).
Formato archivo WEKA
Un archivo ARFF (Attribute-Relation File Format) es un fichero de texto en formato ASCII que
describe la lista de instancias que conformaran un grupo de atributos a evaluar mediate
WEKA. Los archivos ARFF se dividen en dos partes, la CABECERA de la informacion y los datos
(DATA).
% 1. Titulo: EstudiosFluoroscopio
% 2. Fuentes: http://www.direccion.dominio.xx
% Creador: Fernando Casas y Raul Lopez
% Contacto fernando.casas@imss.gob.mx
% (c) Fecha: 07/03/2018
%
@RELATION Fluoroscopio
@ATTRIBUTE cornea NUMERIC
@ATTRIBUTE pupilawidth NUMERIC
@ATTRIBUTE pupilalength NUMERIC
@ATTRIBUTE macula NUMERIC
@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}
@DATA
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
CABECERA o
Descripcion
de datos
DATA
Conversion mediate EXCEL
REFERENCIAS
P. Cortez and A. Morais.
A Data Mining Approach to Predict Forest Fires using Meteorological Data.
In J. Neves, M. F. Santos and J. Machado Eds., New Trends in Artificial Intelligence,
Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence,
December, Guimaraes, Portugal, pp. 512-523, 2007. APPIA, ISBN-13 978-989-95618-
0-9.
• http://www.dsi.uminho.pt/~pcortez/forestfires
• http://www3.dsi.uminho.pt/pcortez/fires.pdf
Diario EL PAIS
• https://elpais.com/internacional/2017/10/19/actualidad/1508410409_311317
.html
Fuentes de los datos:
• Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems,
University of Minho, Portugal.
Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems,
University of Minho, Portugal

Más contenido relacionado

Similar a Analisis de incendios forestales mediante WEKA

Hidroesta 2 arequipa perú 2014 (1)
Hidroesta 2 arequipa perú 2014 (1)Hidroesta 2 arequipa perú 2014 (1)
Hidroesta 2 arequipa perú 2014 (1)Marilia Soto
 
Proyecto_gvirgen
Proyecto_gvirgenProyecto_gvirgen
Proyecto_gvirgengvirgen
 
Analisis de dos estudios de caso: Telemedicina y Alertas Ambientales
Analisis de dos estudios de caso: Telemedicina y Alertas AmbientalesAnalisis de dos estudios de caso: Telemedicina y Alertas Ambientales
Analisis de dos estudios de caso: Telemedicina y Alertas AmbientalesRoussell Ramirez Alvarez
 
Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...
Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...
Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...MARIA PAZ CARDONA
 
Centros de datos el ahorro de co2 en la nube Cap 11
Centros de datos el ahorro de co2 en la nube Cap 11Centros de datos el ahorro de co2 en la nube Cap 11
Centros de datos el ahorro de co2 en la nube Cap 11Maynor Vidal Enamorado Leiva
 
Grupo h1 grapa7_caso_m1_l1.2_e1_v2
Grupo h1 grapa7_caso_m1_l1.2_e1_v2Grupo h1 grapa7_caso_m1_l1.2_e1_v2
Grupo h1 grapa7_caso_m1_l1.2_e1_v2Julian Gamboa
 
Leac xivtig sevilla_0910_etclusi_ws
Leac xivtig sevilla_0910_etclusi_wsLeac xivtig sevilla_0910_etclusi_ws
Leac xivtig sevilla_0910_etclusi_wswsimonazzi
 
Desarrollo de Sistemas de Información Bioclimática
Desarrollo de Sistemas de Información BioclimáticaDesarrollo de Sistemas de Información Bioclimática
Desarrollo de Sistemas de Información BioclimáticaRodrigo Torrens
 
Caso practico de base de datos orientada a objetos
Caso practico de base de datos orientada a objetosCaso practico de base de datos orientada a objetos
Caso practico de base de datos orientada a objetosMiguel Martinez
 

Similar a Analisis de incendios forestales mediante WEKA (20)

TECNOLOGIA 2023.pdf
TECNOLOGIA 2023.pdfTECNOLOGIA 2023.pdf
TECNOLOGIA 2023.pdf
 
Hidroesta 2 arequipa perú 2014 (1)
Hidroesta 2 arequipa perú 2014 (1)Hidroesta 2 arequipa perú 2014 (1)
Hidroesta 2 arequipa perú 2014 (1)
 
Presentacion curso itree-eco_fl
Presentacion curso itree-eco_flPresentacion curso itree-eco_fl
Presentacion curso itree-eco_fl
 
Inf1 introduccion general
Inf1 introduccion generalInf1 introduccion general
Inf1 introduccion general
 
Producto 1.2
Producto 1.2Producto 1.2
Producto 1.2
 
153979591 manual-hidroesta
153979591 manual-hidroesta153979591 manual-hidroesta
153979591 manual-hidroesta
 
Proyecto_gvirgen
Proyecto_gvirgenProyecto_gvirgen
Proyecto_gvirgen
 
Unidad 1: Informatica
Unidad 1: InformaticaUnidad 1: Informatica
Unidad 1: Informatica
 
Analisis de dos estudios de caso: Telemedicina y Alertas Ambientales
Analisis de dos estudios de caso: Telemedicina y Alertas AmbientalesAnalisis de dos estudios de caso: Telemedicina y Alertas Ambientales
Analisis de dos estudios de caso: Telemedicina y Alertas Ambientales
 
Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...
Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...
Informe taller distribucion de frecuencias,11 1, fabian alvarez, maria bolaño...
 
Centros de datos el ahorro de co2 en la nube Cap 11
Centros de datos el ahorro de co2 en la nube Cap 11Centros de datos el ahorro de co2 en la nube Cap 11
Centros de datos el ahorro de co2 en la nube Cap 11
 
Grupo h1 grapa7_caso_m1_l1.2_e1_v2
Grupo h1 grapa7_caso_m1_l1.2_e1_v2Grupo h1 grapa7_caso_m1_l1.2_e1_v2
Grupo h1 grapa7_caso_m1_l1.2_e1_v2
 
Fernando Belda-Big Data y cambio climático
Fernando Belda-Big Data y cambio climáticoFernando Belda-Big Data y cambio climático
Fernando Belda-Big Data y cambio climático
 
Presenta672
Presenta672Presenta672
Presenta672
 
Leac xivtig sevilla_0910_etclusi_ws
Leac xivtig sevilla_0910_etclusi_wsLeac xivtig sevilla_0910_etclusi_ws
Leac xivtig sevilla_0910_etclusi_ws
 
Desarrollo de Sistemas de Información Bioclimática
Desarrollo de Sistemas de Información BioclimáticaDesarrollo de Sistemas de Información Bioclimática
Desarrollo de Sistemas de Información Bioclimática
 
Rc juan aldana
Rc juan aldanaRc juan aldana
Rc juan aldana
 
Caso practico de base de datos orientada a objetos
Caso practico de base de datos orientada a objetosCaso practico de base de datos orientada a objetos
Caso practico de base de datos orientada a objetos
 
Base de datos ii
Base de datos iiBase de datos ii
Base de datos ii
 
Tecnologia 11-7.docx
Tecnologia 11-7.docxTecnologia 11-7.docx
Tecnologia 11-7.docx
 

Más de Fernando Alfonso Casas De la Torre

Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018Fernando Alfonso Casas De la Torre
 
Relación universidad-gobierno: caso de remodelación de una dependencia federal
Relación universidad-gobierno:  caso de remodelación  de una dependencia federalRelación universidad-gobierno:  caso de remodelación  de una dependencia federal
Relación universidad-gobierno: caso de remodelación de una dependencia federalFernando Alfonso Casas De la Torre
 
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?Fernando Alfonso Casas De la Torre
 

Más de Fernando Alfonso Casas De la Torre (20)

Mi Cascarita Proyecto Colibri.ppt
Mi Cascarita Proyecto Colibri.pptMi Cascarita Proyecto Colibri.ppt
Mi Cascarita Proyecto Colibri.ppt
 
Proyecto enlace WiFi Comunidades rurales
Proyecto enlace WiFi Comunidades ruralesProyecto enlace WiFi Comunidades rurales
Proyecto enlace WiFi Comunidades rurales
 
Congreso Academy Journal Tepic 2019
Congreso Academy Journal Tepic 2019Congreso Academy Journal Tepic 2019
Congreso Academy Journal Tepic 2019
 
Academy Journal Morelia 2018
Academy Journal Morelia 2018Academy Journal Morelia 2018
Academy Journal Morelia 2018
 
Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018Congreso Internacional de Investigacion Universidad Cortazar 2018
Congreso Internacional de Investigacion Universidad Cortazar 2018
 
Congreso Academy Journal Celaya 2017
Congreso Academy Journal Celaya 2017Congreso Academy Journal Celaya 2017
Congreso Academy Journal Celaya 2017
 
IMSS Informatica Actividades 2014 enfriamiento de site
IMSS Informatica Actividades 2014 enfriamiento de siteIMSS Informatica Actividades 2014 enfriamiento de site
IMSS Informatica Actividades 2014 enfriamiento de site
 
Historia de las Videoconsolas
Historia de las VideoconsolasHistoria de las Videoconsolas
Historia de las Videoconsolas
 
Relación universidad-gobierno: caso de remodelación de una dependencia federal
Relación universidad-gobierno:  caso de remodelación  de una dependencia federalRelación universidad-gobierno:  caso de remodelación  de una dependencia federal
Relación universidad-gobierno: caso de remodelación de una dependencia federal
 
Teorema de Naives Bayes
Teorema de Naives BayesTeorema de Naives Bayes
Teorema de Naives Bayes
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Patron observador
Patron observadorPatron observador
Patron observador
 
Replicación de Bases de Datos con SQL Server 2008
Replicación de Bases de Datos con SQL Server 2008Replicación de Bases de Datos con SQL Server 2008
Replicación de Bases de Datos con SQL Server 2008
 
Patron Singleton
Patron SingletonPatron Singleton
Patron Singleton
 
Incorporacion a la Seguridad Social
Incorporacion a la Seguridad SocialIncorporacion a la Seguridad Social
Incorporacion a la Seguridad Social
 
Plan de Contingencia Informatico
Plan de Contingencia InformaticoPlan de Contingencia Informatico
Plan de Contingencia Informatico
 
Contingencia Informatica
Contingencia InformaticaContingencia Informatica
Contingencia Informatica
 
Las 10 leyes de la Seguridad Informatica
Las 10 leyes de la Seguridad InformaticaLas 10 leyes de la Seguridad Informatica
Las 10 leyes de la Seguridad Informatica
 
Comercializacion de un producto
Comercializacion de un productoComercializacion de un producto
Comercializacion de un producto
 
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?Spark: una chispa con la velocidad del rayo  ¿el sustituto de Hadoop?
Spark: una chispa con la velocidad del rayo ¿el sustituto de Hadoop?
 

Último

Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxCristianCastro978067
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfMiguelGomez900779
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 

Último (20)

Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 

Analisis de incendios forestales mediante WEKA

  • 1. MINERIA DE DATOS Analisis mediate WEKA de Incendios Forestales MAESTRIA EN SISTEMAS COMPUTACIONALES Catedrático: Dr. Diego Uribe Agundis Expone: Ing. Fernando Alfonso Casas De la Torre
  • 2. Analisis mediate WEKA WEKA (Waikato Environment for Knowledge Analysis, en español «entorno para análisis del conocimiento de la Universidad de Waikato») es una plataforma de software para el aprendizaje automático y la minería de datos escrito en Java y desarrollado en la Universidad de Waikato para la extracción de conocimientos desde bases de datos. Weka es software libre distribuido bajo la licencia GNU-GPL.
  • 3. Analisis mediate WEKA Se presenta a continuación un ejemplo de uso básico de WEKA mediante el análisis de datos relacionados con la ocurrencia de incendios forestales ocurridos en el Parque natural de Montesinho en Portugal durante 2007. http://archive.ics.uci.edu/ml/index.php
  • 4. Analisis mediate WEKA El Parque Natural de Montesinho (PNM) se sitúa en el nordeste Transmontano (Portugal). Tiene una dimensión de cerca de 75 mil hectáreas. En él existe una extensa biodiversidad, habitando especies como el lobo ibérico, el corzo o el venado. El PNM limita con España, recorriendo la frontera las comunidades autónomas de Galicia y de Castilla y León. Presenta un relieve heterogéneo, con mesetas onduladas cortadas por profundos valles encajados, así como algunas sierras, de las cuales las dos más importantes son la Sierra de Montesinho, al norte de Bragança, y la Serra da Coroa, al norte de Vinhais. Las altitudes varían entre los 1.486 metros, en la Sierra de Montesinho y los 438 metros en el cauce del río Mente.
  • 5. Analisis mediate WEKA Este es un ejemplo de uso de información con Data Mining mediante la aplicación de tareas de análisis, donde el objetivo es predecir el área quemada de los incendios forestales en la región noreste de Portugal, mediante el uso de información meteorológica en combinación con otro tipo de datos históricos. Este parque contiene una flora y fauna diversa. Esta insertado dentro de una zona de clima supra-mediterraneo con una temperatura anual promedio del rango de 8 a 12◦ en invierno hasta 37 ◦ e verano. Los datos utilizados fueron colectados desde enero del 2000 hasta diciembre del 2003 a partir de información de las mismas autoridades del parque así como de estaciones meteorológicas.
  • 6. Parque Natural de Montesinho
  • 7. Analisis del Problema Mapa del Parque Natural Montesinho El problema del parque es que sufre constantemente de incendios, los cuales a pesar muchas veces de ser de pequeño tamaño pueden salirse de control y provocar daños en el ecosistemas y hasta perdidas humanas y materiales. Este analisis permitiria predecir la ocurrencia de los incendios en base a las condiciones meteorologicas y de afluencia al parque y los sitios donde mas frecuentemente se dan a fin de tomar medidas preventivas. Los investigadores ubicaron el area del Parque de Montesihno en un cuadrante de 9x9 para acotar incendios y relacionarlos en base a su tiempo, lugar, hora, intensidad y otras caracteristicas.
  • 8. Parque Natural de Montesinho
  • 9. Relaciones Mapa del parque al que se le aplico una cuadricula de 9x9 para la investigacion y ubicar los incendios. Mapa del parque Montesinho en el que se observan los principales accesos y rutas para transitarlo.
  • 10. Descripcion del Dataset Caracteristicas del Data Set Variado Caracreristicas de los atributos Real Tareas asociadas Regresivo Area: Física Numero de Instancias 517 Numero de Atributos 13 Valores perdidos N/A Fecha de los datos 2008-02-29 Fuentes de los datos: Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems, University of Minho, Portugal. Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems, University of Minho, Portugal.
  • 11. Algoritmos de Analisis El análisis estadístico es un componente del análisis de datos. En el contexto de la inteligencia de negocios (BI), el análisis estadístico requiere recoger y escudriñar cada muestra de datos individual en una serie de artículos desde los cuales se puede extraer las muestras. Para realizar estos analisis es necesario aplicar ALGORITMOS. Un algoritmo es básicamente una regla abstracta que permite encontrar y expresar aquello que buscamos (en el mundo del big data, generalmente la búsqueda de patrones y relaciones entre variables). Estos algoritmos son desarrollados con el único objetivo de automatizar un camino óptimo que ayude al ser humano a tratar la ingente cantidad de datos que se genera diariamente. De hecho, los algoritmos, junto con el hardware y las redes constituyen los tres pilares sobre los que sustenta la transformación digital de muchas industrias.
  • 12. Algoritmos de Analisis El análisis estadístico puede optar para iniciar con el analisis dependiendo del tipo de informacion entre los ALGORITMOS DE CLASIFICACIÓN y los de REGRESIÓN. • La REGRESIÓN tiene el objetivo de predecir valores continuos (Números pues, como el 1, 2.3, 3.1416 etc…) • La CLASIFICACIÓN tiene la tarea de asignar una clase, es decir predecir a que clase pertenece un conjunto de datos, aquí es muy importante entender que en los problemas de clasificación los valores son discretos . U ejemplo puede ser el de fijar el precio de una casa o propiedad, que se hace por lo general basado en una serie de parámetros como la cantidad de baños, metros cuadrados, habitaciones, etc. Al final lo que se busca es que el algoritmo arroje un dato continuo, en este caso el valor de la casa.
  • 13. Atributos Fuentes de los datos: Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems, University of Minho, Portugal. Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems, University of Minho, Portugal. 1. X – Eje X o Coordenada X en la cuadricula de 9x9, valores de 1 a 9 2. Y – Eje Y o Coordenada Y en la cuadricula de 9x9, valores de 2 a 9 3. MES – Mes del año del incendio : ‘ene' a 'dic' 4. DIA – Dia de la semana del incendio : ‘lun' to ‘dom' 5. FFMC - FFMC index from the FWI system: 18.7 to 96.20 6. DMC - DMC index from the FWI system: 1.1 to 291.3 7. DC - DC index from the FWI system: 7.9 to 860.6 8. ISI - ISI index from the FWI system: 0.0 to 56.10 9. TEMP –Temperatura en grados Celsius: 2.2 to 33.30 10. RH – Porcentaje de humedad %: 15.0 to 100 11. VIENTO- Velocidad del viento en km/h: 0.40 to 9.40 12. LLUVIA – Precipitaciones por lluvia en mm/m2 : 0.0 to 6.4 13. AREA – Area quemada en la foresta (has): 0.00 to 1090.84 (this output variable is very skewed towards 0.0, thus it may make sense to model with the logarithm transform).
  • 14. Formato archivo WEKA Un archivo ARFF (Attribute-Relation File Format) es un fichero de texto en formato ASCII que describe la lista de instancias que conformaran un grupo de atributos a evaluar mediate WEKA. Los archivos ARFF se dividen en dos partes, la CABECERA de la informacion y los datos (DATA). % 1. Titulo: EstudiosFluoroscopio % 2. Fuentes: http://www.direccion.dominio.xx % Creador: Fernando Casas y Raul Lopez % Contacto fernando.casas@imss.gob.mx % (c) Fecha: 07/03/2018 % @RELATION Fluoroscopio @ATTRIBUTE cornea NUMERIC @ATTRIBUTE pupilawidth NUMERIC @ATTRIBUTE pupilalength NUMERIC @ATTRIBUTE macula NUMERIC @ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica} @DATA 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa CABECERA o Descripcion de datos DATA
  • 16. REFERENCIAS P. Cortez and A. Morais. A Data Mining Approach to Predict Forest Fires using Meteorological Data. In J. Neves, M. F. Santos and J. Machado Eds., New Trends in Artificial Intelligence, Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence, December, Guimaraes, Portugal, pp. 512-523, 2007. APPIA, ISBN-13 978-989-95618- 0-9. • http://www.dsi.uminho.pt/~pcortez/forestfires • http://www3.dsi.uminho.pt/pcortez/fires.pdf Diario EL PAIS • https://elpais.com/internacional/2017/10/19/actualidad/1508410409_311317 .html Fuentes de los datos: • Paulo Cortez, pcortez '@' dsi.uminho.pt, Department of Information Systems, University of Minho, Portugal. Aníbal Morais, araimorais '@' gmail.com, Department of Information Systems, University of Minho, Portugal