SlideShare una empresa de Scribd logo
1 de 22
Descargar para leer sin conexión
Predicción de contaminación con
técnicas de Machine Learning
Lidia Contreras
Dpt. Sistemes Informàtics i Computació UPV
@liconoc
REUNIÓN GRUPO DE USUARIOS R VALENCIA 09/03/2016
@ValenciaRUsers https://valenciarusers.wordpress.com/
Predicción de contaminación con técnicas de Machine Learning
Lidia Contreras
Índice
2
• Fuentes de datos y parámetros
• Estudio de los datos
• Tráfico y viento
• Predicción
• Extrapolación
• Web
• Posibles mejoras
Fuentes de datos y parámetros
3
Datos históricos horarios de tres años (2013-2014-2015)
• CONTAMINACIÓN
• Fuente: GeneralitatValenciana
• Parámetros: CO, NO, NO2, PM 2.5, PM10, SO2, O3
• DATOS METEOROLÓGICOS
• Fuente: AEMET
• Parámetros:Temperatura, Humedad,Velocidad y Dirección del viento, Precipitación y Presión
• TRÁFICO
• Fuente: Ayuntamiento deValencia
• Parámetros: Intensidad de los Puntos de Medida deTráfico - Espiras electromagnéticas
(vehículos/hora)
Estudio de los datos
4Porcentaje de datos de contaminación completos por estación y año
% CO NO NO2 PM2.5 PM10 SO2 O3
2013 25,38 72,37 72,37 82,25 97,26
2014 89,21 89,2 89,49 98,69
2015 8,46 86,46 86,46 90,23 97,66
Total 41,02 82,68 52,94 87,32 97,87
2013 90,7 79,95 79,95 93,43 93,37 84,89 97,43
2014 81,95 81,11 81,11 92,6 92,6 76,63 92,6
2015 90,13 84,19 84,19 77,64 77,64 85,11 97,04
Total 87,59 81,75 81,75 87,89 87,87 82,21 95,69
2013 48,13 79,59 79,59 72,08 72,08 94,16 96,61
2014 88,25 89,18 88,84 96,63 96,63 65,66 94,17
2015 74,09 86,39 86,27 84,91 84,91 96,1 95,76
Total 70,16 85,05 84,90 84,54 84,54 85,31 95,51
2013 73,56 69,43 69,43 99,79 71,51 99,27
2014 96,28 99,69 99,69 99,34 99,34 89,83 97,23
2015 86,73 88,97 88,97 64,23 97,49 86,28 89,68
Total 85,52 86,03 86,03 54,52 98,87 82,54 95,39
2013 84,26 84,26 97,31 97,31 68,2 82,93
2014 96,68 96,68 97,93 97,93 88,65 93,42
2015 92,82 92,82 97,9 97,9 83,36 91,07
Total 91,25 91,25 97,71 97,71 80,07 89,14
2013 88,39 63,25 63,25 74,24 85,53
2014 92,12 92,12 91,02 97,19
2015 29,46 81,9 81,9 83,74 90,41
Total 39,28 79,09 79,09 83,00 91,04
UPV
Viveros
Bulevar
Francia
Moli
Pista
Estudio de los datos
5Librería: openair
windRose(dat, breaks=c(0,5,10,15,20,25,30), angle=20, cols="jet", paddle=FALSE, offset=5,
key.header= "Wind speed", key.footer="m/s", key.position="right", main="WindRose")
calendarPlot(dat, pollutant = "No2", year = 2014, annotate =
"ws", main="Dirección del viento en 2014 (+NO2 en Bulevar)")
Estudio de los datos
6
summaryPlot(dat, percentile=0.98, na.len=12, col.trend="blue", xlab=c("Gráficas de evolución
anual", "Histogramas"), main="Gráfica resumen de parámetros")
polarFreq(dat, pollutant=“NO”, statistic="mean", ws.int=0.4,
ws.upper=8, min.bin=5, grid.line=2, border.col="white",
main="Distribution of no depending on wind speed and wind
direction”,key.header="Mean", key.footer="")
Estudio de los datos
7
timeVariation(dat, pollutant=objs2[1:4], normalise =TRUE, difference=FALSE,
ylab="Concentration", xlab=c(paste(estaciones[i],": Hour",sep = ""), "Hour", "Month", "Week"))
Puntos de tráfico
8
1245 Puntos de medida de tráfico
Estaciones
9
6 Estaciones de medición de contaminación
Tráfico y viento –Versión sin viento
10
Todo el tráfico en un radio de 1km
E
Tráfico y viento –Versión con viento
11
Todo el tráfico en un radio de 1km dentro de ±30º en la dirección del viento
E
Tráfico y viento –Versión con viento y distancia
12
Todo el tráfico en un radio de 1km, dando más peso a aquellos puntos dentro
de ±30º en la dirección del viento
E
Librería: geosphere
Distancia de la estación al punto de tráfico (LAT, LON):
distHaversine(Estación, Punto)  metros
Dirección del punto de tráfico respecto a la estación (LAT, LON):
bearingRhumb(Punto, Estación)  grados
Predicción
13
Para cada contaminante en cada estación:
• Parámetros usados:
• Día, mes, año, hora, día de la semana
• Temperatura, presión, humedad, velocidad del
viento, precipitación
• Trafico (Según versión)
• Contaminante 3h antes, Tráfico 3h antes,
Temperatura 3h antes.
• Contaminantes relacionados:
• O3NO 3h antes, NO2 3h antes
• NO, NO2O3 3h antes
Librerías: Rweka, quantreg, randomForest
• Modelos:
• Linear Regression (lr)
• Quantile Regression (qr) with lasso method
• K nearest neighbours (IBKreg) with k=10
• Decision tree for regression (M5P)
• Random Forest (RF)
• Tres modelos básicos:
• TrainMean: Siempre predice la media deTrain
• TestMean: Siempre predice la media deTest
• X3H:Valor del contaminante 3h antes
Data Splitting
• Test: 1,2,3 y 4 meses
• Train: Dataset-Test
Librería: caret
#24h al dia * 30 dias = 720h al mes
#mesestest va de 1 a 4
numtest=mesestest*720
timeSlices<-createTimeSlices(1:nrow(dat), initialWindow = nrow(dat)-numtest,
horizon = numtest, fixedWindow = FALSE, skip = 720)
Predicción - Resultados
14
Media Real Estación TrainMean TestMean X3h LinearRegression qr IBkreg M5p RF
CO 0.111 0.071 0.052 0.028 0.055 0.059 0.051 0.056 0.050
NO 10.315 17.010 18.910 17.327 14.392 15.481 15.076 16.587 12.954
NO2 28.265 15.922 15.797 14.382 15.797 12.479 13.425 15.284 11.206
PM2.5 11.160 7.000 7.033 5.035 5.962 4.524 5.889 6.870 5.957
PM10 14.356 7.981 7.619 4.753 7.776 6.704 7.515 7.581 8.043
O3 46.866 25.452 19.328 13.276 11.808 11.661 12.154 9.603 9.311
SO2 2.471 1.187 0.821 0.605 0.944 1.136 0.836 1.192 0.798
Mean Absolute Error (MAE) –Versión viento+distancia Molí del Sol
Interpolación entre estaciones
15
Métodos:
• Media
• LIDW (Local Inverse
Distance Weighting)
• Wind Sensitive LIDW
• Kriging
Librería: geoR
coordenadas <- as.geodata(coordenadas)
kriging <- ksline(coordenadas,
cov.model="exp", cov.pars=c(10,3.33), nugget=0,
locations=c(longitud, latitud) )
prediccion<-kriging$predict
Interpolación - Resultados
16
Media LIDW
Wind
Sensitive
LIDW
Kriging
CO 0 1 2 1
NO 0 11 17 0
NO2 1 9 17 1
PM2.5 3 0 4 5
O3 7 3 11 7
PM10 1 0 2 3
SO2 5 4 9 10
Conteo mejores modelos
grd <- expand.grid(x=seq(from=x.range[1], to=x.range[2], by=0.001), y=seq(from=y.range[1],
to=y.range[2], by=0.001))
q <- ksline(NO, cov.model="exp",cov.pars=c(10,3.33), nugget=0,locations=grd)
image(q, val=q$predict)
points(NO)
Librería: geoR
Extrapolación - Mapas
17
Valencia <- get_map(location=c(lon=-0.3783341, lat=39.4732093), zoom=14, maptype="terrain")
…
ggmap(Valencia, extent = "device") +
stat_density2d(data = coordenadas,aes(x =V1, y =V2, fill = ..level.., alpha = 10), size = 10, bins = 8, geom = "polygon") +
scale_alpha(range = c(0, 0.5), guide = FALSE)+
scale_fill_distiller(palette = "Blues") +
labs(fill = "Concentration") +
theme_nothing(legend =TRUE) +
guides(fill = guide_legend(reverse = FALSE, override.aes = list(alpha = 1)))
Librería: ggmap
Kriging
PM10
LIDW
PM10
Web
18
Librerías:
• geosphere
• randomForest
• quantreg
Tráfico en tiempo real
Observación meteorológica
Modelos predictivos
.RData por contaminante y estación
API Google Maps
15min
• Id punto de medida tráfico
• Coordenadas
• Nombre vía
• Intensidad horaria tráfico
• Datos meteorológicos
• Predicción contaminantes
Web
19
http://users.dsic.upv.es/~flip/airvlc/
Posibles mejoras
20
• Mejorar la predicción/extrapolación
• Web:
• Cambiar AEMET por OpenWeatherMap para los datos
meteorológicos
• Cambiar Google Maps por OpenStreetMap
• Usar Leaflet + Mapbox para crear mapas temáticos
• Aplicar extrapolación a toda la ciudad y no solo a los puntos
de tráfico
21

Más contenido relacionado

La actualidad más candente

13.analisis del hidrograma
13.analisis del hidrograma13.analisis del hidrograma
13.analisis del hidrogramaFátima Lds
 
Curva aprendizaje
Curva aprendizajeCurva aprendizaje
Curva aprendizajeyuverrr
 
Presentación precipitacion
Presentación precipitacionPresentación precipitacion
Presentación precipitacionmjdugaro
 
histograma ingenieria civil - fluidos
histograma ingenieria civil - fluidos histograma ingenieria civil - fluidos
histograma ingenieria civil - fluidos FrancoMoralesMenacho2
 
Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)
Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)
Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)Aldo Pescador
 
Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...
Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...
Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...Royercitocruz
 
2. sistema de bombeo y punto de funcionamiento
2. sistema de bombeo y punto de funcionamiento2. sistema de bombeo y punto de funcionamiento
2. sistema de bombeo y punto de funcionamientoroberto vo
 
Regionalizacion idf iarh_last vesion
Regionalizacion idf iarh_last vesionRegionalizacion idf iarh_last vesion
Regionalizacion idf iarh_last vesionGustavo Devoto
 
Estimación de la Evapotranspiración de referencia
Estimación de la Evapotranspiración de referenciaEstimación de la Evapotranspiración de referencia
Estimación de la Evapotranspiración de referenciaInfoAndina CONDESAN
 

La actualidad más candente (19)

Funciones de distribución aplicadas al cálculo de avenidas
Funciones de distribución aplicadas al cálculo de avenidasFunciones de distribución aplicadas al cálculo de avenidas
Funciones de distribución aplicadas al cálculo de avenidas
 
13.analisis del hidrograma
13.analisis del hidrograma13.analisis del hidrograma
13.analisis del hidrograma
 
Taller 1 datos climáticos – como bajar, procesar e interpolar
Taller 1   datos climáticos – como bajar, procesar e interpolarTaller 1   datos climáticos – como bajar, procesar e interpolar
Taller 1 datos climáticos – como bajar, procesar e interpolar
 
Curva aprendizaje
Curva aprendizajeCurva aprendizaje
Curva aprendizaje
 
Cortez
CortezCortez
Cortez
 
Presentación precipitacion
Presentación precipitacionPresentación precipitacion
Presentación precipitacion
 
histograma ingenieria civil - fluidos
histograma ingenieria civil - fluidos histograma ingenieria civil - fluidos
histograma ingenieria civil - fluidos
 
solucionario cap 3 treybal
solucionario cap 3 treybalsolucionario cap 3 treybal
solucionario cap 3 treybal
 
Taller 2 modelos estadísticos de cultivos
Taller 2   modelos estadísticos de cultivosTaller 2   modelos estadísticos de cultivos
Taller 2 modelos estadísticos de cultivos
 
Presentacion trabajo
Presentacion trabajoPresentacion trabajo
Presentacion trabajo
 
Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)
Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)
Actividad de cierre( aproximaciones, diferenciales y estimacion de errores)
 
Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...
Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...
Dlscrib.com pdf-ejercicios-resueltos-de-estructuras-hidraulicas-dl fe07b8bda1...
 
2. sistema de bombeo y punto de funcionamiento
2. sistema de bombeo y punto de funcionamiento2. sistema de bombeo y punto de funcionamiento
2. sistema de bombeo y punto de funcionamiento
 
Regionalizacion idf iarh_last vesion
Regionalizacion idf iarh_last vesionRegionalizacion idf iarh_last vesion
Regionalizacion idf iarh_last vesion
 
Aerogenerador
AerogeneradorAerogenerador
Aerogenerador
 
Capacidad santa cruz 1
Capacidad santa cruz 1Capacidad santa cruz 1
Capacidad santa cruz 1
 
Estimacion e to
Estimacion e toEstimacion e to
Estimacion e to
 
Estimación de la Evapotranspiración de referencia
Estimación de la Evapotranspiración de referenciaEstimación de la Evapotranspiración de referencia
Estimación de la Evapotranspiración de referencia
 
Área de sedimentador continuo
Área de sedimentador continuoÁrea de sedimentador continuo
Área de sedimentador continuo
 

Similar a Predicción de contaminación con técnicas de Machine Learning (Contamination Forecasting)

Louis R Parasid Colombia Ideam Oct 2009
Louis R   Parasid Colombia Ideam Oct 2009Louis R   Parasid Colombia Ideam Oct 2009
Louis R Parasid Colombia Ideam Oct 2009CIAT
 
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentesSierra Francisco Justo
 
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentesSierra Francisco Justo
 
Volumen,velocidad, nivel de servicio
Volumen,velocidad, nivel de servicioVolumen,velocidad, nivel de servicio
Volumen,velocidad, nivel de serviciosalim luna
 
La distancia y la velocidad inciden en la termografía
La distancia y la velocidad inciden en la termografíaLa distancia y la velocidad inciden en la termografía
La distancia y la velocidad inciden en la termografíaalfonso gallegos
 
Seminario Especialización PR 2018 - VAmado.pdf
Seminario Especialización PR 2018 - VAmado.pdfSeminario Especialización PR 2018 - VAmado.pdf
Seminario Especialización PR 2018 - VAmado.pdfmariohperez59
 
escaner laser aplicada a la mineria
escaner laser aplicada a la mineriaescaner laser aplicada a la mineria
escaner laser aplicada a la mineriaChristian G Solis
 
RADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLAR
RADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLARRADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLAR
RADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLARRoberto Valer
 
LABORATORIO DE FLUIDOS
LABORATORIO DE FLUIDOSLABORATORIO DE FLUIDOS
LABORATORIO DE FLUIDOSkevalex_4
 
VirtualSoil: como utilizar escenarios virtuales para tomar decisiones
VirtualSoil: como utilizar escenarios virtuales para tomar decisionesVirtualSoil: como utilizar escenarios virtuales para tomar decisiones
VirtualSoil: como utilizar escenarios virtuales para tomar decisionesLabFerrer LabFerrer
 
Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....
Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....
Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....Vladimir Gutierrez, PhD
 
Tecnologia de informacion del senamhi
Tecnologia de informacion del senamhiTecnologia de informacion del senamhi
Tecnologia de informacion del senamhiJorge Chira
 
Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...
Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...
Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...CPIC
 
Inventario Emisiones Ventana
Inventario Emisiones VentanaInventario Emisiones Ventana
Inventario Emisiones Ventanapipaestevez
 

Similar a Predicción de contaminación con técnicas de Machine Learning (Contamination Forecasting) (20)

Louis R Parasid Colombia Ideam Oct 2009
Louis R   Parasid Colombia Ideam Oct 2009Louis R   Parasid Colombia Ideam Oct 2009
Louis R Parasid Colombia Ideam Oct 2009
 
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
 
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
11 fiuba dt2016 relacióndiseñogeométrico&amp;accidentes
 
Volumen,velocidad, nivel de servicio
Volumen,velocidad, nivel de servicioVolumen,velocidad, nivel de servicio
Volumen,velocidad, nivel de servicio
 
La distancia y la velocidad inciden en la termografía
La distancia y la velocidad inciden en la termografíaLa distancia y la velocidad inciden en la termografía
La distancia y la velocidad inciden en la termografía
 
Seminario Especialización PR 2018 - VAmado.pdf
Seminario Especialización PR 2018 - VAmado.pdfSeminario Especialización PR 2018 - VAmado.pdf
Seminario Especialización PR 2018 - VAmado.pdf
 
escaner laser aplicada a la mineria
escaner laser aplicada a la mineriaescaner laser aplicada a la mineria
escaner laser aplicada a la mineria
 
RADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLAR
RADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLARRADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLAR
RADIÓMETRO AUTÓNOMO PARA EL MONITOREO DEL RECURSO SOLAR
 
LABORATORIO DE FLUIDOS
LABORATORIO DE FLUIDOSLABORATORIO DE FLUIDOS
LABORATORIO DE FLUIDOS
 
VirtualSoil: como utilizar escenarios virtuales para tomar decisiones
VirtualSoil: como utilizar escenarios virtuales para tomar decisionesVirtualSoil: como utilizar escenarios virtuales para tomar decisiones
VirtualSoil: como utilizar escenarios virtuales para tomar decisiones
 
Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....
Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....
Análisis de la disponibilidad de observaciones meteorológicas en tiempo real....
 
Tecnologia de informacion del senamhi
Tecnologia de informacion del senamhiTecnologia de informacion del senamhi
Tecnologia de informacion del senamhi
 
Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...
Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...
Estudios y Modelización para el diseño de los emisarios Dock Sud y Berazategu...
 
Presentación xx simposio peruano de energía solar lcp 17 10 2013
Presentación xx simposio peruano de energía solar lcp 17 10 2013Presentación xx simposio peruano de energía solar lcp 17 10 2013
Presentación xx simposio peruano de energía solar lcp 17 10 2013
 
Localizacion sismos fasciculo3
Localizacion sismos fasciculo3Localizacion sismos fasciculo3
Localizacion sismos fasciculo3
 
Presentacion thesisphd4
Presentacion thesisphd4Presentacion thesisphd4
Presentacion thesisphd4
 
Cigre 2006
Cigre 2006Cigre 2006
Cigre 2006
 
Informe malla bt uac
Informe malla bt uacInforme malla bt uac
Informe malla bt uac
 
Informe topografia
Informe topografiaInforme topografia
Informe topografia
 
Inventario Emisiones Ventana
Inventario Emisiones VentanaInventario Emisiones Ventana
Inventario Emisiones Ventana
 

Último

SQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOS
SQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOSSQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOS
SQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOSLuisDavidGarciaInga2
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxYoladsCabarcasTous
 
Las familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdfLas familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdfJC Díaz Herrera
 
Presentación del Mapa del Talento Cotec-Ivie 2023
Presentación del Mapa del Talento Cotec-Ivie 2023Presentación del Mapa del Talento Cotec-Ivie 2023
Presentación del Mapa del Talento Cotec-Ivie 2023Ivie
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Ivie
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotessald071205mmcnrna9
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfhernestosoto82
 
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfINTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfmaryisabelpantojavar
 
SESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.docSESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.docrobinsonsjuan
 
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptxceliajessicapinedava
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfeluniversocom
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptxccordovato
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILeluniversocom
 
DEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptx
DEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptxDEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptx
DEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptxYamile Divina Acevedo
 
TABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdf
TABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdfTABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdf
TABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdfMartinRodriguezchave1
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405rodrimarxim
 
15-04-24-Dispositivos de Procesamiento.pptx
15-04-24-Dispositivos de Procesamiento.pptx15-04-24-Dispositivos de Procesamiento.pptx
15-04-24-Dispositivos de Procesamiento.pptxmgm & asociado
 
LÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdf
LÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdfLÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdf
LÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdfFranyeskaMagallanes
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 

Último (20)

SQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOS
SQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOSSQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOS
SQL SERVER Y MYSQL - ADMINISTRACIÓN DE BASE DE DATOS
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptx
 
Las familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdfLas familias más ricas dentro del sionismo (2024).pdf
Las familias más ricas dentro del sionismo (2024).pdf
 
Presentación del Mapa del Talento Cotec-Ivie 2023
Presentación del Mapa del Talento Cotec-Ivie 2023Presentación del Mapa del Talento Cotec-Ivie 2023
Presentación del Mapa del Talento Cotec-Ivie 2023
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotes
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdf
 
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfINTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
 
SESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.docSESIONES ABRIL para sexto grado de nivel primario.doc
SESIONES ABRIL para sexto grado de nivel primario.doc
 
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
2.8 CRONOGRAMA TALLER DE INVESTIGACION 1 .pptx
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
 
DEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptx
DEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptxDEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptx
DEFINICION DE GLOBALIZACION Y SU IMPACTOI EN LA EN LA CULTURA.pptx
 
TABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdf
TABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdfTABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdf
TABLERO-DE-CONTROL-SOFOMES-ENR_08012024.pdf
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405
 
15-04-24-Dispositivos de Procesamiento.pptx
15-04-24-Dispositivos de Procesamiento.pptx15-04-24-Dispositivos de Procesamiento.pptx
15-04-24-Dispositivos de Procesamiento.pptx
 
LÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdf
LÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdfLÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdf
LÍNEA DE TIEMPO- ANTROPOLOGIA jsjudhdv.pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 

Predicción de contaminación con técnicas de Machine Learning (Contamination Forecasting)

  • 1. Predicción de contaminación con técnicas de Machine Learning Lidia Contreras Dpt. Sistemes Informàtics i Computació UPV @liconoc REUNIÓN GRUPO DE USUARIOS R VALENCIA 09/03/2016 @ValenciaRUsers https://valenciarusers.wordpress.com/
  • 2. Predicción de contaminación con técnicas de Machine Learning Lidia Contreras
  • 3. Índice 2 • Fuentes de datos y parámetros • Estudio de los datos • Tráfico y viento • Predicción • Extrapolación • Web • Posibles mejoras
  • 4. Fuentes de datos y parámetros 3 Datos históricos horarios de tres años (2013-2014-2015) • CONTAMINACIÓN • Fuente: GeneralitatValenciana • Parámetros: CO, NO, NO2, PM 2.5, PM10, SO2, O3 • DATOS METEOROLÓGICOS • Fuente: AEMET • Parámetros:Temperatura, Humedad,Velocidad y Dirección del viento, Precipitación y Presión • TRÁFICO • Fuente: Ayuntamiento deValencia • Parámetros: Intensidad de los Puntos de Medida deTráfico - Espiras electromagnéticas (vehículos/hora)
  • 5. Estudio de los datos 4Porcentaje de datos de contaminación completos por estación y año % CO NO NO2 PM2.5 PM10 SO2 O3 2013 25,38 72,37 72,37 82,25 97,26 2014 89,21 89,2 89,49 98,69 2015 8,46 86,46 86,46 90,23 97,66 Total 41,02 82,68 52,94 87,32 97,87 2013 90,7 79,95 79,95 93,43 93,37 84,89 97,43 2014 81,95 81,11 81,11 92,6 92,6 76,63 92,6 2015 90,13 84,19 84,19 77,64 77,64 85,11 97,04 Total 87,59 81,75 81,75 87,89 87,87 82,21 95,69 2013 48,13 79,59 79,59 72,08 72,08 94,16 96,61 2014 88,25 89,18 88,84 96,63 96,63 65,66 94,17 2015 74,09 86,39 86,27 84,91 84,91 96,1 95,76 Total 70,16 85,05 84,90 84,54 84,54 85,31 95,51 2013 73,56 69,43 69,43 99,79 71,51 99,27 2014 96,28 99,69 99,69 99,34 99,34 89,83 97,23 2015 86,73 88,97 88,97 64,23 97,49 86,28 89,68 Total 85,52 86,03 86,03 54,52 98,87 82,54 95,39 2013 84,26 84,26 97,31 97,31 68,2 82,93 2014 96,68 96,68 97,93 97,93 88,65 93,42 2015 92,82 92,82 97,9 97,9 83,36 91,07 Total 91,25 91,25 97,71 97,71 80,07 89,14 2013 88,39 63,25 63,25 74,24 85,53 2014 92,12 92,12 91,02 97,19 2015 29,46 81,9 81,9 83,74 90,41 Total 39,28 79,09 79,09 83,00 91,04 UPV Viveros Bulevar Francia Moli Pista
  • 6. Estudio de los datos 5Librería: openair windRose(dat, breaks=c(0,5,10,15,20,25,30), angle=20, cols="jet", paddle=FALSE, offset=5, key.header= "Wind speed", key.footer="m/s", key.position="right", main="WindRose") calendarPlot(dat, pollutant = "No2", year = 2014, annotate = "ws", main="Dirección del viento en 2014 (+NO2 en Bulevar)")
  • 7. Estudio de los datos 6 summaryPlot(dat, percentile=0.98, na.len=12, col.trend="blue", xlab=c("Gráficas de evolución anual", "Histogramas"), main="Gráfica resumen de parámetros") polarFreq(dat, pollutant=“NO”, statistic="mean", ws.int=0.4, ws.upper=8, min.bin=5, grid.line=2, border.col="white", main="Distribution of no depending on wind speed and wind direction”,key.header="Mean", key.footer="")
  • 8. Estudio de los datos 7 timeVariation(dat, pollutant=objs2[1:4], normalise =TRUE, difference=FALSE, ylab="Concentration", xlab=c(paste(estaciones[i],": Hour",sep = ""), "Hour", "Month", "Week"))
  • 9. Puntos de tráfico 8 1245 Puntos de medida de tráfico
  • 10. Estaciones 9 6 Estaciones de medición de contaminación
  • 11. Tráfico y viento –Versión sin viento 10 Todo el tráfico en un radio de 1km E
  • 12. Tráfico y viento –Versión con viento 11 Todo el tráfico en un radio de 1km dentro de ±30º en la dirección del viento E
  • 13. Tráfico y viento –Versión con viento y distancia 12 Todo el tráfico en un radio de 1km, dando más peso a aquellos puntos dentro de ±30º en la dirección del viento E Librería: geosphere Distancia de la estación al punto de tráfico (LAT, LON): distHaversine(Estación, Punto)  metros Dirección del punto de tráfico respecto a la estación (LAT, LON): bearingRhumb(Punto, Estación)  grados
  • 14. Predicción 13 Para cada contaminante en cada estación: • Parámetros usados: • Día, mes, año, hora, día de la semana • Temperatura, presión, humedad, velocidad del viento, precipitación • Trafico (Según versión) • Contaminante 3h antes, Tráfico 3h antes, Temperatura 3h antes. • Contaminantes relacionados: • O3NO 3h antes, NO2 3h antes • NO, NO2O3 3h antes Librerías: Rweka, quantreg, randomForest • Modelos: • Linear Regression (lr) • Quantile Regression (qr) with lasso method • K nearest neighbours (IBKreg) with k=10 • Decision tree for regression (M5P) • Random Forest (RF) • Tres modelos básicos: • TrainMean: Siempre predice la media deTrain • TestMean: Siempre predice la media deTest • X3H:Valor del contaminante 3h antes Data Splitting • Test: 1,2,3 y 4 meses • Train: Dataset-Test Librería: caret #24h al dia * 30 dias = 720h al mes #mesestest va de 1 a 4 numtest=mesestest*720 timeSlices<-createTimeSlices(1:nrow(dat), initialWindow = nrow(dat)-numtest, horizon = numtest, fixedWindow = FALSE, skip = 720)
  • 15. Predicción - Resultados 14 Media Real Estación TrainMean TestMean X3h LinearRegression qr IBkreg M5p RF CO 0.111 0.071 0.052 0.028 0.055 0.059 0.051 0.056 0.050 NO 10.315 17.010 18.910 17.327 14.392 15.481 15.076 16.587 12.954 NO2 28.265 15.922 15.797 14.382 15.797 12.479 13.425 15.284 11.206 PM2.5 11.160 7.000 7.033 5.035 5.962 4.524 5.889 6.870 5.957 PM10 14.356 7.981 7.619 4.753 7.776 6.704 7.515 7.581 8.043 O3 46.866 25.452 19.328 13.276 11.808 11.661 12.154 9.603 9.311 SO2 2.471 1.187 0.821 0.605 0.944 1.136 0.836 1.192 0.798 Mean Absolute Error (MAE) –Versión viento+distancia Molí del Sol
  • 16. Interpolación entre estaciones 15 Métodos: • Media • LIDW (Local Inverse Distance Weighting) • Wind Sensitive LIDW • Kriging Librería: geoR coordenadas <- as.geodata(coordenadas) kriging <- ksline(coordenadas, cov.model="exp", cov.pars=c(10,3.33), nugget=0, locations=c(longitud, latitud) ) prediccion<-kriging$predict
  • 17. Interpolación - Resultados 16 Media LIDW Wind Sensitive LIDW Kriging CO 0 1 2 1 NO 0 11 17 0 NO2 1 9 17 1 PM2.5 3 0 4 5 O3 7 3 11 7 PM10 1 0 2 3 SO2 5 4 9 10 Conteo mejores modelos grd <- expand.grid(x=seq(from=x.range[1], to=x.range[2], by=0.001), y=seq(from=y.range[1], to=y.range[2], by=0.001)) q <- ksline(NO, cov.model="exp",cov.pars=c(10,3.33), nugget=0,locations=grd) image(q, val=q$predict) points(NO) Librería: geoR
  • 18. Extrapolación - Mapas 17 Valencia <- get_map(location=c(lon=-0.3783341, lat=39.4732093), zoom=14, maptype="terrain") … ggmap(Valencia, extent = "device") + stat_density2d(data = coordenadas,aes(x =V1, y =V2, fill = ..level.., alpha = 10), size = 10, bins = 8, geom = "polygon") + scale_alpha(range = c(0, 0.5), guide = FALSE)+ scale_fill_distiller(palette = "Blues") + labs(fill = "Concentration") + theme_nothing(legend =TRUE) + guides(fill = guide_legend(reverse = FALSE, override.aes = list(alpha = 1))) Librería: ggmap Kriging PM10 LIDW PM10
  • 19. Web 18 Librerías: • geosphere • randomForest • quantreg Tráfico en tiempo real Observación meteorológica Modelos predictivos .RData por contaminante y estación API Google Maps 15min • Id punto de medida tráfico • Coordenadas • Nombre vía • Intensidad horaria tráfico • Datos meteorológicos • Predicción contaminantes
  • 21. Posibles mejoras 20 • Mejorar la predicción/extrapolación • Web: • Cambiar AEMET por OpenWeatherMap para los datos meteorológicos • Cambiar Google Maps por OpenStreetMap • Usar Leaflet + Mapbox para crear mapas temáticos • Aplicar extrapolación a toda la ciudad y no solo a los puntos de tráfico
  • 22. 21