La predicción de niveles de contaminantes como del ozono troposférico es una tarea compleja debido a los factores que inciden en la generación y acumulación del contaminante.

 

Diferentes factores influyen en los niveles de ozono troposférico como las condiciones meteorológicas, y factores relacionados con las fuentes de emisiones de ozono y sus precursores que están relacionados a la actividad humana, como la actividad industrial y el transporte, entre otras fuentes [1].

 

La Zona Metropolitana del Valle de México (ZMVM) es una de las regiones más altamente pobladas en el mundo por lo que presenta grandes retos para el control de niveles de contaminantes atmosféricos como es el caso del ozono atmosférico [1,2].

 

Nuevas herramientas y soluciones, como mejores pronósticos, son importantes para predecir episodios con altos niveles de contaminación. Dichos pronósticos pueden aportar información valiosa a los tomadores de decisiones en la gestión de alertas. En este sentido en este proyecto se trabaja en el desarrollo y puesta en marcha de un pronóstico operativo basado en redes neuronales para la predicción de niveles de ozono.

 

Objetivo

 

Proporcionar un pronóstico operativo de concentración de ozono para las próximas 24 horas utilizando aprendizaje automático, basado en observaciones históricas de los niveles de contaminantes y del pronóstico meteorológico.

 

Metodología

 

Se implementó un sistema de pronóstico basado en redes neuronales que pronostica niveles de ozono para estaciones de la red automática de monitoreo atmosférico (RAMA). Para el modelo se usan como datos de entrada variables del modelo WRF operativo y de reanálisis del Grupo Interacción Océano-Atmósfera (IOA) del ICAyCC de la UNAM [3]  y observaciones de contaminantes de la red automática de monitoreo atmosférico RAMA.

 

Ambiente de desarrollo

 

El modelo se desarrolló usando el lenguaje Python 3.10, el framework de aprendizaje automático Tensor Flow 2.0. [4], y se usaron Jupyter notebooks para facilitar la descripción y visualización de los resultados en el desarrollo y experimentación. Los cálculos y entrenamientos del modelo se corren en el servidor ZION del ICAyCC.

 

En el desarrollo del modelo se proponen y  prueban diferentes configuraciones de datos tanto meteorológicos, de variables contaminantes y parámetros diferentes de modelos de aprendizaje automático.

 

El refinamiento y mejora de los modelos de aprendizaje automático se realiza a través de un proceso de experimentación y evaluación de experimentos.

 

Entradas de datos para el modelo:

 

Para el entrenamiento, se prepararon bases de datos desde el año 2010 hasta el año 2019, se consideraron 10% de los datos para la validación del modelo. Como conjunto de datos de prueba independiente se usa el año 2022.

 

En la experimentación se incluyeron los niveles de los diferentes contaminantes de la red RAMA, variables meteorológicas obtenidas del modelo WRF, y se generan variables armónicas de los tiempos registrados para considerar temporalidad de los datos, donde el año, mes, día, día de la semana de la medición se expresó como senos, y cosenos y como medios senos y cosenos, en la Tabla se muestra las variables usadas.



Tabla 1. Tabla de variables consideradas para el modelo de pronóstico con redes neuronales.

 

Fuente de datos / característica

Descripción

Datos históricos de RAMA O₃

Niveles de ozono O₃ por hora de las estaciones RAMA.

WRF U10

Velocidad del viento zonal a 10 metros.

WRF V10

Velocidad del viento meridional de 10 metros.

WRF RAINC

Precipitación acumulada (convectiva).

WRF RAINNC

Precipitación acumulada (no convectiva).

WRF T2

Temperatura a 2 metros.

WRF SWDOWN

Flujo de radiación de onda corta descendente.

WRF GLW

Flujo de radiación de onda larga descendente.

Armónicos de tiempo

Codificación senoidal y cosenoidal de la hora/día, día/semana y día/año.

 

Aplicación web de visualización del pronóstico operativo:

 

La siguiente interfaz se desarrolló para consulta del pronóstico operativo de niveles de ozono. 

 




Asimismo, la interfaz web se encuentra publicado para su consulta en la dirección:

 

https://aire.atmosfera.unam.mx/

 

En la aplicación de visualización del pronóstico se pueden consultar los últimos valores pronosticados para las siguientes 24 horas de estaciones de la red automática de monitoreo atmosférico.  En la interfaz se puede seleccionar entre las 30 diferentes estaciones con las que se entrenó el modelo. En la Figura se muestra una descripción de la interfaz de visualización del pronóstico operativo.

 

La aplicación web también presenta probabilidades (P_hist) de que en las próximas 24 horas se excedan ciertos umbrales de ozono. Las probabilidades P_hist se basan en el rendimiento observado del pronóstico sobre el conjunto de datos de prueba e incluyen la probabilidad de tener medias mayores a 50 ppbs en periodos de 8 horas, así como las probabilidades de superar los 90 ppb, 120 ppb y 150 ppb.

 

Figura. Gráfico de serie de tiempo de niveles de ozono con pronóstico y últimos niveles observados en la estación.  Se muestra estación seleccionada (La presa, LPR) y hora de pronóstico.  

 

Desempeño del modelo:

 

Las métricas de desempeño obtenidas para el año de prueba del modelo (2022) indicaron un error medio absoluto de 9.8 ppb, una raíz del error cuadrático medio de 12.9 ppb, con un coeficiente de determinación de 0.73 y un índice de concordancia de 0.91.

Referencias

 
  • [1] Peralta, O., Ortínez-Alvarez, A., Torres-Jardón, R., Suárez-Lastra, M., Castro, T., Ruíz-Suárez, L. G. (2021). Ozone over Mexico City during the COVID-19 pandemic. Science of the Total Environment, 761, 143183.
 
  • [2] Guevara, M., Tena, C., Soret, A., Serradell, K., Guzmán, D., Retama, A., ... & Mediavilla, A. (2017). An emission processing system for air quality modelling in the Mexico City metropolitan area: Evaluation and comparison of the MOBILE6.2-Mexico and MOVES-Mexico traffic emissions. Science of The Total Environment, 584, 882-900.
 
 
  • [4] Abadi, M., Agarwal, A., Barham, P., Brevdo, E., Chen, Z., Citro, C., Corrado, G. S., ... & Zheng, X. (2015). TensorFlow: Large-scale machine learning on heterogeneous systems. https://www.tensorflow.org/
 

Puedes consultar el informe completo en el siguiente enlace: PDF