A kernel-based strategy to design Convolutional Neural Network Architecture for learning spatial and temporal representation of weather variables
Loading...
Files
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad de Investigación de Tecnología Experimental Yachay
Abstract
Aunque no existe una definición universal para los eventos de precipitación extrema, puede
referirse como el período de tiempo en el que se supera abruptamente umbrales empíricos
de precipitación. Por lo tanto, su pronóstico oportuno es de gran interés para los tomadores
de decisiones de muchos campos, como: entidades de planificación urbana, investigadores
del agua y en general, instituciones relacionadas con el clima. En este trabajo, se realiza
un enfoque basado en datos para analizar, pronosticar y clasificar eventos de precipitación
extrema a través del estudio de variables hidroclimáticas a lo largo del tiempo de dos estaciones
climatológicas. Dado que el análisis de series de tiempo relacionadas con eventos de
precipitación implica patrones complejos, los datos de entrada requieren pasar por etapas
de pre-procesamiento, preparaci´on de datos y técnicas de análisis. En este sentido, se emplean
métodos de selección de características e ingeniería de características para lograr un
alto rendimiento en la etapa de clasificación y regresión de datos. Específicamente, análisis
de correlación, análisis de componentes principales (PCA) y relief -F de regresión (RR)
se consideran un análisis exploratorio de variables. Posteriormente, un clasificador basado
en máquina de vectores de soporte (SVM) realiza una clasificación y una red neuronal
convolucional (CNN) ajusta un algoritmo de regresión.
Los resultados reflejan que el conjunto de datos reducido obtenido por RR no estandarizado
discrimina mejor que el PCA pero no tan bien como el conjunto de datos
estandarizado con todas las variables. El análisis de correlación indica patrones comunes
entre las dos estaciones climatológicas. Finalmente, el algoritmo de regresión muestra la
capacidad de la CNN combinada con algoritmos de aprendizaje profundo como long-short
term memory y convoluciones 1-D, 2-D para aprender la representación espacio-temporal
de datos mediante filtros, proporcionando un pronóstico de eventos de precipitación extrema.
con resultados prometedores de pronóstico inmediato.
Description
Even though there exists no universal definition for extreme precipitation events, they can
be referred to the period of time in which empirical rainfall thresholds are abruptly exceeded.
Therefore, their timely forecasting is of great interest for decision makers from
many fields, such as: urban planning entities, water researchers, and in general, climate
related institutions. In this work, a data-driven approach is performed to analyze, nowcast,
and classify extreme precipitation events through the study of hydroclimate features over
the time of two climatological stations. Since the analysis of precipitation-events-related
time series involves complex patterns, input data requires undergoing pre-processing steps,
data preparation and analysis techniques. In this sense, feature selection and feature engineering
methods are employed in order to achieve a high performance at the data classification
and regression stage. Specifically, correlation analysis, principal component analysis
(PCA) and regressional Relief-F (RR) are considered as an exploratory analysis of the
variables. Subsequently, a classification is performed by a support-vector-machine-based
(SVM) classifier and a regression algorithm is suited by a convolutional neural network
(CNN).
Results reflect that a reduced dataset obtained by non-standardized RR discriminates
better than PCA, but not as good as the standardized all-variables dataset. The correlation
analysis indicates common patters between the two climatological stations. Finally, the
regression algorithm shows the capability of the CNN mixed with deep learning algorithms
such as long-short term memory and 1-D, 2-D convolutions to learn the spatio-temporal
representation of data by means of kernels, providing a forecast of extreme precipitation
events with promising nowcasting results.