Please use this identifier to cite or link to this item: http://repositorio.yachaytech.edu.ec/handle/123456789/388
Title: A kernel-based strategy to design Convolutional Neural Network Architecture for learning spatial and temporal representation of weather variables
Authors: Morocho Cayamcela, Manuel Eugenio
González Vergara, Juan Fernando
Keywords: Basado en datos
Pronóstico inmediato
Precipitación extrema
Ingeniería de características
Aprendizaje profundo
Data-driven
Nowcasting
Extreme precipitation
Feature selection
Feature engineering
Deep learning
Issue Date: Jul-2021
Publisher: Universidad de Investigación de Tecnología Experimental Yachay
Abstract: Aunque no existe una definición universal para los eventos de precipitación extrema, puede referirse como el período de tiempo en el que se supera abruptamente umbrales empíricos de precipitación. Por lo tanto, su pronóstico oportuno es de gran interés para los tomadores de decisiones de muchos campos, como: entidades de planificación urbana, investigadores del agua y en general, instituciones relacionadas con el clima. En este trabajo, se realiza un enfoque basado en datos para analizar, pronosticar y clasificar eventos de precipitación extrema a través del estudio de variables hidroclimáticas a lo largo del tiempo de dos estaciones climatológicas. Dado que el análisis de series de tiempo relacionadas con eventos de precipitación implica patrones complejos, los datos de entrada requieren pasar por etapas de pre-procesamiento, preparaci´on de datos y técnicas de análisis. En este sentido, se emplean métodos de selección de características e ingeniería de características para lograr un alto rendimiento en la etapa de clasificación y regresión de datos. Específicamente, análisis de correlación, análisis de componentes principales (PCA) y relief -F de regresión (RR) se consideran un análisis exploratorio de variables. Posteriormente, un clasificador basado en máquina de vectores de soporte (SVM) realiza una clasificación y una red neuronal convolucional (CNN) ajusta un algoritmo de regresión. Los resultados reflejan que el conjunto de datos reducido obtenido por RR no estandarizado discrimina mejor que el PCA pero no tan bien como el conjunto de datos estandarizado con todas las variables. El análisis de correlación indica patrones comunes entre las dos estaciones climatológicas. Finalmente, el algoritmo de regresión muestra la capacidad de la CNN combinada con algoritmos de aprendizaje profundo como long-short term memory y convoluciones 1-D, 2-D para aprender la representación espacio-temporal de datos mediante filtros, proporcionando un pronóstico de eventos de precipitación extrema. con resultados prometedores de pronóstico inmediato.
Description: Even though there exists no universal definition for extreme precipitation events, they can be referred to the period of time in which empirical rainfall thresholds are abruptly exceeded. Therefore, their timely forecasting is of great interest for decision makers from many fields, such as: urban planning entities, water researchers, and in general, climate related institutions. In this work, a data-driven approach is performed to analyze, nowcast, and classify extreme precipitation events through the study of hydroclimate features over the time of two climatological stations. Since the analysis of precipitation-events-related time series involves complex patterns, input data requires undergoing pre-processing steps, data preparation and analysis techniques. In this sense, feature selection and feature engineering methods are employed in order to achieve a high performance at the data classification and regression stage. Specifically, correlation analysis, principal component analysis (PCA) and regressional Relief-F (RR) are considered as an exploratory analysis of the variables. Subsequently, a classification is performed by a support-vector-machine-based (SVM) classifier and a regression algorithm is suited by a convolutional neural network (CNN). Results reflect that a reduced dataset obtained by non-standardized RR discriminates better than PCA, but not as good as the standardized all-variables dataset. The correlation analysis indicates common patters between the two climatological stations. Finally, the regression algorithm shows the capability of the CNN mixed with deep learning algorithms such as long-short term memory and 1-D, 2-D convolutions to learn the spatio-temporal representation of data by means of kernels, providing a forecast of extreme precipitation events with promising nowcasting results.
URI: http://repositorio.yachaytech.edu.ec/handle/123456789/388
Appears in Collections:Tecnologías de la Información

Files in This Item:
File Description SizeFormat 
ECMC0067.pdf1.63 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.