Please use this identifier to cite or link to this item:
http://repositorio.yachaytech.edu.ec/handle/123456789/264
Title: | An interactive tool to data analysis visualization techniques. |
Authors: | Peluffo-Ordóñez, Diego Hernán Vélez Falconí, Martín |
Keywords: | Dimensionality Reduction Interaction Model Kernel Functions Data Visualization Reducción de dimensionalidad Modelo de interacción Funciones kernel Visualización de datos |
Issue Date: | Oct-2020 |
Publisher: | Universidad de Investigación de Tecnología Experimental Yachay |
Abstract: | El área de dimensión de reducción (RD) tiene como propósito proveer maneras de aprovechar información de alta dimensionalidad, a través de la generación de una representación de en baja dimensionalidad, siguiendo algún criterio de preservación de estructura. En la literatura científica, se encuentran docenas de técnicas de reducción de la dimensionalidad. Sin embargo, la selección de un método adecuado para la reducción de dimensionalidad es una situación frecuente y no representa una tarea trivial. Para realizar una reducción adecuada, podría incorporarse el criterio de expertos en el proceso de análisis, de forma que los expertos necesitan interactuar dinámicamente con las representaciones de la baja dimensionalidad. Dicha interacción puede lograrse con los diferentes modelos interactivos descritos en la literatura. No obstante, aún hay problemas abiertos relacionados con la interacción dinámica del usuario con los datos. En este trabajo, se presenta un modelo interactivo, llamado "Inverse Data Visualization Framework" (IDVF), el cual es un modelo pionero de visualización interactiva que se basa en la aproximación, por métodos kernels, de una reducción de dimensionalidad dada por un experto. En términos generales, el modelo opera de la siguiente manera: Inicialmente, se muestra un gráfico de dispersión de los datos en baja dimensionalidad generado por métodos espectrales. Seguidamente, se solicita al usuario agrupar (a su criterio) algunos puntos del gráfico de acuerdo a la representación que considere más idónea. Una vez generado los datos, el modelo tratará de generar una representación de la misma dimensionalidad con una forma similar al creado por el usuario, mezclando diferentes aproximaciones de métodos espectrales en forma de matrices kernel y otras matrices kernels que son comúnmente usados para la reducción de dimensionalidad. Todo esto se desarrolla usando el método de análisis de componentes principales con kernel (Kernel PCA). La mezcla de las matrices kernel, después de la descomposición espectral de KPCA, deberá generar un gráfico de 2 dimensiones que resultará similar a la representación dada por el usuario. |
Description: | Broadly, the area of dimensional reduction (DR) is aimed at providing ways to harness high dimensional (HD) information through the generation of lower dimensional (LD) representations, by following a certain data-structure-preservation criterion. In literature there have been reported dozens of DR techniques, which are commonly used as a preprocessing stage within exploratory data analyses for either machine learning or information visualization (IV) purposes. Nonetheless, the selection of a proper method is a nontrivial and -very often- toilsome task. In this sense, a readily and natural way to incorporate an expert’s criterion into the analysis process, while making this task more tractable is the use of interactive IV approaches. Regarding the incorporation of experts’ prior knowledge there still exists a range of open issues. In this degree thesis, we introduce a here-named Inverse Data Visualization Framework (IDVF), which is an initial approach to make the in-put prior knowledge directly interpretable. Our framework is based on 2D-scatter-plots visuals and spectral kernel-driven DR techniques. To capture either the user’s knowledge or requirements, users are requested to provide changes or movements of data points in such a manner that resulting points are located where best convenient according to the user’s criterion. Next, following a Kernel Principal Component Analysis approach and a mixture of kernel matrices, our framework accordingly estimates an approximate LD space. Then, the rationale behind the proposed IDVF is to adjust as accurately as possible the resulting LD space to the representation while fulfilling users’ knowledge and requirements. Results are greatly promising and open the possibility to novel DR-based visualizations. |
URI: | http://repositorio.yachaytech.edu.ec/handle/123456789/264 |
Appears in Collections: | Tecnologías de la Información |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ECMC0044.pdf | 4.6 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.