Please use this identifier to cite or link to this item:
http://repositorio.yachaytech.edu.ec/handle/123456789/412
Title: | Development of a software prototype for interactive dimensionality reduction including a representation quality measurement |
Authors: | Morocho Cayamcela, Manuel Eugenio Marín Gaviño, Josué Nicolás |
Keywords: | Topología de datos Reducción de dimensiones Python Curva RNX Data topology Dimensionality redution RNX curve |
Issue Date: | Aug-2021 |
Publisher: | Universidad de Investigación de Tecnología Experimental Yachay |
Abstract: | La reducción de dimensionalidad (DR) es un proceso de transformación de datos que proporciona una representación de baja dimensión (atributos o variables) de conjuntos de datos de alta dimensión. Los principales objetivos de la recuperación ante desastres son la reducción de ruido, la reducción del espacio de almacenamiento, la visualización de datos, el procesamiento eficiente de datos y la concentración de información importante en menos variables que el conjunto original. Una medida de rendimiento visual en DM es la preservación de la topología. Las curvas de calidad RNX, propuestas por Lee y Verleysen, evalúan el rendimiento generando una representación gráfica de la preservación de la topología. En la actualidad, existe una herramienta para la evaluación de la conservación de la topología de los algoritmos de DM, también desarrollada por Lee y Verleysen (2009). A nuestro leal saber y entender, dicha herramienta solo está disponible en MatLab. Por lo tanto, surge un desafío de implementación ya que MATLAB puede tener una portabilidad limitada y apenas se usa en diferentes tecnologías, como marcos para la reducción de dimensionalidad programados en otros lenguajes de programación. En este trabajo, proporcionamos una implementación en el lenguaje de programación Python de un módulo de evaluación de software de la curva RNX, una herramienta de codificación versátil y basada en paquetes que permite su uso en múltiples tecnologías. |
Description: | Dimensionality reduction (DR) is a data transformation process that provides a lowdimensional (attribute or variable) representation of high-dimensional data sets. The main goals of DR are noise reduction, storage space reduction, data visualization, efficient data processing, and the concentration of important information in fewer variables than the original set. A visual performance measure in DM is topology preservation. Quality curves RNX, proposed by Lee and Verleysen, evaluate performance generating a graphical representation of topology preservation. Nowadays, there is a tool for topology conservation evaluation of DM algorithms, also developed by Lee and Verleysen (2009). To the best of our knowledge, such a tool is available only in MatLab. Therefore, a deployment challengearises since MATLAB may be limited in portability and hardly used over different technologies such as frameworks for dimensionality reduction programmed in other programming languages. In this work, we provide an implementation in the Python programming language of a software evaluation module of the curve RNX, a versatile and package-driven coding tool that enables its use in multiple technologies. |
URI: | http://repositorio.yachaytech.edu.ec/handle/123456789/412 |
Appears in Collections: | Tecnologías de la Información |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ECMC0071.pdf | 3.67 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.