Please use this identifier to cite or link to this item: http://repositorio.yachaytech.edu.ec/handle/123456789/886
Title: Integrating a LLaMA-based chatbot with augmented retrieval generation as a complementary educational tool for high school and college students
Authors: Morocho Cayamcela, Manuel Eugenio
Fonseca Delgado, Rigoberto Salomón
Cabezas Erazo, Darío Sebastián
Keywords: Large language model
Retrieval augmented generation
Vector database
Grandes modelos de lenguaje
Generación aumentada por recuperación
Base de datos vectorial
Issue Date: Dec-2024
Publisher: Universidad de Investigación de Tecnología Experimental Yachay
Abstract: En el panorama educativo actual, la transición de paradigmas tradicionales a experiencias de aprendizaje más interactivas y personalizadas se ha visto acelerada por los avances tecnológicos, particularmente en inteligencia artificial. Esta investigación presenta el desarrollo de un chatbot basado en el modelo largo de lenguaje (LLM) llamado LLaMA 7B chat desarrollado por Meta, que ha sido cuantizado para optimizar el uso de recursos, mejorado mediante técnicas de generación aumentada por recuperación con el fin de llevar a cabo respuestas en una asignatura centrada predominantemente en habilidades de resolución de problemas como son las matemáticas. Nuestra investigación ha dado como resultado un sistema de recuperación de documentos utilizando Pinecone como vectorstore, cuyos documentos almacenados fueron creados a partir del contenido de las páginas, que denominamos metadatos, del aclamado libro Precálculo: Matemáticas para el Cálculo que se procesaron utilizando el modelo all-MiniLM-L6-v2 y empleando la similitud coseno como métrica para realizar la búsqueda semántica. A continuación, el sistema de recuperación de documentos se une al modelo cuantizado utilizando el framework especializado en LLM denominado Langchain. De esta forma hemos obtenido un chatbot que siguiendo un prompt de sistema, el contexto de los documentos recuperados de Pinecone y la pregunta del usuario puede responder con ejercicios o material audiovisual de apoyo a preguntas de matemáticas para estudiantes de secundaria o cursos de nivel universitario.
Description: In the current educational landscape, the transition from traditional paradigms to more interactive and personalized learning experiences has been accelerated by technological advancements, particularly in artificial intelligence. This research presents the development of a chatbot based on the Large Language Model (LLM) called LLaMA 7B chat developed by Meta, which has been quantized to optimize the use of resources, enhanced using retrieval augmented generation techniques in order to carry out responses in a subject that is predominantly focused on problem solving skills such as mathematics. This research has resulted in a document retrieval system using Pinecone as our vectorstore whose stored documents were created from the page content, called metadata, of the acclaimed book Precálculo: Matemáticas para el Cálculo which were processed using the all-MiniLM-L6-v2 model and using cosine similarity as a metric to perform the semantic search. Document retrieval system is then linked to the quantized model using the specialized LLM framework called Langchain. In this way we have obtained a chatbot that following a system prompt, context of documents retrieved from Pinecone and the user's question can respond with exercises or audiovisual support material for mathematics questions for high school students or university level courses.
URI: http://repositorio.yachaytech.edu.ec/handle/123456789/886
Appears in Collections:Tecnologías de la Información

Files in This Item:
File Description SizeFormat 
ECMC0169.pdf3.18 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.