Please use this identifier to cite or link to this item: http://repositorio.yachaytech.edu.ec/handle/123456789/863
Title: A deep learning model for firearm detection in surveillance videos
Authors: Fonseca Delgado, Rigoberto Salomón
Crespo Yaguana, Brian Anthony
Keywords: Detección de objetos
Visión artificial
Aprendizaje profundo
Object detection
Computer vision
Deep learning
Issue Date: Nov-2024
Publisher: Universidad de Investigación de Tecnología Experimental Yachay
Abstract: Este trabajo se centra en la detección de armas de fuego en perspectivas no canónicas en vídeos de vigilancia utilizando aprendizaje profundo con un enfoque en eficiencia computacional. En particular, se evalúa el rendimiento de YOLOv8, una arquitectura del estado del arte, usando la versión nano, su variante más eficiente. Adicionalmente, se enfatiza en la detección de armas cortas, un tipo de arma de fuego utilizada frecuentemente en la delincuencia. El problema de la detección de armas cortas se aborda aplicando dos metodologías centradas en la tarea de detección de objetos. La primera metodología consiste en entrenar un modelo de detección de armas que actúa directamente sobre imágenes de vídeos de cámaras de seguridad. La segunda metodología se inspira en la idea de que, debido al pequeño tamaño de un arma en el campo de visión de una cámara de seguridad, es beneficioso delimitar el área de detección en lugar de considerar toda la imagen. Así, se propone un enfoque consistente en una secuencia de dos modelos, el primero centrado en la detección de personas, que sirve de entrada a un segundo modelo especializado en la detección de armas cortas en individuos. Estas metodologías se han evaluado utilizando las métricas de puntuación F1, mAP50-95 y FPS. Los resultados obtenidos muestran que ambas metodologías, basadas en YOLOv8 nano, producen resultados competitivos. La primera metodología muestra un rendimiento ligeramente superior en la métrica mAP50-95, con un valor del 43,50%, frente al 42,26% de la segunda, lo que indica una robustez ligeramente superior a la hora de localizar con precisión las armas cortas en las imágenes. En cuanto a la puntuación F1, la segunda metodología supera ligeramente a la primera con un valor de 89,51% frente a un valor de 88,45%, lo que se origina debido a una reducción significativa de los falsos positivos, un aspecto crítico en el problema abordado. En términos de eficiencia, los enfoques han demostrado ser suficientemente eficaces para su uso en tiempo real, procesando 169 y 73 FPS, respectivamente. Estos resultados subrayan la viabilidad de YOLOv8 nano para su implementación en sistemas de vigilancia en tiempo real y dispositivos integrados con recursos limitados, donde la velocidad de procesamiento es un factor crucial.
Description: This work focuses on the detection of firearms in non-canonical perspectives in surveillance videos using deep learning with a focus on computational efficiency. In particular, the performance of YOLOv8, a state-of-the-art architecture, is evaluated using the nano version, its most efficient variant. Additionally, the detection of handguns, a type of firearm frequently used in crime, has been emphasized. The problem of handgun detection is addressed by applying two methodologies focused on the object detection task. The first methodology consists of training a handgun detection model that acts directly on video images from security cameras. The second methodology is inspired by the idea that, due to the small size of a handgun in the field of view of a security camera, it is beneficial to delimit the detection area instead of considering the whole image. Thus, an approach consisting of a pipeline of two models is proposed; the first focused on the detection of people, which serves as an input to a second model specialized in the detection of handguns on individuals. These methodologies have been evaluated using F1 score, mAP50-95, and FPS metrics. The results obtained show that both methodologies, based on YOLOv8 nano, produce competitive results. The first methodology shows a slightly superior performance on the mAP50-95 metric, with a value of 43.50%, compared to 42.26% for the second one, indicating a slightly superior robustness in accurately locating handguns in the images. In terms of the F1 score, the second methodology slightly outperforms the first with a value of 89.51% versus a value of 88.45%, which originates due to a significant reduction in false positives, a critical aspect in the problem addressed. In terms of efficiency, the approaches have proven to be effective enough for real-time use, processing 169 and 73 FPS, respectively. These results underline the feasibility of YOLOv8 nano for implementation in real-time surveillance systems and embedded devices with limited resources, where processing speed is a crucial factor.
URI: http://repositorio.yachaytech.edu.ec/handle/123456789/863
Appears in Collections:Tecnologías de la Información

Files in This Item:
File Description SizeFormat 
ECMC0163.pdf10.52 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.