Haq, Arinal (2025) Deteksi Barang Terlarang pada Citra X-Ray Pemeriksaan Keamanan menggunakan YOLOv8 dengan Efficient Multi-Scale Attention. Masters thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
6025231064-Master_Thesis.pdf - Accepted Version Restricted to Repository staff only Download (8MB) | Request a copy |
Abstract
Pemeriksaan keamanan merupakan prioritas untuk mencegah ancaman dan aktivitas kriminal di tempat umum. Pencitraan X-ray dapat membantu dalam proses pemeriksaan barang bawaan dalam kondisi tertutup tanpa perlu penggeledahan manual. Namun, menginterpretasikan citra X-ray memilliki tantangan tersendiri karena kompleksitas dan keragaman barang terlarang yang mungkin terkandung dalam citra. Selain itu, proses pemeriksaan keamanan sering kali kompleks dan membutuhkan proses interpretasi yang cepat dan akurat oleh petugas. Pemeriksaan manual dengan bantuan citra X-ray oleh petugas masih dirasa kurang efektif dan efisien. Oleh karena itu, diperlukan sistem deteksi otomatis yang dapat membantu proses identifikasi barang terlarang dengan lebih cepat dan akurat.
Penelitian ini mengusulkan sebuah model berbasis YOLOv8 yang dimodifikasi untuk deteksi barang terlarang pada pemeriksaan keamanan melalui citra X-ray, yang selanjutnya disebut dengan ESI-YOLO. Model ini mengintegrasikan Efficient Multi-Scale Attention (EMA) dan fungsi loss Wise-IoU (WIoU) ke dalam arsitektur YOLOv8 untuk meningkatkan representasi fitur multi-skala dan akurasi deteksi. Eksperimen komprehensif dilakukan pada dataset CLCXray dan PIDray untuk memvalidasi keefektifan model yang diusulkan. Studi ini secara sistematis mengeksplorasi berbagai skenario untuk mengintegrasikan EMA ke dalam bagian backbone dan neck dari arsitektur YOLOv8, dengan integrasi langsung di kedua bagian tersebut muncul sebagai konfigurasi yang paling efektif. Modul EMA menjawab tantangan dari beragamnya ukuran, bentuk, dan variasi objek dalam pendeteksian barang terlarang. Fungsi loss WIoU mampu meningkatkan akurasi lokalisasi bounding box pada citra X-ray yang kompleks dengan objek yang tumpang tindih.
Studi ablasi menunjukkan efek yang saling menguatkan dari kombinasi integrasi modul EMA dan fungsi loss WIoU pada model yang diusulkan mengungguli integrasi tiap komponen secara individual. Model ESI-YOLO yang diusulkan, mencapai peningkatan yang signifikan dibandingkan model baseline YOLOv8, dengan peningkatan mAP50 sebesar 0,9% pada dataset CLCXray dan 3,5% pada test set ‘hidden’ dari dataset PIDray. Analisis komparatif menunjukkan kinerja unggul ESI-YOLO di antara model berukuran nano dan kemampuannya untuk menjaga keseimbangan optimal antara akurasi dan efisiensi dengan 8,4 GFLOPs. Model ESI-YOLO yang diusulkan menawarkan solusi yang menjanjikan untuk deteksi barang terlarang dalam pemeriksaan keamanan melalui citra X-ray dengan mempertahankan efisiensi komputasi.
======================================================================================================================================
Security screening is a priority to prevent threats and criminal activities in public places. X-ray imaging can assist in the inspection of baggage in closed conditions without the need for manual searches. However, interpreting X-ray images presents its own challenges due to the complexity and diversity of prohibited items that may be contained within the images. In addition, the security screening process is often complex and requires fast and accurate interpretation by officers. Manual inspection with the assistance of X-ray images by officers is still considered less effective and efficient. Therefore, an automatic detection system is needed to help identify prohibited items more quickly and accurately.
This study proposes ESI-YOLO, an enhanced YOLOv8-based model for prohibited item detection in X-ray security inspection. The model integrates Efficient Multi-Scale Attention (EMA) and Wise-IoU (WIoU) loss function into the YOLOv8 architecture to improve multi-scale feature representation and detection accuracy. Comprehensive experiments were conducted on the CLCXray and PIDray datasets to validate the effectiveness of ESI-YOLO. The study systematically explored various scenarios for integrating EMA into the backbone and neck sections of YOLOv8, with the direct integration in both sections emerging as the most effective configuration. The EMA module addresses the challenges of diverse object sizes, shapes, and variations in prohibited item detection. The WIoU loss function enhances bounding box regression accuracy and robustness in the presence of complex backgrounds and overlapping objects.
Ablation studies show the synergistic effects of combining EMA and WIoU in ESI-YOLO, outperforming the addition of individual components. The proposed ESI-YOLO model achieves significant improvements compared to the baseline YOLOv8 model, with an increase of 0.9% mAP50 on the CLCXray dataset and 3.5% on the ‘hidden’ test set from the PIDray dataset. Comparative analysis demonstrates the superior performance of ESI-YOLO among nano-sized models and its ability to maintain an optimal balance between accuracy and efficiency with 8.4 GFLOPs. The proposed ESI-YOLO model offers a promising solution for detecting prohibited items in security screening through X-ray images while maintaining computational efficiency.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | Attention Mehanism, Efficient Multi-Scale Attention (EMA), Pemeriksaan Keamanan, Wise-IoU (WIoU), YOLOv8 |
Subjects: | T Technology > T Technology (General) T Technology > T Technology (General) > T11 Technical writing. Scientific Writing T Technology > T Technology (General) > T385 Visualization--Technique |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis |
Depositing User: | Arinal Haq |
Date Deposited: | 01 Aug 2025 08:47 |
Last Modified: | 01 Aug 2025 08:47 |
URI: | http://repository.its.ac.id/id/eprint/125062 |
Actions (login required)
![]() |
View Item |