Model Transformer Untuk Pengenalan Entitas Bernama Dan Klasifikasi Tipe Pesan Dalam Mendukung Investigasi Forensik Pada Log Penerbangan Drone

Syahputro, Bimo (2026) Model Transformer Untuk Pengenalan Entitas Bernama Dan Klasifikasi Tipe Pesan Dalam Mendukung Investigasi Forensik Pada Log Penerbangan Drone. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6025232013-Master_Thesis.pdf] Text
6025232013-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (11MB) | Request a copy

Abstract

Log penerbangan drone (drone flight logs) merupakan sumber bukti digital yang penting dalam investigasi forensik, namun volumenya yang besar dan sifatnya yang tidak terstruktur menyulitkan proses analisis manual. Salah satu tantangan utama adalah membedakan pesan log yang merepresentasikan peristiwa penting (event) dari pesan operasional rutin (non-event). Kesalahan pada tahap ini berpotensi menyebabkan terlewatnya bukti krusial dalam proses investigasi.
Penelitian ini mengusulkan dan mengevaluasi pendekatan klasifikasi event dan non-event berbasis Transformer sebagai tahap awal dalam pipeline forensik digital pada log penerbangan drone. Model DistilRoBERTa digunakan sebagai model utama dan dibandingkan dengan model baseline berbasis TF-IDF dan Logistic Regression. Selain itu, penelitian ini mengevaluasi pengaruh teknik augmentasi data berbasis Masked Language Model (MLM) dengan skenario augmentasi ×2 dan ×5. Seluruh eksperimen dilakukan menggunakan skema multi-seed untuk memastikan stabilitas hasil, dengan data uji yang dijaga tetap untuk menjaga validitas evaluasi. Hasil eksperimen menunjukkan bahwa model DistilRoBERTa tanpa augmentasi telah melampaui performa baseline, khususnya pada metrik recall kelas event. Penerapan augmentasi ×2 memberikan peningkatan performa yang signifikan secara statistik berdasarkan uji paired t-test (p < 0.05), serta menunjukkan stabilitas yang lebih baik dibandingkan augmentasi ×5. Meskipun augmentasi ×5 menghasilkan nilai recall yang lebih tinggi, variansi performa yang lebih besar menunjukkan bahwa penambahan data augmentasi secara berlebihan tidak selalu menghasilkan peningkatan yang konsisten. Penelitian ini menyimpulkan bahwa augmentasi data dalam skala moderat mampu meningkatkan efektivitas klasifikasi event pada log penerbangan drone, sehingga dapat mendukung proses penyaringan bukti digital secara lebih efisien dan andal. Tahap klasifikasi ini diharapkan dapat menjadi fondasi yang kuat bagi pengembangan pipeline forensik digital end-to-end pada investigasi insiden drone.
============================================================================================================================================
Drone flight logs represent a critical source of digital evidence in forensic investigations; however, their large volume and unstructured nature make manual analysis inefficient and error-prone. A key challenge lies in distinguishing log messages that correspond to significant events from routine operational messages (non-events). Inaccuracies at this stage may lead to overlooked critical evidence during investigations. This study proposes and evaluates a Transformer-based approach for event and non-event classification as an initial stage in a digital forensic pipeline for drone flight logs. DistilRoBERTa is employed as the primary model and compared against a baseline model using TF-IDF and Logistic Regression. The study further investigates the impact of data augmentation using a Masked Language Model (MLM) with augmentation factors of ×2 and ×5. All experiments are conducted under a multi-seed setting to ensure result stability, while the test set is kept fixed to maintain evaluation validity. Experimental results demonstrate that the DistilRoBERTa model without augmentation outperforms the baseline, particularly in terms of recall for the event class. Applying data augmentation at ×2 yields a statistically significant performance improvement based on a paired t-test (p < 0.05) and exhibits better stability compared to augmentation ×5. Although augmentation ×5 achieves higher recall, the increased performance variance indicates that excessive augmentation does not necessarily lead to consistent improvements. This research concludes that moderate-scale data augmentation effectively enhances event classification performance on drone flight logs, supporting more efficient and reliable digital evidence filtering. The proposed classification stage serves as a robust foundation for the development of an end-to-end digital forensic pipeline for drone incident investigations.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Augmentasi Data, Drone Forensik, Event Classification, Natural Language Processing, Transformer Data Augmentation, Drone Forensics, Event Classification, Natural Language Processing, Transformer
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: Bimo Syahputro
Date Deposited: 26 Jan 2026 07:48
Last Modified: 26 Jan 2026 07:48
URI: http://repository.its.ac.id/id/eprint/130355

Actions (login required)

View Item View Item