Deteksi Malware pada Windows Event Logs dengan Pendekatan Supervised Learning dan Korelasi Kejadian

Gunawan, Jason Andrew (2023) Deteksi Malware pada Windows Event Logs dengan Pendekatan Supervised Learning dan Korelasi Kejadian. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111940000085-Undergraduate_Thesis.pdf] Text
05111940000085-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 September 2025.

Download (2MB) | Request a copy

Abstract

Malicious Software (malware) adalah perangkat lunak berbahaya, dan merupakan suatu ancaman terhadap keamanan dan privasi semua pengguna internet, dimana malware mudah sekali menyebar. Meningkatnya serangan malware, terutama ransomware, merupakan hal yang cukup mengkhawatirkan, mengingat adanya peningkatan jumlah pengguna komputer yang relatif tinggi belakangan ini. Salah satu langkah untuk melindungi komputer dari serangan malware adalah dengan menggunakan perangkat lunak anti-malware. Saat ini sudah banyak perangkat lunak anti-malware yang menggunakan pendekatan berbasis machine learning dikarenakan menghasilkan efisiensi dan akurasi deteksi yang lebih baik. Dalam penelitian ini, akan dilakukan percobaan untuk membuat sebuah model machine learning menggunakan pendekatan supervised learning sebagai cara untuk melakukan deteksi malware pada komputer dengan sistem operasi Windows, yang memiliki pengguna terbanyak di dunia. Sumber data yang digunakan dalam penelitian ini terdapat dalam bentuk Windows Event Log yang terkorelasi. Dengan adanya korelasi event log, dapat diketahui hubungan antar event dalam rupa fitur-fitur tambahan. Hal ini diharapkan dapat meningkatkan performa model dalam melakukan klasifikasi. Algoritma yang digunakan dalam penelitian ini terdiri dari Naïve Bayes Classifier, Decision Tree Classifier, Random Forest Classifier, dan Support-Vector Machine Classifier. Berdasarkan hasil eksperimen, dapat disimpulkan bahwa algoritma Random Forest Classifier memiliki performa terbaik dengan Skor F1 senilai 0.9594. Terdapat 15 fitur terbaik dalam dataset yang digunakan untuk mencapai Skor F1 tersebut, yaitu: 'TreeChildCount', 'TreeDepth', 'Product', 'NumEventId05', 'NumEventId02', 'NumEventId03', 'NumEventId12', 'NumEventId11', 'Description', 'NumEventId01', 'TerminalSessionId', 'NumEventId08', 'Company', 'TreeFirstLevelWidth', dan 'TreeWidth'.
===================================================================================================================================
Malicious Software, or malware for short, is a term for software that poses a significant threat to the security and privacy of all internet users, as it spreads quickly and easily to and from the internet. The increasing number of malware attacks nowadays, especially ransomware, is quite concerning given the growing number of computer users. Nevertheless, there are ways to avoid or counter this threat. One of the more common ways to protect computers from malware attacks is by using anti-malware programs. Currently, many anti-malware programs utilize machine learning-based approaches because of their improved efficiency and accuracy when detecting malware. This research aims to experiment with creating a machine learning model using supervised learning to detect malware. This research will focus on Windows operating system since it has the largest user base worldwide. The dataset used in this research is in the form of correlated Windows Event Logs. By leveraging the correlation of event logs, relationships among events can be identified as additional features. This is expected to enhance the model's performance in classification. The algorithms used in this research consist of Naïve Bayes Classifier, Decision Tree Classifier, Random Forest Classifier, and Support-Vector Machine Classifier. Based on the results obtained during experiments, it can be concluded that the Random Forest Classifier algorithm performs the best with an F1 Score of 0.9594. The dataset used to achieve this F1 Score contains fifteen features, namely: 'TreeChildCount', 'TreeDepth', 'Product', 'NumEventId05', 'NumEventId02', 'NumEventId03', 'NumEventId12', 'NumEventId11', 'Description', 'NumEventId01', 'TerminalSessionId', 'NumEventId08', 'Company', 'TreeFirstLevelWidth', and 'TreeWidth'.

Item Type: Thesis (Other)
Uncontrolled Keywords: malware, machine learning, supervised learning, windows event logs, event correlation
Subjects: T Technology > T Technology (General) > T11 Technical writing. Scientific Writing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Jason Andrew Gunawan
Date Deposited: 08 Sep 2023 01:26
Last Modified: 08 Sep 2023 01:26
URI: http://repository.its.ac.id/id/eprint/103030

Actions (login required)

View Item View Item