Fajar, Ahmad Ibnu (2022) Penggunaan Data Kotor Dan Autoencoder Untuk Melatih Sistem Deteksi Serangan Berbasis Jaringan. Other thesis, Institut Teknologi Sepuluh Nopember.
|
Text
05111540000133-Undergraduate_Thesis.pdf Restricted to Repository staff only Download (1MB) |
Abstract
Di tengah perkembangan informasi yang meningkat, banyak pihak yang meningkatkan kesadaran tentang pentingnya keamanan siber, terutama tentang aktivitas berbahaya melalui jaringan. Salah satu cara untuk mitigasi risiko tersebut adalah dengan mendeteksi serangan sedini mungkin ketika terjadi. Sebuah sistem deteksi serangan (IDS) bisa memainkan peranan penting dalam mendeteksi serangan. Hal ini bisa dilakukan tanpa bergantung dengan basis data yang menyimpan pola dari serangan yang telah diketahui, disebut juga deteksi berbasis anomali. Untuk deteksi berbasis anomali, sebuah IDS membutuhkan sekumpulan data untuk dilatih agar dapat membedakan mana lalu lintas jaringan yang berbahaya dan lalu lintas jaringan yang sah. Terdapat beberapa algoritma yang dapat digunakan sebagai deteksi anomali, salah satunya adalah Autoencoder. Autoencoder merupakan algoritma unsupervised learning yang akan merekonstruksi input sebagai output. Metode yang digunakan pada tugas akhir ini adalah dengan memasukkan data kotor pada proses latih pembuatan model Autoencoder. Data kotor yang dimaksud adalah data yang berisi paket-paket berbahaya yang mengandung serangan. Data-data yang digunakan pada proses latih merupakan data tangkapan lalu lintas jaringan yang memiliki format packet capture (PCAP) dan mengandung berbagai persentase kadar data kotor. Praproses data pertama adalah melakukan ekstraksi payload dari data PCAP yang selanjutnya payload akan diubah menjadi frekuensi byte untuk digunakan sebagai fitur dalam pembuatan model. Dengan menggunakan Autoencoder, sebuah lalu lintas jaringan akan dianggap sebagai serangan ketika nilai reconstruction error melebihi nilai ambang batas tertentu yang telah ditentukan. Terdapat beberapa skenario pengujian yang terdiri dari kombinasi protokol jaringan, persentase kadar data kotor dan jumlah hidden layer pada Autoencoder. Berdasarkan hasil uji coba yang telah dilakukan, nilai F2-score pada data latih dengan persentase kadar data kotor 0,4% mengalami penurunan sebesar 1,96% terhadap data latih yang tidak memiliki data kotor.
==================================================================================================================================
As the development of information technology grows higher, many stakeholder increase their awareness about cybersecurity, especially about malicious activity via network. One of the solution to mitigate that risk is to detect the attack as soon as possible. An intrusion detection system (IDS) could be plays important role in that situation. IDS can be used for detect the attack without relying on a database of known malicious patterns, this is called anomaly-based detection. For anomaly-based detection technique, an IDS needs samples data sets to train themselves to be able distinguish the malicious traffic and legitimate traffic. There are some algorithm which can be used for anomaly detection, and one of them is Autoencoder. Autoencoder is unsupervised learning algorithm to reconstruct the input as an output. The proposed method for this final project will be include noisy data sets in training process to build the model using Autoencoder. Noisy data in question is the data that contains malicious packet that contain attacks. That data sets is network captures stored in packet capture (PCAP) files and contains various of insignificant percentage of noise. The main preprocessing of the data sets is to extract the payloads from PCAP files and transform it to byte frequencies as a feature for build the model. With Autoencoder, a network traffic will be considered as malicious if the value of reconstruction error more than the value of certain threshold that had defined earlier. There are several scenario of experiments in this final project, that consist of combination from network protocols, percentage rate of noise data sets and the number of hidden layer from Autoencoder. Based on experiments that have been carried out, F2-score value in the training data with percentage rate of 0,4% noisy data decreased by 1,96% to the training data that didn’t have noisy data.
| Item Type: | Thesis (Other) |
|---|---|
| Additional Information: | RSIf 005.8 Faj p-1 2022 |
| Uncontrolled Keywords: | IDS, Deteksi Anomali, Autoencoder, Data Kotor, PCAP, Payload, Frekuensi Byte. IDS, Anomaly Detection, Autoencoder, Noisy Data, PCAP, Payload, Byte Frequencies. |
| Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis |
| Depositing User: | Mr. Marsudiyana - |
| Date Deposited: | 25 May 2026 01:17 |
| Last Modified: | 25 May 2026 01:17 |
| URI: | http://repository.its.ac.id/id/eprint/133365 |
Actions (login required)
![]() |
View Item |
