PENGEMBANGAN METODE SELEKSI FITUR DAN TRANFORMASI DATA PADA SISTEM DETEKSI INTRUSI DENGAN PEMBATASAN UKURAN CLUSTER DAN SUB-MEDOID

MUTTAQIEN, INDERA ZAINUL (2017) PENGEMBANGAN METODE SELEKSI FITUR DAN TRANFORMASI DATA PADA SISTEM DETEKSI INTRUSI DENGAN PEMBATASAN UKURAN CLUSTER DAN SUB-MEDOID. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5114201034-Master_Theses.pdf]
Preview
Text
5114201034-Master_Theses.pdf - Published Version

Download (2MB) | Preview

Abstract

Penanganan keamanan jaringan mutlak diperlukan supaya data dalam jaringan tetap terjaga dari serangan. Sistem deteksi intrusi / Intrusion Detection System (IDS) muncul sebagai salah satu solusi untuk menangani hal tersebut. Beberapa penelitian terdahulu menunjukkan penggunakan teknik machine learning untuk mendeteksi intrusi dapat memberikan nilai accuracy yang baik. Teknik machine learning ini tidak terlepas dari proses seleksi fitur untuk mengoptimalkan pemrosesan oleh algoritma learning. Proses seleksi fitur dapat dilakukan untuk menghindari resiko overfit dan meningkatkan akurasi proses deteksi. Pemrosesan juga dapat dilakukan lebih cepat karena berkurangnya dimensi.
Pengurangan dimensi dari suatu dataset dapat dilakukan dengan seleksi fitur dan transformasi data. Sejumlah penelitian telah dilakukan untuk melakukan transformasi dataset ke satu dimensi dengan menggunakan pendekatan metode centroid-based. Metode ini melakukan transformasi data ke satu dimensi dengan memanfaatkan jarak data ke centroid dari suatu dataset sebagai pembeda antar data. Namun demikian masih tersedia ruang untuk meningkatkan hasil dari penelitian-penelitian tersebut.
Pada penelitian ini diajukan suatu sistem deteksi intrusi yang terdiri dari serangkaian proses seleksi fitur, clustering, dan transformasi data dengan pendekatan metode centroid based. Proses seleksi fitur dilakukan secara bertahap dengan menggabungkan teknik filter dan wrapper untuk memperoleh fitur-fitur yang tepat. Sistem ini juga menggunakan nilai yang disebut sebagai ambang radius untuk membatasi ukuran cluster yang terbentuk pada proses clustering. Proses transformasi data dilakukan dengan memanfaatkan jarak data ke centroid dan jarak data ke beberapa sub-medoid untuk meningkatkan akurasi hasil deteksi. Hasil penelitian ini menunjukkan bahwa pemilihan fitur-fitur yang tepat (signifikan) pada dataset dapat meningkatkan performa hasil deteksi. Pada dataset NSLKDD yang digunakan pada penelitian ini ditemukan ada 19 fitur signifikan, sedangkan pada dataset Kyoto2006+ terdapat 14 fitur signifikan. Selain itu metode yang diajukan secara umum memberikan perbaikan hasil deteksi pada setiap dataset yang diuji. Hasil terbaik terlihat pada penerapan metode yang diajukan pada dataset Kyoto2006+.
=================================================================
In managing network security, it is absolutely necessary do protect the data within the network from any attack / malicious access. Intrusion Detection System (IDS) has emerged as one of the solutions to deal with problem. Previous studides have shown that the use machines learning techniques to detect intrusion provide better performance in term of accuracy. The application of machine learning techniques can not be separated from the feature selection process to optimize the processing by learning algorithms. The usage of feature selection has advantages such as to avoid overfit risks and to improve detection accuracy. The processing time is also decrease due to the reduced dimensions. The dimensionality reduction of a dataset can be done by the selection of significant features and data transformation. Numerous studies have been done to transform dataset features into a one-dimensional form using centroid-based approach. This approach performs the transformation by using the distance between data and clusters centroid of a dataset as a differentiator between data. However, there is room to improve the outcome of these studies.
This study proposed an intrusion detection system which comprises of a series of feature selection process, clustering, and data transformation with the centroid-based approach. The feature selection process carried out gradually by combining the filter technique and the wrapper technique to obtain the significant feature(s). The proposed system is also used a value called radius threshold to limit the size of the clusters formed in the clustering process. Data transformation process is done by summing the distance between data and the centroids; and the distance between data and a number of sub-medoids. This is intended to improve the accuracy of the detection. The results of this study indicate that the selection of appropriate features of the dataset can improve the detection performance. It is found that the NSLKDD used in this study has 19 significant features, while the dataset Kyoto2006+ has 14 significant features. In addition, the proposed method generally able to provide improvements to the detection results in each dataset tested. The best results gained in the application of the method proposed in the dataset Kyoto2006+.

Item Type: Thesis (Masters)
Uncontrolled Keywords: ambang radius, deteksi intrusi, seleksi fitur, sub-medoid, feature selection, intrusion detection, radius threshold
Subjects: Q Science > QA Mathematics > QA76 Computer software
Divisions: Faculty of Information Technology > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: INDERA ZAINUL MUTTAQIEN
Date Deposited: 23 Feb 2017 07:34
Last Modified: 05 Mar 2019 05:59
URI: http://repository.its.ac.id/id/eprint/1954

Actions (login required)

View Item View Item