Fatikno, Handoko Dian (2025) Analisa Identifikasi Web Bot Pada Aktivitas Web Server Dengan Pendekatan Machine Learning Untuk Penguatan Keamanan Aset Digital. Masters thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
6032222052-Master_Thesis.pdf - Accepted Version Restricted to Repository staff only Download (1MB) | Request a copy |
Abstract
Keamanan digital telah menjadi salah satu tantangan utama dalam menjaga kelangsungan operasional organisasi modern, terutama dengan meningkatnya ancaman web bot berbahaya yang dapat menyebabkan kerugian serius terhadap aset digital organisasi, seperti pencurian data, serangan Distributed Denial of Service (DDoS), dan eksploitasi keamanan lainnya. Permasalahan yang dihadapi adalah aktivitas web bot berbahaya yang semakin kompleks dan menyerupai perilaku pengguna manusia, sehingga sulit diidentifikasi menggunakan metode konvensional. Penelitian ini bertujuan mengklasifikasikan web bot secara efektif untuk memperkuat keamanan aset digital dengan mengidentifikasi pola perilaku web bot sebagai dasar penyusunan kebijakan mitigasi yang responsif terhadap ancaman digital.
Penelitian ini menerapkan algoritma Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN) untuk mengelompokkan sesi berdasarkan kepadatan dalam log aktivitas web, sehingga terbentuk klaster dengan label murni bot dan klaster campuran. Sesi pada klaster campuran kemudian diproses oleh decision tree yang dilatih menggunakan fitur terpilih untuk meningkatkan keakuratan identifikasi bot. Alur kerja mencakup pengumpulan data, praproses, ekstraksi dan seleksi fitur, pembangunan model, serta pengukuran performa menggunakan metrik akurasi, presisi, recall, dan F1-score.
Hasil analisa menunjukkan bahwa kombinasi HDBSCAN dan decision tree mampu mengklasifikasikan sesi web menjadi bot dan manusia secara algoritmik dengan keakuratan 99,97%, presisi dan recall diatas 90%. Penelitian ini juga mengungkap tiga pola perilaku bot mulai web scanning dengan jumlah halaman tinggi namun konten minim, web scraping dengan rasio konten yang tinggi dan klik sistematis, serta web crawling ringan dengan kecepatan akses stabil. Temuan tersebut tidak hanya memperkuat perlindungan aset digital melalui deteksi bot yang lebih andal, tetapi juga menyediakan landasan empiris bagi manajemen untuk merancang strategi mitigasi yang adaptif terhadap ancaman digital yang terus berkembang.
====================================================================================================================================
Digital security has become one of the main challenges in maintaining the operational continuity of modern organizations, particularly with the rising threats of malicious web bots that can cause significant harm to digital assets, such as data breaches, Distributed Denial of Service (DDoS) attacks, and other security exploits. The primary issue is that these malicious web bots are increasingly complex and mimic human user behavior, making them difficult to identify with conventional methods. This research aims to classify web bots effectively to reinforce digital asset protection by uncovering their behavioral patterns as a basis for crafting responsive mitigation policies. This research applies Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN) to group sessions in web activity logs by density, yielding both pure-bot and mixed clusters. Sessions assigned to mixed clusters are then classified by a decision tree built on the most informative features to boost overall bot detection accuracy. The workflow encompasses data collection, preprocessing, feature extraction and selection, model construction, and performance evaluation using accuracy, precision, recall, and F1-score metrics. The analysis shows that the combination of HDBSCAN and decision tree algorithms is capable of classifying web sessions as bots or humans with an accuracy of 99.97%, and precision and recall above 90%. The study also reveals three main web bot behavior patterns, web scanning with high page volume but minimal content, web scraping with high content ratio and systematic clicks, and lightweight crawling with stable access speed. These findings not only enhance digital asset protection through more reliable bot detection but also provide empirical insights for management to design adaptive mitigation strategies against evolving digital threats. Keywords: Machine Learning, Web Bots,
Actions (login required)
![]() |
View Item |