Arya, Tri Fidrian (2025) Otomatisasi Sistem Auto-Scaling Cloud Node Berdasarkan Prediksi Beban Kerja Komputasi. Masters thesis, Institut Teknologi Sepuluh Nopember.
Text
6022231043-Master_Thesis.pdf - Accepted Version Restricted to Repository staff only until 1 April 2027. Download (9MB) | Request a copy |
Abstract
Sistem penskalaan otomatis dalam komputasi awan penting untuk menangani fluktuasi beban kerja aplikasi. Penelitian ini menggunakan machine learning untuk memprediksi kebutuhan sumber daya berdasarkan pola kerja beban kerja dan merancang sistem penskalaan otomatis. Dataset yang digunakan meliputi fitur nama node, waktu, persentase penggunaan CPU, dan penggunaan RAM. Model machine learning diterapkan untuk regresi prediksi dari persentase penggunaan CPU, beban CPU, penggunaan RAM, penggunaan penyimpanan, dan trafik jaringan kemudian beban kerja server diklasifikasikan ke dalam empat kategori: Sangat Tinggi, Tinggi, Rendah, dan Sangat Rendah. Sistem autoscaling yang digunakan adalah horizontal scaling. Dari hasil penelitian ditemukan bahwa algoritma stacking pada ensemble learning dengan base learner Random Forest dan XGBoost memiliki kinerja yang lebih baik dalam menghasilkan regresi prediktif. Kemudian setelah dilakukan pengujian stabilitas menggunakan K-Fold cross-validation dengan mengklasifikasikan berdasarkan status beban kerja, ditemukan bahwa algoritma Gradient Boosting memiliki hasil yang lebih baik dibandingkan algoritma lainnya yaitu untuk persentase penggunaan CPU dengan akurasi 0,998, presisi 0,888, recall 0,872, f1score 0,88; Rata-rata beban CPU 15 menit dengan akurasi 0,997, presisi 0,884, recall 0,893, f1score 0,888; persentase penggunaan RAM adalah akurasi 0,99, presisi 0,984, recall 0,984, dan f1score 0,984; penggunaan disk dengan akurasi 0.999, presisi 0,999, recall 0,999, dan f1score 0,999; serta trafik jaringan dengan akurasi 0.999, presisi 0,997, recall 0,997, dan f1score 0,997. Namun algoritma XGBoost juga memiliki hasil pengujian yang hampir sama dengan Gradient Boosting.
==================================================================================================================================
Auto-scaling systems in cloud computing are important for handling application workload fluctuations. This research uses machine learning to predict resource requirements based on workload work patterns and design an automatic scaling system. The dataset used includes features of node name, time, CPU usage percentage, and RAM usage. The machine learning model is applied for prediction regression of the percentage of CPU usage, CPU load, RAM usage, storage usage, and network traffic then the server workload is classified into four categories: Very High, High, Low, and Very Low. The autoscaling system used is horizontal scaling. From the research results, it was found that the stacking algorithm in ensemble learning with the base learner Random Forest and XGBoost had better performance in producing predictive regression. Then after carrying out stability testing using K-Fold cross-validation by classifying based on workload status, it was found that the Gradient Boosting algorithm had better results than other algorithms, namely for the percentage of CPU usage with an accuracy of 0.998, precision 0.888, recall 0.872, f1score 0, 88; 15 minute CPU load average with 0.997 accuracy, 0.884 precision, 0.893 recall, 0.888 f1score; the percentage of RAM usage is accuracy 0.99, precision 0.984, recall 0.984, and f1score 0.984; disk usage with accuracy 0.999, precision 0.999, recall 0.999, and f1score 0.999; as well as network traffic with an accuracy of 0.999, precision 0.997, recall 0.997, and f1score 0.997. However, the XGBoost algorithm also has test results that are almost the same as Gradient Boosting.
Actions (login required)
View Item |