Ginarsa, Nyoman Agus Nugraha (2025) Optimalisasi Kinerja Autoscaling Pada Kubernetes Cluster Melalui Prediksi Berbasis Generative AI. Masters thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
6025232030-Master_Thesis.pdf Restricted to Repository staff only Download (11MB) | Request a copy |
Abstract
Pemanfaatan cloud computing berkembang pesat dalam beberapa tahun terakhir, memberikan fleksibilitas bagi perusahaan untuk mengakses infrastruktur dan layanan aplikasi tanpa investasi besar dalam perangkat keras. Teknologi ini menawarkan keunggulan seperti skalabilitas dan penghematan biaya, serta mengurangi ketergantungan pada infrastruktur internal. Bersamaan dengan itu, containerization dan Kubernetes menjadi standar dalam pengelolaan aplikasi yang memungkinkan autoscaling dan pengelolaan beban kerja secara otomatis. Namun, menentukan jumlah pod yang ideal dalam Kubernetes tetap menjadi tantangan, terutama untuk beban kerja yang fluktuatif. Generative AI, dengan kemampuan memprediksi kebutuhan berdasarkan pola data historis, berpotensi membantu dalam prediksi autoscaling yang lebih akurat di Kubernetes. Penelitian ini bertujuan untuk mengembangkan model prediksi jumlah pod berbasis generative AI dalam Kubernetes untuk mengoptimalkan pengelolaan sumber daya secara otomatis. Metode yang digunakan memanfaatkan layanan dari Amazon Bedrock dengan model Claude Sonnet 4, serta model GPT-4.1 yang diakses dari API platform OpenAI. Penelitian ini menggunakan data historis beban kerja aplikasi sebagai knowledge base. Hasil prediksi digunakan sebagai acuan untuk pengaturan jumlah pod secara otomatis sesuai dengan kebutuhan. Hasil dari pengujian menunjukkan bahwa model GPT-4.1 memberikan performa autoscaling yang lebih unggul dibandingkan Claude Sonnet 4, ditunjukkan dari waktu respons yang lebih rendah, throughput lebih tinggi, dan alokasi CPU yang lebih efisien terhadap workload fluktuatif. Meski demikian, GPT-4.1 masih menunjukkan keterlambatan dalam fase scale-in. Penerapan generative AI untuk prediksi kebutuhan pod dalam Kubernetes memberikan kontribusi pada peningkatan efisiensi pengelolaan sumber daya dan menjaga kualitas layanan yang optimal bagi aplikasi yang menghadapi fluktuasi beban kerja. Penelitian ini diharapkan dapat menjadi solusi inovatif dalam pengelolaan Kubernetes yang lebih cerdas dan efisien.
=================================================================================================================================
Cloud computing has grown rapidly in recent years, providing companies with the flexibility to access infrastructure and application services without investing heavily in hardware. These technologies offer advantages such as scalability and cost savings, as well as reducing reliance on in-house infrastructure. At the same time, containerization and Kubernetes have become standards in application management, enabling autoscaling and automated workload management. However, determining the ideal number of pods in Kubernetes remains a challenge, especially for fluctuating workloads. Generative AI, with its ability to predict needs based on historical data patterns, has the potential to help in more accurate autoscaling predictions in Kubernetes. This research aims to develop a generative AI-based pod number prediction model in Kubernetes to optimize automated resource management. The method utilizes Amazon Bedrock services with the Claude Sonnet 4 model and the GPT- 4.1 model accessed from the OpenAI platform API. This research uses historical application workload data as a knowledge base. The prediction results are used as a reference for automatically adjusting the number of pods according to needs. Test results show that the GPT-4.1 model provides superior autoscaling performance compared to Claude Sonnet 4, demonstrated by lower response times, higher throughput, and more efficient CPU allocation for fluctuating workloads. However, GPT-4.1 still exhibits delays during the scale-in phase. The application of generative AI to predict pod requirements in Kubernetes contributes to increased resource management efficiency and maintains optimal quality of service for applications facing fluctuating workloads. This research is expected to provide an innovative solution for smarter and more efficient Kubernetes management.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | Autoscaling , Cloud Computing, Generative AI, Kubernetes ======================================================== Autoscaling , Cloud Computing, Generative AI, Kubernetes |
Subjects: | Q Science > QA Mathematics > QA76.585 Cloud computing. Mobile computing. |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis |
Depositing User: | Nyoman Agus Nugraha Ginarsa |
Date Deposited: | 30 Jul 2025 05:41 |
Last Modified: | 30 Jul 2025 05:41 |
URI: | http://repository.its.ac.id/id/eprint/123373 |
Actions (login required)
![]() |
View Item |