Nugroho, Adi (2023) Pengembangan Model Prediktif Analitik Untuk Menilai Tingkat Maintainabilitas Proyek Perangkat Lunak Di Github. Masters thesis, Institut Teknologi Sepuluh Nopember.
Text
6032202154_Tesis.pdf - Accepted Version Restricted to Registered users only until 1 April 2025. Available under License Creative Commons Attribution Non-commercial. Download (3MB) | Request a copy |
Abstract
Pengembangan proyek perangkat lunak saat ini sudah tidak bisa dilepaskan dari penggunaan library atau produk open source. Terdapat jutaan produk open source dengan fungsi spesifik yang mampu digunakan dan diintegrasikan dalam pengembangan perangkat lunak. Tetapi untuk memilih produk open source yang bagus dan memiliki maintainabilitas yang baik tidaklah mudah. Github sebagai salah satu repositori open source berbasis git, saat ini menyimpan lebih dari 46 juta proyek open source. Pada sebuah repositori proyek open source di Github melekat puluhan fitur yang dapat dianalisis untuk menilai kualitas repositori tersebut. Banyaknya jumlah fitur ini mengakibatkan perlunya keahlian dan pengalaman untuk menilai kualitas repositori. Penelitian sebelumnya menggunakan metode Random Forest untuk menilai tingkat maintainabilitas pada sebuah repositori di Github secara otomatis. Penelitian ini akan memanfaatkan lebih banyak fitur dari repositori di Github serta menggunakan dan membandingkan metode machine learning antara lain Random Forest, Support Vector Machine, Extreme Gradient Boosting dan regresi logistik dalam pembuatan model untuk menilai tingkat maintainabilitas. Model dalam penelitian ini dikembangkan dengan menggunakan 17 variabel prediktor dan satu variabel respon. Hasil dari pengujian model menunjukkan model dari metode Random Forest dan Extreme Gradient Boosting menunjukkan tingkat akurasi yang tinggi masing-masing 94% dan 94,35%. Kedua model juga menunjukkan daftar variabel-variabel prediktor signifikan yang hampir mirip dalam penilaian maintainabilitas.
==============================================================================================================================
The development of software projects nowadays cannot be separated from open-source libraries or products. There are millions of open-source products with specific functionality that can be used when developing software. But choosing a good open-source product that has good maintainability is not an easy task. Github is one of the git-based open-source repositories and currently stores more than 46 million open-source projects. Lots of Github's repository features can be analyzed the repository quality. But manually assessing a repository's quality by analyzing its features needs skills and experience. Previous research used the Random Forest method to automatically assess the level of maintainability of a Github repository. This study will use more features from the repository and then compare the Random Forest, Support Vector Machine, Extreme Gradient Boosting and Logistic Regression methods in assessing Github's repository maintainability. 17 predictor variables and 1 respond variable were used to create machine learning models. Random Forest's and Extreme Gradient Boosting's models achieved almost similar accuracy rating with 94% and 94.35% respectively. Both models are also displayed almost similar list of significant features in assessing a repository's maintainability.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | maintainability, software, Github, open-source, machine learning |
Subjects: | T Technology > T Technology (General) > T57.5 Data Processing T Technology > T Technology (General) > T57.8 Nonlinear programming. Support vector machine. Wavelets. Hidden Markov models. |
Divisions: | Interdisciplinary School of Management and Technology (SIMT) > 61101-Master of Technology Management (MMT) |
Depositing User: | Adi Nugroho |
Date Deposited: | 19 Jan 2023 17:15 |
Last Modified: | 19 Jan 2023 17:15 |
URI: | http://repository.its.ac.id/id/eprint/95511 |
Actions (login required)
View Item |