Peringkasan Pertanyaan Stack Overflow Pada Atribut Kualitas Perangkat Lunak Menggunakan Teknik Penggalian Informasi Dan Klasifikasi Support Vector Machine (SVM)

Rausanfita, Alqis (2022) Peringkasan Pertanyaan Stack Overflow Pada Atribut Kualitas Perangkat Lunak Menggunakan Teknik Penggalian Informasi Dan Klasifikasi Support Vector Machine (SVM). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111950010009-Master_Thesis.pdf] Text
05111950010009-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2024.

Download (3MB) | Request a copy

Abstract

Stack Overflow merupakan forum diskusi informal yang dapat menjadi bahan untuk evaluasi kualitas suatu perangkat lunak dengan cara penambangan teks. Evaluasi dapat dilakukan dengan menggunakan hasil peringkasan pertanyaan pada Stack Overflow, peringkasan tersebut dapat mengandung persyaratan kebutuhan pelanggan yang dapat dilakukan pemrosesan lebih lanjut. Selain itu, developer juga dapat mengelompokkan kendala yang dialami pengguna berdasarkan kualitas perangkat lunak sehingga dapat memudahkan dalam melakukan maintenance. Metode peringkasan sebelumnya menggunakan 2 jenis bobot, yang mana antara frasa pada sub aspek dengan frasa pada extend domain memiliki bobot yang sama, seharusnya bobot sub domain lebih besar daripada frasa hasil extend. Oleh karena itu penelitian ini bertujuan untuk meringkas kebutuhan pengguna pada atribut kualitas perangkat lunak dengan menggunakan informasi retrieval dan klasifikasi kualitas perangkat lunak sehingga diharapkan dapat membantu developer dalam mengevaluasi kualitas perangkat lunak secara otomatis. Ada beberapa tahapan yang dilakukan, yaitu: melakukan klasifikasi. Kemudian hasil klasifikasi tiap atribut kualitas dilakukan peringkasan. Pada penelitian ini, didapatkan hasil akurasi terbaikk dengan menggunakan metode SVM dengan nilai akurasi sebesar 86,63 persen. Hasil akurasi terbaik ini didapatkan dengan membandingkan 5 metode lainnya, yaitu Random Forest, Decision Tree, Logistic Regression, Naïve Bayes, dan Neural Network. Setelah didapatkan hasil klasifikasi kemudian dilakukan proses peringkasan dan mendapatkan nilai akurasi sebesar 73,08 persen. Hal tersebut mengindikasikan bahwa penelitian ini cukup baik dalam menghasilkan ringkasan kebutuhan pengguna pada atribut kualitas perangkat lunak dengan menggunakan information retrieval dan klasifikasi kualitas perangkat lunak.
================================================================================================
Stack Overflow is an informal discussion platform that can be used as source for quality evaluation of a software through text mining. Evaluation can be done using the results of the questions summary on the Stack Overflow, the summary can contain the requirements of customer needs that can be processed further. Besides, developer can also group the constraints experienced by users based on the quality of the software so that it can be easier to carry out maintenance. The previous summary method used 2 types of weights with the phrases in the sub-aspects and the phrases in the extend domain had the same weight, in which sub domain should be larger than the extended result phrase. Therefore, this study aims to summarize the user needs on software quality by using retrieval information and software quality classification so that it can help developers in evaluating the software quality automatically. There are several stages that carried out, the first one is classifying. Then the results of the classification of each quality attribute are summarized. In this study, the best accuracy result was obtained using the SVM method with the accuracy value of 86.63 percent. The best accuracy results is obtained by comparing 5 other methods, that are Random Forest, Decision Tree, Logistic Regression, Naïve Bayes, and Neural Network. After obtaining the classification, a summary process was carried out and obtained the accuracy value of 73.08 percent. This indicates that this research is quite good at producing a summary of user needs on software quality attributes using information retrieval and classification of software quality.

Item Type: Thesis (Masters)
Uncontrolled Keywords: information retrieval, domain references, classification of software quality, weight, information retrieval, domain references, klasifikasi kualitas perangkat lunak, bobot,
Subjects: T Technology > T Technology (General) > T57.8 Nonlinear programming. Support vector machine. Wavelets. Hidden Markov models.
T Technology > T Technology (General) > T58.62 Decision support systems
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: Alqis Rausanfita
Date Deposited: 04 Feb 2022 07:36
Last Modified: 02 Nov 2022 01:08
URI: http://repository.its.ac.id/id/eprint/92791

Actions (login required)

View Item View Item