Halim, St Fatika Nabila (2023) Analisis Perbandingan Klasifikasi dan Penerapan Teknik SMOTE Dalam Imbalanced Data Pada Credit Card Default. Other thesis, Institut Teknologi Sepuluh Nopember.
Text
06311840000043-Undergraduate_Thesis.pdf - Accepted Version Restricted to Repository staff only until 1 April 2025. Download (3MB) | Request a copy |
Abstract
Perkembangan teknologi yang pesat melahirkan metode pembayaran elektronik, salah satunya adalah kartu kredit. Penggunaan kartu kredit dinilai memudahkan pemilik dalam bertransaksi. Kemudahan itu sering kali disalahgunakan oleh orang-orang yang tidak bijak, yaitu dengan cara belanja kompulsif. Perilaku belanja kompulsif menggunakan kartu kredit dapat berdampak terhadap risiko gagal bayar atau kartu kredit default. Kartu kredit default adalah gagal melakukan pembayaran utang pada tanggal jatuh tempo. Namun, kasus tersebut tidak selamanya terjadi dengan adanya penjagaan ketat dari pihak bank. Oleh karena itu, terjadi ketidakseimbangan data pada data kejadian yang disimpan dalam sistem. Dataset tidak seimbang menyulitkan metode klasifikasi karena hasil klasifikasi akan berfokus pada kelas mayoritas. Kondisi dataset tidak seimbang dapat diatasi dengan salah satu metode oversampling, yaitu Synthetic Minority Over-sampling Technique (SMOTE). Metode selanjutnya yang digunakan dalam penelitian ini setelah penerapan SMOTE adalah random forest classifier dan extreme gradient boosting (XGBOOST). Metode random forest mendapatkan nilai AUC yang meningkat 4,29% dari 58,73% menjadi 63,02%. Sementara metode XGBOOST mendapatkan nilai AUC yang juga meningkat 14,78% dari 58,00% menjadi 72,78%. Penentuan metode terbaik dilihat dari nilai AUC yang dihasilkan. Dari hasil tersebut dapat disimpulkan bahwa metode XGBOOST adalah metode terbaik dibandingkan dengan random forest karena memiliki nilai AUC yang lebih tinggi
=====================================================================================================================================
The technology that develops rapidly creates payment methods, such as credit cards. Using a credit card is considered to make it easier for owners to transact. This convenience is often misused by people who could be wiser, namely by compulsive shopping. Compulsive shopping using a credit card can impact the risk of default or credit card default. The default credit card fails to make debt payments on the due date. However, this case only sometimes occurs with strict supervision from the bank. Therefore, there is an imbalance in the event data stored in the system. Unbalanced datasets complicate the classification method because the classification results will focus on the majority class. Imbalanced dataset conditions can be overcome by one of the oversampling methods, namely the Synthetic Minority Over-sampling Technique (SMOTE). The following method used in this study after implementing SMOTE is the random forest classifier and extreme gradient boosting (XGBOOST). The random forest method obtained an AUC value that increased by 4.26% from 58.73% to 63.02%. Meanwhile, the XGBOOST method obtained an AUC value that increased by 14.78% from 58.00% to 72.78%. Determination of the best method seen from the resulting AUC value. These results conclude that the XGBOOST method is the best method compared to the random forest because it has a higher AUC value
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | kartu kredit default, dataset tidak seimbang, SMOTE, Random Forest, XGBOOST, credit card default, imbalanced dataset, SMOTE, Random Forest, XGBOOST |
Subjects: | Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines. |
Divisions: | Faculty of Science and Data Analytics (SCIENTICS) > Actuaria > 94203-(S1) Undergraduate Thesis |
Depositing User: | St Fatika Nabila Halim |
Date Deposited: | 02 Feb 2023 06:16 |
Last Modified: | 02 Feb 2023 06:16 |
URI: | http://repository.its.ac.id/id/eprint/96048 |
Actions (login required)
View Item |