Faadhilah, Naufal (2024) Perbandingan Kinerja Klasifikasi Profil Pengguna Rekening Listrik Dengan Machine Learning. Other thesis, Institut Teknologi Sepuluh Nopember.
Text
5025201221-Undergraduate_Thesis.pdf - Accepted Version Restricted to Repository staff only Download (2MB) | Request a copy |
Abstract
Listrik merupakan salah satu kebutuhan dasar manusia pada zaman yang serba modern ini. Konsumsi tenaga listrik di Indonesia cukup besar dengan jangkauan yang luas. Penetapan tarif tenaga listrik ditentukan dengan penggolongan yang mengacu pada keperluan penggunaan listrik dan besar tenaga listrik yang digunakan agar penyediaan tenaga listrik dapat menjadi suatu layanan yang terjangkau bagi rakyat Indonesia untuk berbagai kepentingan. Konsekuensi keterlambatan pembayaran dapat berupa denda hingga pemutusan layanan listrik. Urgensi dari tugas akhir ini adalah untuk melakukan klasifikasi perilaku pelanggan listrik dalam hal ketepatan waktu pembayaran tagihan. Adanya proses identifikasi kemungkinan pelanggan listrik yang membayar melewati batas waktunya dapat mengoptimalkan penanganan terhadap pelanggan yang memiliki potensi untuk terlambat membayar tagihan listriknya. tugas akhir ini juga berusaha untuk mencari variabel dengan pengaruh besar terhadap perilaku pelanggan listrik dalam hal ketepatan waktu pembayaran tagihan listrik.
Tugas akhir ini akan mengembangkan model klasifikasi perilaku pelanggan dalam membayar listrik dengan pendekatan model machine learning. Terdapat beberapa penelitian yang membahas fenomena yang berkaitan dengan pembayaran, seperti penelitian oleh (Karunathunge dkk., 2022), (Ala’raj dkk., 2021), dan (Altinisik & Yilmaz, 2019). Sebelum pengembangan dilakukan, digunakan pengkodean data dan teknik Synthetic Minority Oversampling Technique (SMOTE) untuk mengatasi ketidakseimbangan yang ditemukan pada dataset. Kemudian, digunakan Random Forest, Support Vector Machine, dan Logistic Regression untuk pengembangan model klasifikasi perilaku pelanggan dalam membayar listrik. Kinerja dari model yang telah dikembangkan akan diuji dengan metrik F1 Score dan Area Under the Curve (AUC). Kemudian, untuk melakukan identifikasi faktor yang berpengaruh besar dalam keterlambatan pembayaran tagihan listrik akan digunakan teknik feature importance.
Model dengan kinerja terbaik diraih oleh model Random Forest yang menggunakan pengkodean data dan tanpa SMOTE oversampling meraih kinerja terbaik dengan metrik evaluasi F1 Score sebesar 95,09% dan metrik evaluasi AUC sebesar 96,01%. Dari berbagai uji coba, variabel paling berpengaruh adalah variabel “”RpPTL” yang menyatakan besar tagihan listrik, diikuti oleh “Bank Supporting” yang menyatakan bank yang digunakan untuk pembayaran, dan “kWh” yang menyatakan besar energi listrik yang digunakan.
==========================================================
Electricity is one of the basic human needs in this modern era. Electricity consumption in Indonesia is quite large with a wide range. Determination of electric power tariff is determined by classification that refers to the needs of electricity use and the amount of electric power used so that the provision of electricity can be an affordable service for the people of Indonesia for various purposes. The consequences of late payment can be in the form of fines to disconnection of electricity services. The urgency of this undergraduate thesis is to predict the behavior of electricity customers in terms of timeliness of bill payments. The process of identifying the possibility of electricity customers who pay past the deadline can optimize the handling of customers who have the potential to pay their electricity bills late. This undergraduate thesis also seeks to find variables with a large influence on the behavior of electricity customers in terms of timeliness of payment of electricity bills.
This undergraduate thesis will develop a model for predicting customer behavior in paying electricity with a machine learning model approach. There are several studies that discuss phenomena related to payment, such as research by (Karunathunge dkk., 2022), (Ala’raj dkk., 2021), and (Altinisik & Yilmaz, 2019). Prior to the development, data encoding and Synthetic Minority Oversampling Technique (SMOTE) were used to overcome the imbalance found in the dataset. Then, Random Forest, Support Vector Machine, and Logistic Regression are used to develop a prediction model for customer behavior in paying electricity. The performance of the developed model will be tested with F1 Score and Area Under the Curve (AUC) metrics. Then, to identify factors that have a major influence on late payment of electricity bills, feature importance techniques will be used.
The model with the best performance was achieved by the Random Forest model using data coding and without SMOTE oversampling achieved the best performance with F1 Score evaluation metric of 95.09% and AUC evaluation metric of 96.01%. From various trials, the most influential variable is the variable “RpPTL” which states the amount of electricity bills, followed by “Bank Supporting” which states the bank used for payment, and “kWh” which states the amount of electrical energy used.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | data tidak seimbang, listrik, oversampling, pembayaran, permutasi fitur, electricity, feature permutation, oversampling, payment, unbalanced data |
Subjects: | T Technology > T Technology (General) > T174 Technological forecasting T Technology > T Technology (General) > T57.8 Nonlinear programming. Support vector machine. Wavelets. Hidden Markov models. |
Divisions: | Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis |
Depositing User: | Naufal Faadhilah |
Date Deposited: | 10 Aug 2024 07:11 |
Last Modified: | 10 Aug 2024 07:11 |
URI: | http://repository.its.ac.id/id/eprint/112076 |
Actions (login required)
View Item |