Perbandingan Metode Rare Event Weighted Logistic Regression Dan Truncated Regularized Prior Correction Untuk Klasifikasi Pada Imbalanced Data (Studi Kasus: Klasifikasi Tingkat Kesejahteraan di Provinsi Bali)

Triasmoro, Sony Puji (2018) Perbandingan Metode Rare Event Weighted Logistic Regression Dan Truncated Regularized Prior Correction Untuk Klasifikasi Pada Imbalanced Data (Studi Kasus: Klasifikasi Tingkat Kesejahteraan di Provinsi Bali). Masters thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
1316201702-Master_Thesis.PDF - Published Version
Restricted to Repository staff only

Download (2MB) | Request a copy

Abstract

Kemiskinan menjadi masalah yang tetap harus diselesaikan dan membutuhkan program-program penanggulangan kemiskinan yang dilakukan secara tepat. Kesalahan klasifikasi dalam pelaksanaan program penanggulangan kemiskinan seperti inclusion error (rumah tangga yang tidak berhak menerima manfaat, tetapi menerima manfaat) dan exclusion error (rumah tangga yang berhak menerima manfaat, tetapi tidak masuk sebagai penerima manfaat) harus diminimalisir sekecil mungkin. Untuk itu dibutuhkan metodologi dalam menentukan klasifikasi tingkat kesejahteraan rumah tangga yang tepat. Regresi logistik adalah metode analisis yang dapat digunakan untuk melakukan klasifikasi data. Akan tetapi ketika digunakan dalam kasus tingkat kesejahteraan di Indonesia yang datanya bersifat imbalanced, maka metode regresi logistik biasa tidak tepat digunakan. Hal ini disebabkan regresi logistik cenderung menihilkan peluang dari kelompok minoritas karena nilai prediksi akan cenderung kepada kategori data yang mayoritas sehingga tingkat ketepatan yang dihasilkan menjadi kurang baik. Rare Events Weighted Logistic Regression (RE-WLR) dan Truncated Regularized Prior Correction (TR-PC) merupakan pengembangan dari regresi logistik yang digunakan untuk mengatasi kelemahan pada kasus imbalanced data. Penelitian ini menerapkan metode RE-WLR dan TR-PC dengan menggunakan 14 variabel penelitian dan hasilnya adalah didapatkan 10 variabel yang signifikan dalam model RE-WLR dan TR-PC dan 4 variabel lainnya tidak signifikan dalam kedua model. Indikator yang digunakan untuk mengukur akurasi performa model dalam memprediksi kelas positif (rumah tangga miskin) dan kelas negatif (rumah tangga tidak miskin) dalam penelitian ini adalah nilai AUC (Area Under Curve) dan G-mean. Hasil penelitian ini menunjukkan model RE-WLR mampu memberikan hasil akurasi yang lebih baik dibandingkan model TR-PC dan regresi logistik dengan nilai G-mean sebesar 83,47 persen dan nilai AUC adalah 0,836 (kategori baik). Nilai ini di atas nilai G-mean dari model TR-PC 73,68 persen dan nilai AUC dari model TR-PC yaitu 0,762 (kategori cukup). ==========

Item Type: Thesis (Masters)
Uncontrolled Keywords: Klasifikasi; Kemiskinan; Regresi Logistik; Imbalanced data; Classification; Poverty; Logistic Regression; Imbalanced data
Subjects: H Social Sciences > HA Statistics
Q Science > QA Mathematics > QA278.2 Regression Analysis
Divisions: Faculty of Mathematics and Science > Statistics > (S2) Master Theses
Depositing User: Triasmoro Sony Puji
Date Deposited: 01 Feb 2018 05:08
Last Modified: 01 Feb 2018 05:08
URI: http://repository.its.ac.id/id/eprint/50964

Actions (login required)

View Item View Item