Rare Event Weighted Logistic Regression Untuk Klasifikasi Imbalanced Data (Studi Kasus: Klasifikasi Desa Tertinggal Di Provinsi Jawa Timur)

Sulasih, Dian Eka Apriana (2016) Rare Event Weighted Logistic Regression Untuk Klasifikasi Imbalanced Data (Studi Kasus: Klasifikasi Desa Tertinggal Di Provinsi Jawa Timur). Masters thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
1314201714-Master-Thesis.pdf - Published Version

Download (4MB) | Preview

Abstract

Salah satu permasalahan dalam klasifikasi data adalah komposisi data yang tidak seimbang (imbalanced data). Pada klasifikasi imbalanced data, classifier cenderung memprediksi kelas yang memiliki komposisi data lebih besar sehingga didapatkan akurasi prediksi yang baik terhadap kelas data training yang banyak (kelas mayoritas) dan akurasi prediksi yang buruk untuk kelas data training yang sedikit (kelas minoritas). Oleh karena itu, diperlukan metode yang tepat untuk melakukan klasifikasi pada imbalanced data. Rare Event Weighted Logistic Regression (RE-WLR) adalah metode klasifikasi imbalanced data untuk data berukuran besar dan rare event. RE-WLR dikembangkan dari Truncated Regularized Iteratively Re-weighted Least Square (TR-IRLS) dengan rare event correction pada Regresi Logistik. Penelitian ini bertujuan untuk mengkaji dan menerapkan RE-WLR untuk klasifikasi imbalanced data dengan studi kasus klasifikasi desa tertinggal di Provinsi Jawa Timur tahun 2014, serta untuk membandingkan tingkat ketepatan klasifikasi antara metode RE-WLR dan TRIRLS pada kasus tersebut. Hasil penelitian menunjukkan bahwa secara deskriptif RE-WLR memberikan kinerja klasifikasi yang lebih baik dibandingkan TR-IRLS, namun dengan perbedaan yang tidak signifikan. Rata-rata nilai sensitifity RE-WLR juga lebih tinggi daripada TR-IRLS. Hal ini menunjukkan bahwa RE-WLR bisa memprediksi kelas minoritas (rare event) atau desa tertinggal dengan lebih baik dibandingkan TR-IRLS. ================================================================================================================== One of the problems in data classification is the composition of the data that is out of balance (imbalanced data). In the classification of imbalanced data, most of the classifier are biased towards the major class and have very poor classification rates on minor class. Rare Event Weighted Logistic Regression (RE-WLR) is a method of classification applied to large imbalanced data and rare event. REWLR is developed from Truncated Regularized Iteratively Re-weighted Least Squares (TR-IRLS) with rare event correction to Logistic Regression. This study aims to assess and apply the RE-WLR to the classification of imbalanced data with study case classification of underdeveloped rural in East Java Province in 2014, and to compare the accuracy between RE-WLR method and TR-IRLS in that case. The results shows that RE-WLR provides better classification performance than TR-IRLS, but the difference is not significant. The average value of RE-WLR’s sensitifity is also higher than TR-IRLS. This shows that the RE-WLR could predict the minority class (rare event) or underdeveloped rural better than TR-IRLS.

Item Type: Thesis (Masters)
Additional Information: RTSt 519.536 Sul r
Uncontrolled Keywords: Desa Tertinggal, Imbalanced Data, Klasifikasi ,RE-WLR, TR-IRLS
Subjects: H Social Sciences > HN Social history and conditions. Social problems. Social reform
Divisions: Faculty of Mathematics and Science > Statistics > (S2) Master Theses
Depositing User: Users 13 not found.
Date Deposited: 15 Jun 2017 07:14
Last Modified: 27 Dec 2018 07:48
URI: http://repository.its.ac.id/id/eprint/41700

Actions (login required)

View Item View Item