Rare Event Weighted Logistic Regression Untuk Klasifikasi Imbalanced Data (Studi Kasus: Klasifikasi Desa Tertinggal Di Provinsi Jawa Timur)

Sulasih, Dian Eka Apriana (2016) Rare Event Weighted Logistic Regression Untuk Klasifikasi Imbalanced Data (Studi Kasus: Klasifikasi Desa Tertinggal Di Provinsi Jawa Timur). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 1314201714-Master-Thesis.pdf]
Preview
Text
1314201714-Master-Thesis.pdf - Published Version

Download (4MB) | Preview

Abstract

Salah satu permasalahan dalam klasifikasi data adalah komposisi data yang tidak
seimbang (imbalanced data). Pada klasifikasi imbalanced data, classifier
cenderung memprediksi kelas yang memiliki komposisi data lebih besar sehingga
didapatkan akurasi prediksi yang baik terhadap kelas data training yang banyak
(kelas mayoritas) dan akurasi prediksi yang buruk untuk kelas data training yang
sedikit (kelas minoritas). Oleh karena itu, diperlukan metode yang tepat untuk
melakukan klasifikasi pada imbalanced data. Rare Event Weighted Logistic
Regression (RE-WLR) adalah metode klasifikasi imbalanced data untuk data
berukuran besar dan rare event. RE-WLR dikembangkan dari Truncated
Regularized Iteratively Re-weighted Least Square (TR-IRLS) dengan rare event
correction pada Regresi Logistik. Penelitian ini bertujuan untuk mengkaji dan
menerapkan RE-WLR untuk klasifikasi imbalanced data dengan studi kasus
klasifikasi desa tertinggal di Provinsi Jawa Timur tahun 2014, serta untuk
membandingkan tingkat ketepatan klasifikasi antara metode RE-WLR dan TRIRLS
pada kasus tersebut. Hasil penelitian menunjukkan bahwa secara deskriptif
RE-WLR memberikan kinerja klasifikasi yang lebih baik dibandingkan TR-IRLS,
namun dengan perbedaan yang tidak signifikan. Rata-rata nilai sensitifity RE-WLR
juga lebih tinggi daripada TR-IRLS. Hal ini menunjukkan bahwa RE-WLR bisa
memprediksi kelas minoritas (rare event) atau desa tertinggal dengan lebih baik
dibandingkan TR-IRLS.
==================================================================================================================
One of the problems in data classification is the composition of the data that is out
of balance (imbalanced data). In the classification of imbalanced data, most of the
classifier are biased towards the major class and have very poor classification
rates on minor class. Rare Event Weighted Logistic Regression (RE-WLR) is a
method of classification applied to large imbalanced data and rare event. REWLR
is developed from Truncated Regularized Iteratively Re-weighted Least
Squares (TR-IRLS) with rare event correction to Logistic Regression. This study
aims to assess and apply the RE-WLR to the classification of imbalanced data
with study case classification of underdeveloped rural in East Java Province in
2014, and to compare the accuracy between RE-WLR method and TR-IRLS in
that case. The results shows that RE-WLR provides better classification
performance than TR-IRLS, but the difference is not significant. The average
value of RE-WLR’s sensitifity is also higher than TR-IRLS. This shows that the
RE-WLR could predict the minority class (rare event) or underdeveloped rural
better than TR-IRLS.

Item Type: Thesis (Masters)
Additional Information: RTSt 519.536 Sul r
Uncontrolled Keywords: Desa Tertinggal, Imbalanced Data, Klasifikasi ,RE-WLR, TR-IRLS
Subjects: H Social Sciences > HN Social history and conditions. Social problems. Social reform
Divisions: Faculty of Mathematics and Science > Statistics > 49101-(S2) Master Thesis
Depositing User: Users 13 not found.
Date Deposited: 15 Jun 2017 07:14
Last Modified: 27 Dec 2018 07:48
URI: http://repository.its.ac.id/id/eprint/41700

Actions (login required)

View Item View Item