Pendekatan Regresi Logistik dengan Metode Majority Weighted Minority Oversampling Technique (MWMOTE) dan Rare Event Weighted Logistic Regression (RE-WLR) untuk Imbalanced Data (Aplikasi pada Partisipasi Anak dalam Kegiatan Ekonomi di Sulawesi Tenggara)

Sagita, Regina Hayden (2023) Pendekatan Regresi Logistik dengan Metode Majority Weighted Minority Oversampling Technique (MWMOTE) dan Rare Event Weighted Logistic Regression (RE-WLR) untuk Imbalanced Data (Aplikasi pada Partisipasi Anak dalam Kegiatan Ekonomi di Sulawesi Tenggara). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6003202003-Master_Thesis.pdf] Text
6003202003-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2025.

Download (5MB) | Request a copy

Abstract

Indonesia merupakan salah satu negara dengan jumlah pekerja anak yang cukup tinggi. Badan Pusat Statistik mencatat penduduk usia 10-17 tahun yang menjadi pekerja di tanah air naik pada tahun 2020 dibandingkan pada tahun sebelumnya. Pekerja anak erat kaitannya dengan kemiskinan, artinya faktor lingkungan keluarga dan tingkat pendidikan merupakan penentu adanya partisipasi anak dalam kegiatan ekonomi. Kasus tingkat partisipasi anak dalam ekonomi di Sulawesi Tenggara merupakan data mentah Susenas berjumlah 3969 anak, yakni antara proporsi anak usia 10-14 tahun yang bekerja tahun 2019 sebesar 4,9 persen menunjukkan kasus ini termasuk ke dalam kategori imbalanced data. Permasalahan dalam klasifikasi data adalah komposisi data yang tidak seimbang (imbalanced data). Pada klasifikasi biner atau dua kelas, salah satu kelas memiliki jumlah sampel lebih besar dari kelas lainnya, maka penelitian ini akan menerapkan pendekatan metode oversampling digunakan untuk mengatasi ketidakseimbangan data dengan menambahkan data sintetik pada kelas minoritas sehingga memiliki kuantitas data yang sama dengan kelas mayoritas. Majority Weighted Minority Oversampling Technique (MWMOTE) merupakan metode oversampling dengan melakukan Algoritma MWMOTE didapatkan dengan mengkontruksi set dari S_imin, menemukan bobot, dan pembuatan sampel data sintetik dengan klastering yang akan dibandingkan dengan metode Rare Event Weighted Logistic Regression (RE-WLR). Variabel pada MWMOTE yang secara signifikan mampu menggambarkan partisipasi anak dalam kegiatan ekonomi di Sulawesi Tenggara antara lain variabel variabel usia anak, jenis kelamin anak, jenis kelamin kepala rumah tangga, tingkat pendidikan kepala rumah tangga, lokasi tempat tinggal, lapangan usaha kepala rumah tangga, status pekerjaan kepala rumah tangga, dan jumlah anggota rumah tangga. MWMOTE menghasilkan delapan variabel yang signifikan terhadap model, sedangkan RE-WLR menghasilkan enam variabel signifikan. Hasil perbandingan kinerja klasifikasi dalam kasus partisipasi anak dalam kegiatan ekonomi di Sulawesi Tenggara didapatkan hasil bahwa metode MWMOTE lebih baik performanya jika dibandingkan dengan RE-WLR dan regresi logistik. Model MWMOTE mampu memberikan hasil yang baik dengan rata-rata nilai AUC adalah 56,28 persen, sedangkan RE-WLR didapatkan rata-rata nilai AUC 50,00 persen.
=================================================================================================================================
Indonesia is one of the countries with a fairly high number of child workers. The Central Bureau of Statistics recorded that the population aged 10-17 years who are employed in Indonesia will increase in 2020 compared to the previous year. Child labor is closely related to poverty, meaning that family environmental factors and education level are determinants of children's participation in economic activities. The case for the level of participation of children in the economy in Southeast Sulawesi is the raw Susenas data totaling 3969 children, that is, the proportion of children aged 10-14 years who worked in 2019 was 4.9 percent indicating this case is included in the imbalanced data category. The problem in data classification is the unbalanced data composition. In binary classification or two classes, one class has a larger number of samples than the other class, so this study will apply the oversampling method approach used to overcome data imbalance by adding synthetic data to the minority class so that it has the same data quantity as the majority class. Majority Weighted Minority Oversampling Technique (MWMOTE) is an oversampling method by performing the MWMOTE Algorithm obtained by constructing sets of S_imin, finding weights, and creating synthetic data samples by clustering which will be compared with the Rare Event Weighted Logistic Regression (RE-WLR) method. Variables in MWMOTE that are significantly able to describe children's participation in economic activities in Southeast Sulawesi include the variables of the child's age, child's sex, sex of the head of the household, education level of the head of the household, location of residence, business field of the head of the household, status the occupation of the head of the household, and the number of household members. MWMOTE produces eight variables that are significant to the model, while RE-WLR produces six significant variables. The results of a comparison of classification performance in the case of children's participation in economic activities in Southeast Sulawesi showed that the MWMOTE method performed better when compared to RE-WLR and logistic regression. The MWMOTE model was able to give good results with an average AUC value of 56,28 percent, while the RE-WLR obtained an average AUC value of 50,00 percent.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Pekerja Anak, Imbalanced, MWMOTE, RE-WLR, Child Labour
Subjects: H Social Sciences > HA Statistics
H Social Sciences > HA Statistics > HA31.3 Regression. Correlation
Q Science > QA Mathematics > QA278.2 Regression Analysis. Logistic regression
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49101-(S2) Master Thesis
Depositing User: Regina Hayden Sagita
Date Deposited: 17 Feb 2023 08:49
Last Modified: 17 Feb 2023 08:49
URI: http://repository.its.ac.id/id/eprint/97499

Actions (login required)

View Item View Item