Prediksi Tingkat Partisipasi Pemilihan Umum dengan Pendekatan Regresi Menggunakan Kombinasi Fitur Demografi dan Opini Masyarakat

Sidharta, Bayu Adjie (2023) Prediksi Tingkat Partisipasi Pemilihan Umum dengan Pendekatan Regresi Menggunakan Kombinasi Fitur Demografi dan Opini Masyarakat. Other thesis, Insitut Teknologi Sepuluh Nopember.

[thumbnail of 05111940000172-Undergraduate_Thesis.pdf] Text
05111940000172-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2025.

Download (2MB) | Request a copy

Abstract

Partisipasi dalam pemilihan umum merupakan aspek penting bagi pelaksanaan demokrasi. Namun tingkat partisipasi pemilih sering berbeda antara daerah, menyebabkan kesenjangan partisipasi yang tinggi dan hasil pemilihan yang tidak mencerminkan kepentingan seluruh rakyat. Untuk mengatasi masalah ini, survei biasa digunakan, tetapi memiliki keterbatasan waktu dan biaya serta potensi bias sampling dan jawaban. Sebagai alternatif, sebuah model pembelajaran mesin yang menggunakan data demografi dan opini publik dari media Twitter telah dirancang untuk memprediksi tingkat partisipasi pemilu di suatu daerah. Proses pembuatan model meliputi pengumpulan partisipasi pemilih (OpenData KPU), data demografi (BPS) tempat pemilih serta data opini masyarakat (Twitter). Analisis sentimen dilakukan terhadap data opini dengan berbagai model analisis sentimen untuk mendapatkan sentimen publik yang paling representatif. Data demografi dan sentimen lalu diolah dan ditransformasi berdasarkan kabupaten dan kota asal. Berbagai teknik seleksi fitur diimplementasikan menggunakan data yang telah ditransformasi untuk mencari himpunan fitur yang paling berpengaruh dalam memprediksi partisipasi pemilu. Hyper-parameter tuning dilakukan kepada kombinasi model pembelajaran mesin dan himpunan fitur terbaik untuk meningkatkan akurasi prediksi model. Hasil analisis sentimen menggunakan IndoBERTweet menunjukkan akurasi prediksi tertinggi sebesar 74%. Setelah dilakukan analisis sentimen, dilakukan seleksi fitur dengan menggunakan berbagai metode. Particle swarm optimization (PSO) menjadi metode yang menghasilkan himpunan fitur terbaik dengan nilai RMSE sebesar 0,0371. Kemudian, dengan menggabungkan model CatBoost dengan himpunan fitur dari PSO, diperoleh nilai RMSE terbaik sebesar 0,0356. Terdapat penurunan RMSE sebesar 5.05% dan peningkatan R2 sebesar 10.86% setelah dilakukan hyper-parameter tuning pada kombinasi tersebut.
=================================================================================================================================
Participation in elections is an essential aspect of democracy. However, the level of voter participation often varies between regions, resulting in a significant participation gap and election outcomes that do not reflect the interests of the entire population. To address this issue, surveys are commonly used, but they have limitations in terms of time, cost, and potential sampling and response biases. As an alternative, a machine learning model has been designed that utilizes demographic data and public opinions from Twitter to predict the level of electoral participation in a specific region. The process of building the model involves collecting voter participation data (OpenData KPU), demographic data (BPS) of the polling locations, and public opinion data (Twitter). Sentiment analysis is performed on the opinion data using various sentiment analysis models to obtain the most representative public sentiment. The demographic and sentiment data are then processed and transformed based on the originating districts and cities. Various feature selection techniques are implemented using the transformed data to find the most influential set of features in predicting electoral participation. Hyper-parameter tuning is conducted on the combination of the best machine learning model and feature set to enhance the predictive accuracy of the model. Sentiment analysis using IndoBERTweet shows the highest prediction accuracy of 74%. After the sentiment analysis, feature selection is performed using various methods, and Particle Swarm Optimization (PSO) emerges as the method that yields the best feature set with an RMSE value of 0.0371. Then, by combining the CatBoost model with the feature set from PSO, the best RMSE value of 0.0356 is obtained. A decrease in RMSE by 5.05% and an increase in R2 by 10.86% is achieved after performing hyper-parameter tuning on this combination.

Item Type: Thesis (Other)
Uncontrolled Keywords: Partisipasi Pemilu, Regresi, Twitter, Pemilu Indonesia, Voter Turnout, Regression, Indonesian Presidential Election
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning.
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Bayu Adjie Sidharta
Date Deposited: 07 Dec 2023 08:50
Last Modified: 07 Dec 2023 08:50
URI: http://repository.its.ac.id/id/eprint/101368

Actions (login required)

View Item View Item