Pengaruh Analisis Sentimen Twitter Terhadap Prediksi Jumlah Kasus Tuberkulosis Di Indonesia Menggunakan Cnn-Gru Dengan Pertimbangan Data Polusi Udara Copernicus

Mahakerty, Dyah Kumalarani (2025) Pengaruh Analisis Sentimen Twitter Terhadap Prediksi Jumlah Kasus Tuberkulosis Di Indonesia Menggunakan Cnn-Gru Dengan Pertimbangan Data Polusi Udara Copernicus. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5026211023-Undergraduate_Thesis.pdf] Text
5026211023-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (9MB) | Request a copy

Abstract

Tuberkulosis (TB) adalah penyakit menular yang menjadi salah satu ancaman kesehatan global, dengan Indonesia sebagai penyumbang kasus TB tertinggi kedua di dunia. Pandemi COVID-19 yang terjadi menyebabkan penurunan pelaporan kasus TB. Selain itu, stigma sosial terhadap pasien TB bermunculan di masyarakat Indonesia yang menyebabkan keengganan untuk mengungkapkan kepada orang lain tentang penyakit mereka sehingga menjadi salah satu alasan terjadinya peningkatan kasus setiap harinya. Oleh karena itu, tugas akhir ini bertujuan untuk membangun model prediksi dengan mempertimbangkan sentimen masyarakat terkait TB di media sosial (Twitter) serta pengaruhnya terhadap akurasi prediksi perkembangan kasus TB di masa depan. Hasil menunjukkan bahwa model baseline CNN-GRU telah memiliki performa yang sangat baik dan memiliki kestablian yang kuat ada pada skema data 80:10:10 pada sequence 60 dengan hasil evaluasi pada data tes R² yaitu 0.97, MAPE 0.80%, RMSE 20.518, dan MAE 18.22. Penambahan fitur sentimen Twitter subjectivity_rollingwindow365 tidak selalu meningkatkan performa, terutama ketika data utama (TB dan polusi udara) sudah cukup kuat. Namun, pada skema tertentu dengan performa awal yang rendah, seperti pembagian data 60:20:20 pada sequence 60, penambahan fitur sentimen di Twitter mampu memberikan peningkatan performa dengan penurunan MAE sebesar 61.33%, RMSE turun 60.34%, MAPE menurun 61.22%, dan Skor R² meningkat drastis dari -0.017 menjadi 0.8398. Hal ini menunjukkan bahwa sentimen dapat berfungsi sebagai sinyal tambahan yang berguna ketika informasi dari data utama kurang mencukupi sehingga mempengaruhi ke peningkatan performa pada model baseline yang memiliki performa buruk sebelumnya.
=====================================================================================================================================
Tuberculosis (TB) is an infectious disease that has become a global health issue, with Indonesia reporting the second highest number of TB cases in the world. The ongoing COVID-19 pandemic has led to a decline in TB case reporting. In addition, social stigma against TB patients has been spreading in Indonesian society, leading to a reluctance to disclose their illness to others, which is one of the reasons for the daily increase in cases. Therefore, this study aims to build a prediction model by considering public sentiment related to TB on social media (Twitter) and its effects on the accuracy of predicting the development of TB cases in the future. The results show that the CNN-GRU baseline model has performed very well and has strong stability in the 80:10:10 data scheme at sequence 60 with the evaluation results on the test data: R² is 0.97, MAPE is 0.80%, RMSE is 20.518, and MAE is 18.22. The addition of the Twitter sentiment feature subjectivity_rollingwindow365 did not always improve performance, especially when the main data (TB and air pollution) was already strong enough. However, in certain schemes with low initial performance, such as the 60:20:20 data split in sequence 60, the addition of sentiment features on Twitter was able to provide performance improvements with a 61.33% decrease in MAE, 60.34% decrease in RMSE, 61.22% decrease in MAPE, and a drastic increase in R² score from -0.017 to 0.8398. This shows that sentiment can serve as a useful additional signal when the information from the main data is insufficient, leading to improved performance in the previously underperforming baseline model.

Item Type: Thesis (Other)
Uncontrolled Keywords: Tuberkulosis (TB), Analisis Sentimen, Prediksi perkembangan TB, CNN-GRU, Polusi udara Copernicus, Tuberculosis (TB), Sentiment Analysis, TB outbreak prediction, CNN-GRU, Copernicus air pollution
Subjects: T Technology > T Technology (General) > T174 Technological forecasting
T Technology > T Technology (General) > T57.5 Data Processing
T Technology > T Technology (General) > T58.6 Management information systems
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 57201-(S1) Undergraduate Thesis
Depositing User: Dyah Kumalarani Mahakerty
Date Deposited: 25 Jul 2025 14:49
Last Modified: 25 Jul 2025 14:49
URI: http://repository.its.ac.id/id/eprint/121905

Actions (login required)

View Item View Item