Salsabiila, Nur Jihan (2025) Analisis Prediktif Dengue Berbasis Media Sosial Menggunakan Pendekatan Klasifikasi CNN-BiGRU-Attention dan Peramalan TiDE-PSO. Masters thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
6026231028-Master Thesis.pdf - Accepted Version Restricted to Repository staff only Download (12MB) | Request a copy |
Abstract
Kota Bandung menjadi daerah dengan jumlah kasus Demam Berdarah Dengue (DBD) tertinggi. Salah satu hambatan dalam penanggulangan penyakit ini adalah keterlambatan pelaporan kasus DBD ke Kementerian Kesehatan (Kemenkes) serta adanya perbedaan antara data yang dilaporkan dengan kondisi sebenarnya di lapangan. Hal ini menyebabkan keterlambatan dalam pencegahan dan penanggulangan, yang menyebabkan peningkatan kasus DBD dan bahkan kematian. Penggunaan media sosial menjadi salah satu alternatif untuk mendeteksi dini adanya penyebaran penyakit. Penelitian ini mengusulkan peramalan kasus DBD dengan melibatkan data media sosial yang diklasifikasi terlebih dahulu menjadi tiga kategori, terjangkit, informatif, dan lainnya. Data akan diklasifikasi multi-label menggunakan metode hibrida Convolutional Neural Network-Bidirectional Gated Recurrent Unit-Attention (CNN-BiGRU-Attention) berdasarkan IndoBERT. Data yang terklasifikasi sebagai 'terjangkit' akan dijadikan sebagai data pendukung untuk peramalan jumlah kasus DBD metode hibrida Time Series Dense Encoder-Particle Swarm Optimization (TiDE-PSO). Data yang digunakan mencakup data jumlah kasus DBD Kota Bandung, data media sosial, suhu, curah hujan, kelembapan, serta kecepatan angin dari Januari 2014 hingga Juni 2024 dengan frekuensi mingguan. Penelitian ini melibatkan 110 eksperimen yang dilakukan dalam 7 skenario berbeda, berdasarkan aturan penyusunan model klasifikasi yang diterapkan. Sementara itu, untuk peramalan, digunakan 8 model dengan 8 skenario berbeda, yang dirancang berdasarkan variasi variabel yang digunakan. Model IndoBERT yang dikombinasikan dengan model hibrida CNN dengan arsitektur multi-channel yang diintegrasikan dengan layer BiGRU dan mekanisme Attention terbukti lebih unggul dalam tugas klasifikasi multi-label dibandingkan dengan model pembanding, termasuk model CNN tunggal dan BiGRU tunggal. Model ini menunjukkan keunggulan yang signifikan dalam metrik recall dan F1-score. Sementara itu, untuk peramalan, model TiDE-PSO yang melibatkan variabel suhu, kelembapan, curah hujan, kecepatan angin, serta total media sosial yang dikategorikan terjangkit dan informatif, menjadi model terbaik untuk horizon peramalan sepanjang 24 minggu. Model TiDE-PSO menunjukkan peningkatan performa yang lebih baik seiring dengan bertambahnya panjang horizon peramalan.
======================================================================================================================================
The city of Bandung has the highest number of dengue fever cases. One of the obstacles in combating this disease is the delay in reporting dengue fever cases to the Ministry of Health and the discrepancy between the reported data and the actual conditions in the field. This causes delays in prevention and control, leading to an increase in dengue fever cases and even deaths. The use of social media has emerged as an alternative method for early detection of disease outbreaks. This study proposes a DBD case forecasting model that incorporates social media data, which is first classified into three categories: infected, informational, and others. The data will be classified using a multi-label approach with a hybrid Convolutional Neural Network-Bidirectional Gated Recurrent Unit-Attention (CNN-BiGRU-Attention) method based on IndoBERT. Data classified as ‘infected’ will be used as supporting data for predicting the number of dengue fever cases using the hybrid Time Series Dense Encoder-Particle Swarm Optimization (TiDE-PSO) method. The data used includes dengue fever case data from the city of Bandung, social media data, temperature, rainfall, humidity, and wind speed from January 2014 to June 2024 with weekly frequency. This study involves 110 experiments conducted in 7 different scenarios, based on the rules for model classification implementation. Meanwhile, for forecasting, 8 models with 8 different scenarios were used, designed based on variations in the variables employed. The IndoBERT model combined with a hybrid CNN model featuring a multi-channel architecture integrated with BiGRU layers and Attention mechanisms proved superior in multi-label classification tasks compared to comparison models, including single CNN and single BiGRU models. This model demonstrated significant advantages in recall and F1-score metrics. Meanwhile, for forecasting, the TiDE-PSO model, which involves variables such as temperature, humidity, rainfall, wind speed, and total social media categorized as infected and informative, emerged as the best model for a 24-week forecasting horizon. The TiDE-PSO model shows improved performance as the length of the forecasting horizon increases.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | CNN-BiGRU-Attention, Deep Learning, Klasifikasi Multi-label, Media Sosial, TiDE-PSO ======================================================= CNN-BiGRU-Attention, Deep Learning, Multi-label Classification, Social Media, TiDE-PSO |
Subjects: | H Social Sciences > H Social Sciences (General) > H61.4 Forecasting in the social sciences H Social Sciences > HA Statistics > HA30.3 Time-series analysis Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science) R Medicine > R Medicine (General) > R858 Deep Learning |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 59101-(S2) Master Thesis |
Depositing User: | Nur Jihan Salsabiila |
Date Deposited: | 22 Jul 2025 02:00 |
Last Modified: | 22 Jul 2025 02:02 |
URI: | http://repository.its.ac.id/id/eprint/120404 |
Actions (login required)
![]() |
View Item |