Peramalan Wabah Demam Berdarah Dengue di Kota Malang dengan Variabel Media Sosial menggunakan Random Forest Regression

Yakan, Zaidan Fathi (2023) Peramalan Wabah Demam Berdarah Dengue di Kota Malang dengan Variabel Media Sosial menggunakan Random Forest Regression. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05211940000092-Undergraduate_Thesis.pdf] Text
05211940000092-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2025.

Download (3MB) | Request a copy

Abstract

Demam Berdarah Dengue (DBD) merupakan penyakit yang ditularkan oleh nyamuk yang terjadi di daerah tropis dan subtropis di dunia. Wabah demam berdarah dengue telah meningkat secara drastis dalam beberapa dekade terakhir dalam skala global. Meskipun tingkat fatalitas kasus demam berdarah kecil, penyakit ini dapat berkembang menjadi komplikasi parah Prevalensi demam berdarah secara geografis tersebar di negara-negara yang terletak di daerah tropis dan subtropis. Namun, tidak ada obat yang masih tersedia untuk menyembuhkan demam berdarah, pengobatan hanya mencakup obat-obatan untuk gejala klinis. Studi yang dilakukan di masa lalu terkait peramalan wabah demam berdarah hanya mencakup beberapa faktor, seperti faktor kelembaban, suhu, curah hujan, dan kecepatan angin. Namun, dua tahun terakhir ini masyarakat Indonesia terkena wabah COVID-19 mengakibatkan para penderita demam berdarah tidak lagi mengunjungi puskesmas untuk melaporkannya. Oleh karena itu, dibutuhkan faktor lain seperti faktor sosial media untuk membantu peramalan kasus demam berdarah pada situasi saat ini. Penelitian ini bertujuan untuk membangun peramalan wabah demam berdarah dengue di kota Malang dengan menambahkan faktor sosial media menggunakan metode Random Forest Regression. Penelitian ini menggunakan data historis jumlah kasus demam berdarah dengue di kota Malang pada tiga tahun terakhir dan data terbaru pada sosial media Instagram. Data akan diolah agar dapat dilakukan peramalan dengan model Random Forest Regression. Penelitian ini menggunakan model Random Forest Regression untuk memprediksi satu titik di masa depan berdasarkan data historis. Untuk mengetahui keakuratan model dari Random Forest Regression, dilakukan evaluasi hasil peramalan dengan menghitung Symmetric Mean Absolute Percentage Error (SMAPE), Root Mean Square Error (RMSE) dan R-Squared. Hasil SMAPE, RMSE, dan R-Squared akan diinterpretasikan untuk dapat mengetahui akurasi peramalan, apakah akurasi peramalan termasuk sangat baik, baik, cukup, atau tidak baik. Hasil yang diharapkan dari penelitian ini adalah hasil peramalan wabah demam berdarah dengue di masa depan. Hasil forecasting diharapkan dapat memberikan sistem pendukung keputusan untuk mencegah wabah demam berdarah di masa depan dan membantu dinas kesehatan kota Malang dalam mempersiapkan anggaran tahunan untuk kasus demam berdarah dengue. Hasil pengujian menggunakan RFR dengan dataset gabungan dari data historis dan data crawling kasus demam berdarah Januari – Juni 2023 menghasilkan nilai SMAPE 31.53261764618814, lebih baik dari dataset historis. Selain itu, dihasilkan peramalan untuk tiga tahun ke depan dimulai dari Juli 2023 – Juni 2026. Hasil peramalan untuk Juli 2025 – Juni 2026 menghasilkan nilai RMSE 7.5282033815410525 dan nilai R-Squared 0.46801377471672967 yang artinya model mampu menjelaskan sekitar 46% variasi dalam data peramalan dan kesalahan rata-rata antara nilai peramalan dan nilai sebenarnya adalah 7.52. Berdasarkan perbandingan hasil peramalan dari data historis dan data crawling Instagram, terlihat hasil peramalan tidak jauh berbeda. Maka dari itu, media sosial dapat menjadi salah satu faktor tambahan yang dapat dipertimbangkan dalam melakukan peramalan demam berdarah. Berdasarkan pengujian pembangunan model yang telah dilakukan, didapatkan model Random Forest Regression dengan dataset kasus demam berdarah Januari – Juni 2023 merupakan peramalan yang paling akurat berdasarkan hasil evaluasi yang dilakukan. Hal ini dikarenakan dataset ini memiliki kuantitas yang paling banyak dibandingkan dua dataset lainnya.
=================================================================================================================================
Dengue Hemorrhagic Fever (DHF) is a mosquito-borne disease that occurs in tropical and subtropical regions of the world. Outbreaks of dengue hemorrhagic fever have increased drastically in recent decades on a global scale. Although the case fatality rate for dengue fever is low, the disease can develop into severe complications. The prevalence of dengue fever is geographically distributed in countries located in tropical and subtropical regions. However, there is no drug available to cure dengue fever, treatment only includes drugs for clinical symptoms. Studies conducted in the past related to forecasting dengue fever outbreaks only covered a few factors, such as humidity, temperature, rainfall, and wind speed. However, in the last two years, the Indonesian people have been affected by the COVID-19 outbreak, which has resulted in dengue fever sufferers no longer visiting the puskesmas to report it. Therefore, other factors such as social media are needed to help forecast dengue fever cases in the current situation. This study aims to build a forecast for dengue hemorrhagic fever outbreaks in Malang city by adding social media factors using the Random Forest Regression method. This study uses historical data on the number of cases of dengue hemorrhagic fever in the city of Malang in the last three years and the latest data on social media Instagram. The data will be processed so that forecasting can be done using the Random Forest Regression model. This study uses the Random Forest Regression model to predict one point in the future based on historical data. To determine the accuracy of the Random Forest Regression model, an evaluation of the forecasting results is carried out by calculating the Symmetric Mean Absolute Percentage Error (SMAPE), Root Mean Square Error (RMSE) and R-Squared. SMAPE, RMSE, and R-Squared results will be interpreted to determine forecasting accuracy, whether forecasting accuracy is very good, good, sufficient, or not good. The expected results of this study are the results of forecasting dengue hemorrhagic fever outbreaks in the future. The forecasting results are expected to provide a decision support system to prevent future dengue fever outbreaks and assist the Malang city health office in preparing an annual budget for dengue hemorrhagic fever cases. The results of the test using the RFR with a combined dataset from historical data and crawling data on dengue cases from January to June 2023 resulted in an SMAPE value of 31.53261764618814, which is better than the historical dataset. In addition, forecasts are generated for the next three years starting from July 2023 – June 2026. Forecasting results for July 2025 – June 2026 produce an RMSE value of 7.5282033815410525 and an R-Squared value of 0.46801377471672967, which means that the model is able to explain around 46% of the variation in forecasting data and errors. the average between the forecast value and the actual value is 7.52. Based on a comparison of forecasting results from historical data and Instagram crawling data, it can be seen that the forecasting results are not much different. Therefore, social media can be an additional factor that can be considered in forecasting dengue fever. Based on the model development tests that have been carried out, it is obtained that the Random Forest Regression model with a dataset of dengue fever cases from January to June 2023 is the most accurate forecast based on the evaluation results carried out. This is because this dataset has the most quantity compared to the other two datasets.

Item Type: Thesis (Other)
Uncontrolled Keywords: dengue outbreak, forecasting, random forest regression, social media, peramalan, media sosial, wabah demam berdarah dengue.
Subjects: T Technology > T Technology (General)
T Technology > T Technology (General) > T174 Technological forecasting
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 57201-(S1) Undergraduate Thesis
Depositing User: Zaidan Fathi Yakan
Date Deposited: 11 Dec 2023 02:23
Last Modified: 11 Dec 2023 02:23
URI: http://repository.its.ac.id/id/eprint/102818

Actions (login required)

View Item View Item