Penerapan Metode Seasonally Decomposed Missing Value Imputation pada Pemodelan Hybrid Machine Learning untuk Peramalan Kualitas Udara di Kota Surabaya

Firdhani, Zanzabila Rehanisya (2023) Penerapan Metode Seasonally Decomposed Missing Value Imputation pada Pemodelan Hybrid Machine Learning untuk Peramalan Kualitas Udara di Kota Surabaya. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06211940000029-Undergraduate_Thesis.pdf] Text
06211940000029-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2025.

Download (15MB) | Request a copy

Abstract

Pencemaran udara merupakan salah satu permasalahan utama yang dihadapi oleh kota metropolitan, salah satunya Kota Surabaya. Kota Surabaya berada di peringkat kelima sebagai kota paling berpolusi dibandingkan dengan kota lainnya di Indonesia. Polusi udara yang terjadi secara terus menerus dapat menyebabkan gangguan kesehatan, penurunan produktivitas kerja, kerugian ekonomi suatu negara, hingga timbulnya permasalahan sosial. Kota Surabaya telah melakukan monitoring kualitas udara melalui Indeks Standar Pencemar Udara (ISPU) yang didapatkan dari alat AQMS di stasiun SUF. Tantangan utama dalam monitoring kualitas udara adalah adanya missing data akibat dari kerusakan alat pengukur indikator pencemaran udara. Pemantauan yang dilakukan hanya menampilkan kualitas udara pada saat itu dan tidak dapat memprediksi kualitas udara beberapa waktu yang akan datang. Dengan keterbatasan tersebut, untuk mengetahui kualitas udara yang akan datang diperlukan suatu peramalan. Walaupun penelitian sebelumnya terkait peramalan kualitas udara telah dilakukan, belum ditemukan studi komprehensif terkait penanganan missing value pada masing-masing variabel yang memiliki karakteristik berbeda-beda dan memiliki pola musiman ganda. Dalam penanganan imputasi data time series, diperlukan algoritma imputasi yang secara khusus disesuaikan dengan karakteristik data time series. Untuk melengkapi penelitian sebelumnya, penanganan missing value dengan menggunakan metode seasonally decomposed missing value imputation dipertimbangkan untuk meningkatkan akurasi peramalan. Metode peramalan dan variabel yang digunakan dalam penelitian ini mengacu pada penelitian sebelumnya yaitu time series regression, SARIMA, FFNN, LSTM, hybrid TSR-FFNN serta hybrid TSR-LSTM. Variabel yang digunakan yaitu lima parameter kualitas udara ISPU yang terdiri dari CO, NO2, O3, PM10 dan SO2 di stasiun SUF 1 Kota Surabaya. Hasil perbandingan RMSE pada seluruh pemodelan yang telah dilakukan dengan data imputasi dekomposisi musiman dan data imputasi tanpa dekomposisi musiman menunjukkan bahwa metode imputasi dekomposisi musiman tidak selalu memberikan hasil yang terbaik pada seluruh variabel di seluruh metode peramalan yang dicobakan. Namun, sebagian besar metode pada tiap variabel mengalami penurunan RMSE jika menggunakan data imputasi dekomposisi musiman. Secara keseluruhan, berdasarkan metode terbaik yang digunakan untuk meramalkan kelima variabel, data dengan imputasi dekomposisi musiman menghasilkan akurasi yang lebih baik ditinjau dari penurunan RMSE hasil peramalan jika dibandingkan dengan data dengan imputasi tanpa dekomposisi musiman.
================================================================================================================================
Air pollution is one of the main problems faced by metropolitan cities, one of which is Surabaya. Surabaya is ranked fifth as the most polluted city compared to other cities in Indonesia. Air pollution that occurs continuously can cause health problems, decreased work productivity, economic losses for a country, and social problems. Surabaya has been monitoring air quality through the Air Pollutant Standard Index (ISPU) obtained from the AQMS tool at the SUF station. The main challenge in monitoring air quality is missing data resulting from damage to air pollution indicator gauges. Monitoring carried out only displays air quality at that time and cannot predict air quality for some time to come. With these limitations, to determine the future air quality and determine the pollution-prone time in Surabaya, a forecast is needed. Although previous research related to air quality forecasting has been carried out, a comprehensive study has not been found regarding the handling of missing values for each variable which has different characteristics and a double seasonal pattern. In handling time series data imputation, an imputation algorithm is needed that is specifically adapted to the characteristics of time series data. To complement previous research, handling missing values using the seasonally decomposed missing value imputation method is considered to improve forecasting accuracy. The forecasting method and variables used in this study refer to previous studies, namely time series regression, SARIMA, FFNN, LSTM, TSR-FFNN hybrid, and TSR-LSTM hybrid. The variables used are five ISPU air quality parameters consisting of CO, NO2, O3, PM10, and SO2 at SUF 1 station in Surabaya. The RMSE comparison results for all modeling that has been done with data imputed with seasonal decomposition and imputed data without seasonal decomposition show that the imputed method does not always give the best results for all variables in all forecasting methods tried. However, most of the methods for each variable experience a decrease in RMSE when using seasonal decomposition-imputed data. Overall, based on the best method used to predict the fifth variable, data with seasonal decomposition imputation produces better accuracy in terms of the decrease in RMSE forecasting results when compared to data with imputation without seasonal decomposition.

Item Type: Thesis (Other)
Uncontrolled Keywords: Air Pollution, FFNN, Hybrid, LSTM, Missing Value, Time Series Imputation, Time Series Regression, Pencemaran Udara, SARIMA, Time Series Imputation
Subjects: H Social Sciences > HA Statistics
Q Science > Q Science (General) > Q325.5 Machine learning.
Q Science > QA Mathematics > QA280 Box-Jenkins forecasting
T Technology > TD Environmental technology. Sanitary engineering > TD883.5 Air--Pollution
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Zanzabila Rehanisya Firdhani
Date Deposited: 21 Feb 2023 07:14
Last Modified: 21 Feb 2023 07:17
URI: http://repository.its.ac.id/id/eprint/97655

Actions (login required)

View Item View Item