Prediksi Intensitas Hujan Kota Surabaya dengan MatLab menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya)

Dhawangkhara, Maulana (2017) Prediksi Intensitas Hujan Kota Surabaya dengan MatLab menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya). Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5213100074-Undergraduate_Theses.pdf]
Preview
Text
5213100074-Undergraduate_Theses.pdf - Published Version

Download (3MB) | Preview

Abstract

Keakuratan prediksi potensi curah hujan di Kota Surabaya dibutuhkan untuk antisipasi bencana akibat hujan seperti banjir bandang, membantu memprediksi kondisi penerbangan dan membantu majaemen saluran sanitasi di Surabaya. Prediksi dilakukan dengan data hari sebelumnya menggunakan perbandingan teknik Classification and Regression Trees (CART) dan Random Forest (RF) pada data cuaca selama 17 tahun (2000-2016) berasal dari stasiun cuaca Juanda, Surabaya melalui website NCDC (National Climate Data Center) yang terdiri dari data suhu udara, titik embun, keepatan angin, tekanan udara, visibilitas dan curah hujan.
Pencarian model dengan kedua metode di atas dilakukan dengan mencari model yang paling optimal untuk masing-masing metode dengan melakukan pemilihan variabel yang berpengaruh, penyetelan (tuning) parameter metode lalu pengujian dengan proporsi data training dan testing. Perbandingan hasil performa kedua model juga ditinjau untuk mendapatkan model prediktif terbaik. Metode CART dan Random Forest tersebut kemudian diimplementasikan dengan perangkat lunak yang dibangun dengan matlab.
Penggunaan parameter default sesuai Breimann menunjukkan metode Random forest memiliki nilai performa sedikit lebih baik dibandingkan dengan CART sebesar 6%. Eksperimen tuning parameter untuk kedua metode membuktikan performa yang lebih baik dibandingkan parameter default metode, dengan akurasi baik sebesar 78% untuk 4 dari 5 kelas intensitas hujan, dengan kelas terakhir belum mampu diklasifikasi oleh kedua metode dan mampu memberikan kestabilan hasil performa dari segi uji coba proporsi data training dan testing. Variabel yang berpengaruh besar dalam model CART dan random forest dengan nilai uji performa yang baik antara lain adalah suhu udara, titik embun, suhu udara maksimum dan suhu udara minimum beserta variabel turunannya (selisih suhu udara maksimum dan minimum, selisih suhu udara dan titik embun dan kelembapan relatif).
Tugas akhir ini menghasilkan aplikasi prediksi intensitas hujan yang memiliki kemampuan prediktif yang mampu memberikan akurasi tinggi atas hasil prediksi intesitas hujan (tidak hujan, ringan, sedang, deras, sangat deras).

============================================================================

Accuracy of the rainfall prediction in Surabaya most likely needed for anticipating disasters due to rain such as flash floods, predicting the flight conditions and managing sanitation channel in Surabaya. Prediction is done using data of the previous day using Classification and Regression Trees (CART) and Random Forest (RF) method and 17 year weather data (2000-2016) collected from weather stations Juanda, Surabaya through NCDC (National Climatic Data Center). The data consists of air temperature, dew point, wind speed, air pressure, visibility and precipitation.
Model with both the above method is done by searching the most optimal model for each method by adjusting (tuning) the parameters. Comparison of the performance results of both models are also analyzed to get the best classification model.
Construction of classification model with accuracy, precision and recall as measurements showed that both CART and Random Forest method are capable of classifying 4 classes (0,1,2,3) out of 5 classes (0,1,2,3,4) with accuracy of 78%, with the class 4 has not been able to be classified by both methods. Random forest model has slightly better performance than CART at 6%.
Experiments by tuning parameters for both methods prove a better performance than the default parameters and capable of providing stability performance results in terms of the proportion of data training and data testing. Variables that have great influence in the CART and random forest model are air temperature, dew point, maximum air temperature and minimum air temperature along with 4 variable derivatives (the difference between air temperature maximum and minimum, the difference between the air temperature and the dew point and relative humidity).
This final project sought to develop a Matlab-based application that generates predictions of rainfall intensity that is able to provide high accuracy on the rain intensity (no rain, light, medium, heavy, very heavy).

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: CART, Random Forest, RF, Matlab, Klasifikasi, Curah Hujan, Intensitas Hujan, CART, Random Forest, RF, Matlab, classification,Rainfall, Rainfall Intensity
Subjects: Q Science > QA Mathematics
Q Science > QA Mathematics > QA75 Electronic computers. Computer science. EDP
Q Science > QA Mathematics > QA76 Computer software
Divisions: Faculty of Information Technology > Information System > 57201-(S1) Undergraduate Thesis
Depositing User: MAULANA DHAWANGKHARA -
Date Deposited: 27 Feb 2017 03:45
Last Modified: 05 Mar 2019 03:09
URI: http://repository.its.ac.id/id/eprint/1657

Actions (login required)

View Item View Item