Prediksi curah hujan melalui Model Output Statistics menggunakan Classification And Regression Trees dengan Pre-Processing Principal Component Analysis

Azmi, Ulul (2017) Prediksi curah hujan melalui Model Output Statistics menggunakan Classification And Regression Trees dengan Pre-Processing Principal Component Analysis. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 1311100702-Undergraduate-Theses.pdf]
Preview
Text
1311100702-Undergraduate-Theses.pdf - Published Version

Download (2MB) | Preview

Abstract

Kondisi cuaca di Indonesia diumumkan untuk jangka waktu sekitar 24 jam melalui prakiraan cuaca hasil analisis Badan Meteorologi, Klimatologi, dan Geofisika (BMKG). Sejak tahun 2004, BMKG telah berupaya melakukan penelitian untuk prakiraan cuaca jangka pendek dengan menggunakan data komponen cuaca Numerical Weather Prediction (NWP). Namun output NWP masih sering bias, sehingga perlu dilakukan pra-pemrosesan. Salah satunya menggunakan Model Output Statistics (MOS). MOS merupakan pemodelan observasi cuaca dengan output NWP berbasis regresi. Observasi yang digunakan sebagai variabel respon adalah curah hujan dengan 5 kategori yakni cerah berawan, hujan ringan, hujan sedang, hujan lebat, dan hujan lebat sekali. Output NWP yang digunakan ada 32 variabel. Sebelumnya setiap variabel NWP dilakukan reduksi dimensi dalam sembilan grid menggunakan Principal Component Analysis (PCA). Metode yang digunakan untuk mengklasifikasikan curah hujan adalah klasifikasi pohon. Hasil dari PCA disimpulkan bahwa sebagian besar komponen utama yang terbentuk dari setiap variabel NWP adalah sebanyak satu komponen. Secara keseluruhan, hasil ketepatan klasifikasi curah hujan terbesar menggunakan data testing terletak pada stasiun pengamatan Pondok Betung. Hasil ketepatan klasifikasi data testing sebelum proses SMOTE pada stasiun pengamatan Citeko, Kemayoran, dan Pondok Betung yakni 100%, 85,71% dan 71,43%. Setelah proses Synthetic Minority Oversampling Technique (SMOTE), ketepatan klasifikasi ketiga stasiun pengamatan cenderung turun yakni 28,57%, 85,71% dan 57,14%. Berdasarkan hasil ketepatan klasifikasi data testing untuk setiap stasiun pengamatan, maka pohon klasifikasi yang layak untuk klasifikasi curah hujan adalah model klasifikasi pohon optimal yang sebelum diproses menggunakan SMOTE.

=================================================================

A weather condition in Indonesia was announced for a period of about 24 hours using the weather forecast on the analysis of the Meteorology, Climatology and Geophysics (BMKG). Since 2004, BMKG has attempted to do research on short-term weather forecasting using weather component data Numerical Weather Prediction (NWP). But output NWP is still biased, so it is necessary to pre-processing using Model Output Statistics (MOS). MOS is modeling regression-based between weather observations and output NWP. Variable response is precipitation with 5 categories namely cloudy, light rain, moderate rain, heavy rain, and heavy rains all. There are 32 variables of output NWP. Dimension reduction performed on each variable of NWP in nine grids using Principal Component Analysis (PCA). The method used to classify the rainfall is a classification tree. The result of PCA was concluded that most of the major components formed from each variable NWP is as much as one component. Overall, the result of the classification accuracy of the heaviest rainfall using testing data is located in Pondok Betung. The results of testing the accuracy of data classification before the process SMOTE the observation station Citeko, Kemayoran, and Pondok Betung ie 100%, 85.71% and 71.43%. After the process Synthetic Minority Oversampling Technique (SMOTE), third classification accuracy of observation stations tends to fall ie 28.57%, 85.71% and 57.14%. Based on the results of testing the accuracy of data classification for each observation station, the classification tree eligible for classification of precipitation is optimal classification tree models before being processed using SMOTE.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Curah Hujan; Klasifikasi Pohon; MOS; NWP; Classification Trees; Rainfall
Subjects: H Social Sciences > HA Statistics
Q Science > QA Mathematics > QA278.2 Regression Analysis. Logistic regression
Divisions: Faculty of Mathematics and Science > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Ulul Ulul Azmi
Date Deposited: 10 Mar 2017 02:34
Last Modified: 06 Mar 2019 07:29
URI: http://repository.its.ac.id/id/eprint/3294

Actions (login required)

View Item View Item