Prediksi Flight Delay Menggunakan Algoritma Random Forest Untuk Mitigasi Kehilangan Pendapatan Komersial Bandara

Sugara, Rae Arun (2023) Prediksi Flight Delay Menggunakan Algoritma Random Forest Untuk Mitigasi Kehilangan Pendapatan Komersial Bandara. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6032202027-Master_Thesis.pdf] Text
6032202027-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2025.

Download (14MB) | Request a copy

Abstract

Penerbangan delay dapat mempengaruhi pendapatan komersial bandara. Jika penerbangan delay dapat diprediksi, maka pengaturan arus penumpang sejak proses check-in sampai berada di ruang tunggu keberangkatan dapat dilakukan. Upaya pengaturan arus penumpang tersebut dapat menjadi mitigasi kehilangan pendapatan akibat penerbangan delay. Tujuan penelitian ini adalah memprediksi status penerbangan (delay atau no delay) melalui pembelajaran mesin, menggunakan algoritma pengklasifikasi Random Forest (RF). Kinerja algoritma pengklasifikasi RF akan dibandingkan dengan kinerja algoritma pengklasifikasi Gradient Boosted Tree (GBT), dan Logistic Regression (LR). Data operasional penerbangan dan data cuaca di Bandara Pattimura tahun 2017-2021 digunakan sebanyak 32.668 data, dengan 23 fitur. Analisis deskriptif distribusi data dilakukan di awal pengolahan data, untuk memperoleh informasi mengenai kondisi penerbangan di Bandara Pattimura. Selanjutnya pada tahap penanganan incomplete data, dilakukan analisis distribusi data untuk diterapkan teknik imputasi “modus” dan “rata-rata”. Pengujian data outlier dilakukan pada variabel dependen yaitu status penerbangan, dengan melihat p-value yang dihasilkan dari uji Grubbs. Fitur yang digunakan pada pemodelan dipilih berdasarkan p-value setiap pasangan fitur, yang diperoleh dari uji korelasi Pearson dan Spearman. Hasil uji korelasi menghasilkan 19 fitur untuk digunakan dalam tahap pemodelan. Skenario uji coba awal dilakukan tanpa, dan dengan melakukan penyetelan hyper-parameter, yaitu: n_estimators, max_tree_depth, dan min_samples_split pada algoritma RF. Penyetelan hyper-parameter, yaitu: n_estimators, max_tree_depth, dan learning_rate, juga dilakukan pada algoritma GBT. Sedangkan pada algoritma LR, pemodelan dibangun dengan menggunakan built-in default parameter. Disamping itu, diterapkan variasi data latih menggunakan rasio 60%-90%. Kinerja algoritma pengklasifikasi diukur berdasarkan nilai AUC yang dihasilkan model. Nilai AUC model awal menunjukkan algoritma GBT menjadi algoritma terbaik, dibandingkan dengan algoritma RF dan LR. Pemodelan lanjutan yang dibangun berdasarkan bandara destinasi, secara keseluruhan model, menghasilkan nilai AUC yang lebih baik dibandingkan dengan skenario pemodelan awal. Model prediksi dapat digunakan manajemen perusahaan, untuk memperoleh hasil prediksi status sebuah nomor penerbangan. Hasil prediksi dapat digunakan untuk melakukan pengaturan penumpang pada area komersial secara tepat, berdasarkan profil penumpang terhadap jenis maskapai penerbangan yang digunakan.
==============================================================================================================================
Flight delay can affect the airport's commercial revenue. If flight delay can be predicted, then passenger flow arrangements can be made from the check-in process to the departure lounge. Efforts to regulate passenger flow can be a mitigation of lost revenue due to flight delay. The purpose of this study, is to predict flight status (delay or no delay) through machine learning using the Random Forest (RF) classifier algorithm. The performance of the RF classifier algorithm will be compared with the performance of the Gradient Boosted Tree (GBT), and Logistic Regression (LR) classifier algorithms. Flight operational data and weather data at Pattimura Airport in 2017-2021 which used a total of 32,668 data, with 23 features. Descriptive analysis of data distribution was carried out at the beginning of data processing, to obtain information about flight conditions at Pattimura Airport. Furthermore, at the incomplete data handling stage, data distribution analysis is carried out to apply the "mode" and "average" imputation techniques. Outlier data test was carried out on the dependent variable, namely flight status, by looking at the p-value generated from the Grubbs test. The features used in modeling are selected based on the p-value of each feature pair, which is obtained from the Pearson and Spearman correlation test. Correlation test results produce 19 features to be used in the modeling stage. The initial test scenario was carried out without, and by setting up hyper-parameters, namely: n_estimators, max_tree_depth, and min_samples_split on the RF algorithm. Hyper-parameter settings, namely: n_estimators, max_tree_depth, and learning_rate, are also performed on the GBT algorithm. Whereas in the LR algorithm, modeling is built using default parameters. In addition, variations of training data are applied using ratios of 60%-90%. The performance of the classifier algorithms is measured based on the AUC value resulted by the model. The AUC values of the initial model show that the GBT algorithm is the best algorithm, compared to the RF and LR algorithms. The continuation modeling which is built based on the destination airport, as a whole model, produce better AUC values than the initial modeling scenario. The prediction model can be used by company management, to obtain predictive results for the status of a flight number. The prediction result can be used to make appropriate passenger arrangements in commercial areas, based on the passenger profile of the type of airline used.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Prediksi flight delay, random forest, logistic regression, gradient boosted tree, pemilihan fitur, penyetelan hyper-parameter, evaluasi model
Subjects: T Technology > T Technology (General) > T174 Technological forecasting
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Interdisciplinary School of Management and Technology (SIMT) > 61101-Master of Technology Management (MMT)
Depositing User: Rae Arun Sugara
Date Deposited: 06 Feb 2023 07:57
Last Modified: 06 Feb 2023 07:57
URI: http://repository.its.ac.id/id/eprint/96321

Actions (login required)

View Item View Item