Saputri, Prilyandari Dina (2022) Multiperiod Generalized Extreme Value Regression untuk Analisis Survival dengan Pendekatan Metode Klasifikasi (Studi Simulasi dan Aplikasi pada Prediksi Financial Distress Perusahaan Sektor Industri). Masters thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
6003201004-Master_Thesis.pdf - Accepted Version Download (7MB) | Preview |
Abstract
Data yang diamati dalam beberapa periode untuk setiap unit analisis akan memiliki struktur data panel dengan kovariat yang dinamis. Multiperiod Generalized Extreme Value Regression merupakan salah satu metode analisis survival yang dapat digunakan untuk struktur data tersebut. Penggunaan extreme value dapat mengatasi permasalahan imbalanced data yang juga seringkali muncul dalam proses klasifikasi. Penelitian ini bertujuan untuk melakukan kajian teoritis estimasi parameter model multiperiod GEVR, mengidentifikasi performa multiperiod GEVR dalam mengatasi imbalanced data untuk data simulasi, serta mengaplikasikan metode multiperiod GEVR pada data financial distress perusahaan sektor industri. Perusahaan dikategorikan mengalami financial distress apabila memiliki Interest Coverage Ratio (ICR) kurang dari satu dan/atau memiliki nilai Return on Assets negatif menggunakan beberapa skema. Variabel prediktor yang digunakan adalah rasio keuangan perusahaan yakni rasio aktivitas, profitabilitas, solvabilitas, dan likuiditas. Estimasi parameter model multiperiod GEVR dilakukan menggunakan Maximum Likelihood Estimation, yakni berdasarkan fungsi likelihood model GEVR, yang dilanjutkan dengan iterasi numerik fisher scoring. Pada studi simulasi dibangkitkan skenario dengan persentase event, banyaknya unit analisis, serta jenis distribusi survival time yang berbeda. Hasil studi simulasi menunjukkan bahwa metode multiperiod GEVR dapat menangkap karakteristik dari rare events pada permasalahan imbalanced data. Semakin kecil persentase event yang digunakan, performa metode multiperiod GEVR semakin lebih baik dibandingkan multiperiod logit. Pada prediksi financial distress perusahaan sektor industri, model multiperiod GEVR memiliki performa yang lebih baik dibandingkan model multiperiod logit. Secara umum, penambahan variabel makroekonomi dan penggunaan seleksi variabel dapat meningkatkan nilai C-index. Model terbaik diperoleh dari definisi financial distress skema 4 (ketika ICR<1 dan ROA<0 pada tiga periode berturut-turut) dengan seleksi variabel forward. Variabel yang berpengaruh signifikan terhadap financial distress pada model terbaik adalah EBITA, DAR, dan CR, dengan C-index data testing sebesar 89,11% yang menandakan kemampuan prediksi yang baik.
==================================================================================================
The data observed in several periods for each individual will result in a panel data structure with dynamic covariates. Multiperiod Generalized Extreme Value Regression is a survival analysis used for the panel data structure. The application of extreme values theory can overcome imbalanced data problems that frequently arise in the classification process. This study aims to perform a theoretical study of parameter estimation of the multiperiod GEVR model, identify the performance of the multiperiod GEVR in overcoming the imbalanced data for the simulation study, and employ the multiperiod GEVR to the financial distress prediction. A firm is categorized as experiencing financial distress if it has an Interest Coverage Ratio (ICR) of less than one and/or has a negative Return on Assets using several schemes. The predictor variables used are the financial ratios, i.e. the ratio of activity, profitability, solvency, and liquidity. The parameter estimation of the multiperiod GEVR model was carried out using Maximum Likelihood Estimation. In the first derivative, the results yield the not closed-form solution. Therefore, the estimation process is continued using fisher scoring iterations. In the simulation study, scenarios are generated with the various percentage of events, the various number of firms, and different types of survival time distributions. The results of the simulation study indicate that the multiperiod GEVR method can capture the characteristics of rare events in imbalanced data problems. The less the percentage of events used, the performance of the multiperiod GEVR is better than the multiperiod logit. In the financial distress prediction, the multiperiod GEVR has better performance than the multiperiod logit. In general, the involvement of macroeconomic variables and the use of variable selection can increase the C-index value. The best model is obtained from the definition of financial distress scheme 4 (when ICR<1 and ROA<0 in the three consecutive periods) using forward variable selection. The variables that have a significant effect on financial distress in the best model are EBITA, DAR, and CR, with C-index of testing data about 89.11% which implies a good predictive ability.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | Analisis Survival, GEVR, Multiperiod, Regresi Logistik, Logistic Regression, Survival Analysis |
Subjects: | H Social Sciences > HA Statistics > HA29 Theory and method of social science statistics |
Divisions: | Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49101-(S2) Master Thesis |
Depositing User: | Prilyandari Dina Saputri |
Date Deposited: | 18 Feb 2022 08:48 |
Last Modified: | 19 Aug 2024 07:29 |
URI: | http://repository.its.ac.id/id/eprint/94593 |
Actions (login required)
View Item |