Khotimah, Chusnul (2018) Additive Survival Least Square SVm untuk Analsisis Data SUrvival (Studi Simulasi dan Studi Kasus pada Data Pasien Kanker Serviks di RSUD dr. Soetomo Surabaya). Masters thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
1315201213-Master_Thesis.pdf - Accepted Version Download (5MB) | Preview |
Abstract
Analisis survival adalah metode yang digunakan untuk menganalisis waktu suatu subjek mulai dari awal pengamatan sampai terjadinya kejadian. Awalnya, model survival menggunakan pendekatan parametrik. Selanjutnya Cox mengusulkan modelnya yaitu proporsional hazard yang bersifat semiparametrik. Kelebihan dari Cox PHM adalah penggunaan fungsi Likelihood parsial yang terbukti sesuai dengan fungsi Likelihood. Kelemahan dari Cox PHM adalah adanya asumsi proporsional dan asumsi linearitas dalam kovariat. Pada penelitian ini akan digunakan analisis survival dengan pendekatan nonparametrik yaitu Additive Survival Least Square SVM (A-SURLSSVM) yang dibandingkan dengan Cox PHM. Data yang digunakan merupakan data simulasi dan data riil. Data simulasi dibangkitkan dengan berbagai skenario meliputi jumlah data, persentase sensoring, serta banyaknya variabel prediktor yang berbeda-beda baik untuk data dengan pola linier maupun nonlinier. Data riil yang digunakan merupakan data pasien kanker serviks di rumah sakit dr. Soetomo Surabaya. Kriteria kebaikan model yang digunakan dalam penelitian ini adalah Concordance indeks (C-index), Logrank dan hazard ratio. Semakin bagus suatu model jika nilai kriteria kebaikan model semakin tinggi. Pada penelitian ini didapatkan hasil bahwa performansi A-SURLSSVM lebih baik dari pada Cox PHM berdasarkan C-index dan Hazard Ratio baik pada data riil maupun simulasi. Selanjutnya, dilakukan features selection untuk mengetahui prediktor yang relevan mempengaruhi survival time. Dengan features selection pada data riil, dua dari dua belas variabel yang digunakan dikeluarkan dari dari model yaitu Komplikasi dan Riwayat KB sehingga dapat meningkatkan nilai C-index. Pada berbagai setting pada data simulasi performansi dari A-SURLSSVM selalu lebih baik dari Cox PHM. Pada data dengan pola nonlinier selisih performansi C-index antara A-SURLSSVM dan Cox PHM lebih besar dibandingkan pada data linier. Sehingga metode A-SURLSSVM cocok digunakan pada data nonlinier. Selain itu, C-index merupakan ukuran performansi yang paling bagus dibandingkan hazard ratio dan Logrank. Hasil features selection pada data simulasi sebanyak 100 replikasi menunjukkan bahwa interaksi antar variabel menghasilkan variabel main counfounder dan sub-main counfounder.
====================================================================================================================
Survival analysis is a method used to analyze the time of a subject from the beginning of observation until the occurrence of events. Initially, the survival model used a parametric approach. Furthermore, Cox proposed a model so Called Cox Proportional Hazard model (Cox-PHM) as a semiparametric approach. The parameter estimation in Cox PHM used partial Likelihood function proven in accordance with the Likelihood function. The weakness of the Cox PHM is the presence of proportional assumptions and linearity assumptions within the covariates. This research use survival analysis with nonparametric approach, that is Additive Survival Least Square SVM (A-SURLSSVM) and Cox PHM as a benchmark. The data used in this study are simulation and real datasets. The simulation datasets are generated with various scenarios including the sample sizes, the percentage of sensoring, and the number of features for both linear and nonlinear data. The real dataset used is the cervical cancer patients in dr. Soetomo Surabaya. Performance measures use in this research are Concordance index (C-index), Logrank and hazard ratio. The better model if it produces higher performance measures. It is found that the performance of A-SURLSSVM is better than Cox PHM based on C-index and Hazard Ratio both on real and simulated datasets. Furthermore, feature selection is performed to determine which relevant predictors influence survival time. Using for the features selection of real datasets, two out of twelve variables are removed from the model, i.e Complications and Family History. At various settings in simulation data, the A-SURLSSVM is always better than Cox PHM. In the data with nonlinear pattern, the difference of C-index between A-SURLSSVM and Cox PHM is greater than in linear data. So the A-SURLSSVM method performs much better for nonlinear data. In addition, the C-index is the best performance measure compared to hazard ratio and logrank. The results of the features selection in the simulation data of with 100 replication show that the interaction between variables yields the main counfounder and the sub-main counfounder variables.
Item Type: | Thesis (Masters) |
---|---|
Additional Information: | RTSt 511.42 Kho a-1 3100018074689 |
Uncontrolled Keywords: | A-SURLSSVM, C-indeks, Features Selection, Hazard Ratio, Kanker Serviks, Logrank, Prognostik Indeks, Studi Simulasi. |
Subjects: | Q Science > QA Mathematics > QA278.2 Regression Analysis. Logistic regression R Medicine > RZ Other systems of medicine |
Divisions: | Faculty of Mathematics and Science > Statistics > 49101-(S2) Master Thesis |
Depositing User: | Chusnul Khotimah |
Date Deposited: | 09 Apr 2018 02:55 |
Last Modified: | 16 Sep 2020 07:02 |
URI: | http://repository.its.ac.id/id/eprint/50616 |
Actions (login required)
View Item |