Analisis Data Survival dengan Survival Least Square-SVM (Studi Simulasi dan Studi Kasus Pasien Kanker Serviks)

Khoiri, Halwa Annisa (2018) Analisis Data Survival dengan Survival Least Square-SVM (Studi Simulasi dan Studi Kasus Pasien Kanker Serviks). Masters thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
06211550010201-Master_Thesis.pdf - Published Version
Restricted to Repository staff only

Download (4MB) | Request a copy

Abstract

Dalam analisis data survival terdapat tiga pendekatan yang dapat digunakan, yaitu pendekatan parametrik, semi-parametrik, dan non-parametrik. Pendekatan parametrik memiliki kelemahan karena harus diketahui distribusi dari data survival. Pendekatan semi-parametrik salah satunya yang paling banyak digunakan adalah Cox Proportional Hazard Model. Model ini memiliki kelemahan karena harus memenuhi asumsi PH. Sehingga, dikembangkan metode dengan pendekatan non-parametrik yaitu Survival Support Vector Machine. Namun Survival-SVM memiliki kelemahan karena bentuk fungsinya adalah kuadratik sehingga membutuhkan komputasi yang lebih rumit untuk data berdimensi tinggi. Selanjutnya muncul penelitian baru yaitu Survival Least Squares-SVM (SURLS-SVM). Metode ini tidak terikat dengan asumsi distribusi sehingga lebih fleksibel dan kendalanya dapat diselesaikan secara linear sehingga membutuhkan komputasi yang lebih sederhana. SURLS-SVM memiliki variabel respon yang bersifat kontinu, dan langkah-langkah analisis dengan SURLS-SVM adalah sebagai berikut, pertama objek diurutkan berdasarkan survival time dan status tersensor, selanjutnya menghitung nilai prognostic index yang merupakan pengganti fungsi hazard pada Cox PHM berdasarkan data yang sudah diurutkan, dan terakhir membandingkan urutan survival time dengan prediksi prognostic index. Pada penelitian ini SURLS-SVM diaplikasikan untuk menganalisis kasus kanker serviks di RS dr. Soetomo Surabaya. Sebagai perbandingan juga dilakukan studi simulasi dengan ukuran data survival yang relatif besar. Berdasarkan hasil simulasi maupun data real, model SURLS-SVM lebih unggul dari Cox PHM terutama jika dilihat berdasarkan nilai c-index. Untuk meningkatkan performansi c-index, dilakukan feature selection dengan menggunakan backward elimination dan pada data simulasi dapat menaikkan c-index sampai 10%. Pada data real dapat digunakan untuk mengetahui variabel yang signifikan mempengaruhi c-index, variabel tersebut adalah usia, status komplikasi, usia saat menikah pertama, paritas, stadium, tingkat pendidikan, siklus menstruasi, jenis pengobatan, dan lama menstruasi. ============ The survival analysis has three approaches, i.e. parametric, semi-parametric, and non-parametric. Parametric approach has weakness that it should be known priori the distribution of survival time. Meanwhile, semi-parametric approach does not require priori known distribution of survival time, but this approach must fullfill proportional hazard assumption. The Cox Proportional Hazard Model (Cox PHM) is the popular semi-parametric model used to analyse survival data. One of the non-parametric approach is Survival Support Vector Machine (SUR-SVM). This model has disadvantage because the constrain function has quadratic form so that it requires more complicated computation for high-dimensional data. To overcome this drawback, Survival Least Square Support Vector Machine (SURLS-SVM) is developed. This model does not require distribution and PH assumption, and the constrain function is equality form that can be solved by linear programming. The SURLS-SVM has continuous response, and the algorithm as follows. First, objects are ranked based on survival time and censored status, then prognostic index instead of hazard function in Cox PHM is calculated using sorted data, and the last the survival time is compared with prediction of prognostic index. This research apply on cervical cancer data in dr. Soetomo Hospital Surabaya. The simulation study also uses this model for bigger sample size. Based on simulation result and real data result, SURLS-SVM outperforms than Cox PHM (from c-index value). The increasing of c-index value can be obtained by feature selection, i.e. backward elimination. In simulation study, the c-index increase 10%. In real dataset, this method can be used to know significant variable, i.e. age, complication status, age of first married, parity, stadium, level of education, menstruation cycle length, type of treatment, and length of menstruation.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Analisis Survival, Cox PHM, Kanker Serviks, Survival Least Squares SVM; Survival Analysis; Cervical Cancer.
Subjects: Q Science
Q Science > QA Mathematics
Q Science > QA Mathematics > QA275 Theory of errors. Least squares. Including statistical inference
Q Science > QA Mathematics > QA75 Electronic computers. Computer science. EDP
Divisions: Faculty of Mathematics and Science > Statistics > (S2) Master Theses
Depositing User: Khoiri Halwa Annisa
Date Deposited: 06 Mar 2018 04:41
Last Modified: 06 Mar 2018 04:41
URI: http://repository.its.ac.id/id/eprint/50379

Actions (login required)

View Item View Item