Sukmaputri, Erlin (2018) Klasifikasi Senyawa Obat Kanker Untuk Optimasi Toksisitas Menggunakan Logistic Regression Ensemble (LORENS) dan Ensemble of Support Vector Machine dengan Feature Selection pada High DImensional Data. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
06211440000092-Undergraduate_Theses.pdf - Accepted Version Download (1MB) | Preview |
Abstract
Kanker merupakan penyakit akibat pertumbuhan tidak normal akibat sel-sel jaringan tubuh yang berubah menjadi sel kanker. Salah satu pengobatan pada kanker adalah radioterapi, namun memiliki efek samping yaitu membunuh sel-sel normal disekitar sel kanker. Maka dibuat radioprotector dalam mengurangi kematian sel normal dan meningkatkan kematian sel kanker. Data yang digunakan adalah tingkat toksisitas untuk mengklasifikasi senyawa untuk radioprotector dengan 84 senyawa dengan 217 prediktor sehingga data tergolong high dimensional data. Dalam menangani high dimensional data, ensemble dan feature selection digunakan dalam penelitian ini. Penelitian ini menggunakan metode berbasis ensemble yaitu LORENS dan Ensemble of Support Vector Machine (AdaBoost-SVM). Pada LORENS tidak dilakukan feature selection namun, pada AdaBoost-SVM dilakukan feature selection dengan menggunakan Mean Decrease Gini. Penelitian inimembandingkan dari performa klasifikasi dari metode LORENS dan AdaBoost-SVM dengan evaluasi 10-fold cross validation. Performa klasifikasi yang digunakan adalah nilai akurasi karena data yang digunakan sudah balanced. Hasil yang diperoleh adalah metode AdaBoost-SVM mengungguli LORENS dalam hal akurasi. Akurasi optimum yang dihasilkan sebesar 0.7889 dengan jumlah 11 variabel prediktor.
=================================================================================================
Cancer is a disease due to abnormal growth of the body tissue cells that turn into cancer cells. One of the treatment for cancer is radiotherapy, but it has side effects of killing normal cells around cancer cells. Thus, radioprotector is made to reducing the death of the normal cells and increase cancer cell death. The data used is the toxicity level to classify the compound for radioprotector with 84 compounds with 217 predictors and the data is classified as high dimensional data. There are several ways for overcome highdimensional data,ensemble and feature selection are used in this study. This research usedensemble based method,which are LORENS and Ensemble of Support Vector Machine (AdaBoost-SVM). In LORENS there is no feature selection but, in AdaBoost-SVM feature selection will be performed using Mean Decrease Gini. This study will compare the classification performance of the LORENS and the AdaBoost-SVM methods with the 10-fold cross validation evaluation. Performance classification used is the value of accuracy because the data is balanced. The result obtained that AdaBoost-SVM method outperformed LORENS in terms of accuracy. The optimum accuracy was 0.7889 with 11 predictor variables.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | AdaBoost, High Dimensional Data, Kanker, LORENS, Support Vector Machine (SVM). |
Subjects: | H Social Sciences > HA Statistics H Social Sciences > HA Statistics > HA31.7 Estimation |
Divisions: | Faculty of Mathematics, Computation, and Data Science > Statistics > 49201-(S1) Undergraduate Thesis |
Depositing User: | Erlin Sukmaputri |
Date Deposited: | 05 Aug 2021 22:00 |
Last Modified: | 05 Aug 2021 22:00 |
URI: | http://repository.its.ac.id/id/eprint/57591 |
Actions (login required)
View Item |