Klasifikasi Senyawa Obat Kanker Untuk Optimasi Toksisitas Menggunakan Logistic Regression Ensemble (LORENS) dan Ensemble of Support Vector Machine dengan Feature Selection pada High DImensional Data

Sukmaputri, Erlin (2018) Klasifikasi Senyawa Obat Kanker Untuk Optimasi Toksisitas Menggunakan Logistic Regression Ensemble (LORENS) dan Ensemble of Support Vector Machine dengan Feature Selection pada High DImensional Data. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06211440000092-Undergraduate_Theses.pdf]
Preview
Text
06211440000092-Undergraduate_Theses.pdf - Accepted Version

Download (1MB) | Preview

Abstract

Kanker merupakan penyakit akibat pertumbuhan tidak normal akibat sel-sel jaringan tubuh yang berubah menjadi sel kanker. Salah satu pengobatan pada kanker adalah radioterapi, namun memiliki efek samping yaitu membunuh sel-sel normal disekitar sel kanker. Maka dibuat radioprotector dalam mengurangi kematian sel normal dan meningkatkan kematian sel kanker. Data yang digunakan adalah tingkat toksisitas untuk mengklasifikasi senyawa untuk radioprotector dengan 84 senyawa dengan 217 prediktor sehingga data tergolong high dimensional data. Dalam menangani high dimensional data, ensemble dan feature selection digunakan dalam penelitian ini. Penelitian ini menggunakan metode berbasis ensemble yaitu LORENS dan Ensemble of Support Vector Machine (AdaBoost-SVM). Pada LORENS tidak dilakukan feature selection namun, pada AdaBoost-SVM dilakukan feature selection dengan menggunakan Mean Decrease Gini. Penelitian inimembandingkan dari performa klasifikasi dari metode LORENS dan AdaBoost-SVM dengan evaluasi 10-fold cross validation. Performa klasifikasi yang digunakan adalah nilai akurasi karena data yang digunakan sudah balanced. Hasil yang diperoleh adalah metode AdaBoost-SVM mengungguli LORENS dalam hal akurasi. Akurasi optimum yang dihasilkan sebesar 0.7889 dengan jumlah 11 variabel prediktor.
=================================================================================================
Cancer is a disease due to abnormal growth of the body tissue cells that turn into cancer cells. One of the treatment for cancer is radiotherapy, but it has side effects of killing normal cells around cancer cells. Thus, radioprotector is made to reducing the death of the normal cells and increase cancer cell death. The data used is the toxicity level to classify the compound for radioprotector with 84 compounds with 217 predictors and the data is classified as high dimensional data. There are several ways for overcome highdimensional data,ensemble and feature selection are used in this study. This research usedensemble based method,which are LORENS and Ensemble of Support Vector Machine (AdaBoost-SVM). In LORENS there is no feature selection but, in AdaBoost-SVM feature selection will be performed using Mean Decrease Gini. This study will compare the classification performance of the LORENS and the AdaBoost-SVM methods with the 10-fold cross validation evaluation. Performance classification used is the value of accuracy because the data is balanced. The result obtained that AdaBoost-SVM method outperformed LORENS in terms of accuracy. The optimum accuracy was 0.7889 with 11 predictor variables.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: AdaBoost, High Dimensional Data, Kanker, LORENS, Support Vector Machine (SVM).
Subjects: H Social Sciences > HA Statistics
H Social Sciences > HA Statistics > HA31.7 Estimation
Divisions: Faculty of Mathematics, Computation, and Data Science > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Erlin Sukmaputri
Date Deposited: 05 Aug 2021 22:00
Last Modified: 05 Aug 2021 22:00
URI: http://repository.its.ac.id/id/eprint/57591

Actions (login required)

View Item View Item