Klasifikasi Senyawa Obat Kanker untuk Optimasi Proteksi Radiasi Menggunakan Pendekatan Machine Learning

Mubarok, Rizky (2018) Klasifikasi Senyawa Obat Kanker untuk Optimasi Proteksi Radiasi Menggunakan Pendekatan Machine Learning. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06211440000074-Undergraduate_Theses.pdf]
Preview
Text
06211440000074-Undergraduate_Theses.pdf - Accepted Version

Download (3MB) | Preview

Abstract

Salah satu pengobatan penyakit kanker yang banyak digunakan adalah terapi radiasi atau radioterapi dengan menggunakan senyawa yang mematikan sel kanker. Senyawa untuk optimasi proteksi radiasi akan diklasifikasikan secara biner yaitu proteksi radiasi tinggi dan rendah. Senyawa tersebut berjumlah 84 senyawa dengan masing-masing senyawa disusun oleh 217 prediktor, sehingga data yang digunakan tergolong high dimensional data. Oleh karena itu, dilakukan feature selection berdasarkan nilai mean decrease gini (MDG). Metode yang digunakan adalah naïve bayes classifier (NBC) dan classification and regression tree (CART). Pada klasifikasi berdasarkan kelas awal yaitu dua kelas proteksi radiasi, nilai AUC dari data testing dengan NBC dan CART berturut-turut adalah 0,549 yang didapatkan dari 5% prediktor dan 0,663 yang didapatkan dari 10% prediktor. Selain menggunakan kelas awal, juga dilakukan pembentukan dua kelas baru dengan pendekatan mixture normal. Hasil nilai AUC data testing dengan menggunakan kelas baru tersebut adalah pada NBC meningkat menjadi 0,592 dengan menggunakan 20% dan 25% prediktor, serta CART turun menjadi 0,617 dengan 5%, 35%, dan 100% prediktor.
========================================================
The leading cause of the world’s mortality and morbidity is cancer. One of the cancer treatments is radiation therapy or radiotherapy. The therapy is using compounds that can increase the death rate of a cancer cell. Compounds that used for optimizing the radiation protection will be binary classified in high and low radiation protection. The total compounds are 84 compounds with each compound composed of 217 predictors so that the data is classified as high-dimensional data. Therefore, feature selection is needed and performed based on the mean decrease gini (MDG). The method used for classification is naïve bayes classifier (NBC) and classification and regression tree (CART). In the classification based on initial class which is two classes of radiation protection, testing data have the AUC value from NBC is 0.549 using 5% predictors and CART is 0.663 using 10% predictors. In this research, also conducted the formation of a new class with mixture normal distribution approach. The AUC value of testing data using new class is on NBC increased to 0,592 by using 20% and 25% predictors, while CART decreased to 0,617 with 5%, 35%, 100% predictors.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Classification and Regression Tree (CART), Feature Importance, High Dimensional Data, Mixture Distribution, Naïve Bayes
Subjects: R Medicine > RA Public aspects of medicine > RA0421 Public health. Hygiene. Preventive Medicine
Divisions: Faculty of Mathematics, Computation, and Data Science > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Rizky Mubarok
Date Deposited: 01 Jul 2021 07:33
Last Modified: 01 Jul 2021 07:33
URI: http://repository.its.ac.id/id/eprint/56945

Actions (login required)

View Item View Item