Mahdiyah, Umi (2015) Integrasi Seleksi Data Dan Extreme Learning Machine (ELM) Untuk Prediksi Binding Site Protein-Ligan. Masters thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
1213201032-Master-Thesis.pdf Download (5MB) | Preview |
Abstract
Computer-aided drug design atau desain obat berbantuan komputer
mulai banyak dikembangkan saat ini. Langkah awal sebelum melakukan desain
obat adalah mencari binding site protein – ligan. Binding site adalah suatu kantung
atau lubang pada permukaan protein yang digunakan untuk menambatkan suatu
senyawa ligan (obat). Dalam penelitian ini, prediksi binding site dirumuskan
sebagai masalah klasifikasi biner, yaitu untuk membedakan lokasi yang bisa
mengikat suatu ligan dan lokasi yang tidak bisa mengikat ligan. Extreme Learning
Machine (ELM) dipilih sebagai algoritma klasifikasi pada penelitian ini, karena
ELM mempunyai kelebihan pada waktu komputasinya yang cepat. Dataset dalam
kasus nyata kebanyakan berupa imbalanced dataset, salah satunya adalah pada
masalah prediksi binding site. Imbalanced data dapat diselesaikan dengan
beberapa cara, salah satunya adalah dengan seleksi data. Dalam penelitian ini
dilakukan integrasi langkah seleksi data dan ELM, dengan tujuan untuk mengatasi
masalah inkonsistensi seleksi data dan klasifikasi. Performa dari integrasi seleksi
data dan Extreme Learning Machine untuk prediksi binding site protein-ligan
diukur mengunakan akurasi, precision, recall, dan g-mean. Hasil dari penelitia ini
diperoleh akurasi rata-rata 96%, recall rata-rata 91.8472%, dan G-mean rata-rata
adalah sebesar 94.26%.CPU Time yang dibutuhkan untuk training data protein
rata-rata adalah 2.78607detik.
================================================================================================
Computer-aided drug design has been developed at this time. The initial
step computer-aided drug design is find a protein - ligan binding site, which is a
pocket or cleft on the surface of the protein used to bind a ligan (drug). In this
study the binding site is defined as a binary classification problem, which is to
distinguish the location that can bind a ligand and a location that cannot bind
ligan. Extreme Learning Machine (ELM) is selected for classification in this
study, because of the speed ELM has a fast learning process. In the case of realworld
datasets are usually imbalanced datasets, one of which is at issue binding
site prediction. Imbalanced data can be solved in several ways, one of which is
with the selection of data. This study carried out the integration of data selection
and classification, that to overcome the problem of inconsistency of data selection
and classification. Performance of integrating data selection and Extreme
Learning Machine for predicting protein-ligan binding site was measured using
accuracy, precision, recall, and g-mean. The average of accuracy, recall, g-mean
and CPU time in this research is 96%, 91.8472%, 94.26%, and 2.78607 second
respectively.
Item Type: | Thesis (Masters) |
---|---|
Additional Information: | RTMa 516 Mah i |
Uncontrolled Keywords: | Extreme Learning Machine, imbalanced data, Protein-ligan binding site |
Subjects: | Q Science > QA Mathematics > QA640.7 Discrete geometry |
Divisions: | Faculty of Mathematics and Science > Mathematics > 44101-(S2) Master Thesis |
Depositing User: | Mr. Marsudiyana - |
Date Deposited: | 05 Dec 2019 05:25 |
Last Modified: | 05 Dec 2019 05:25 |
URI: | http://repository.its.ac.id/id/eprint/72219 |
Actions (login required)
View Item |