Integrasi Seleksi Data Dan Extreme Learning Machine (ELM) Untuk Prediksi Binding Site Protein-Ligan

Mahdiyah, Umi (2015) Integrasi Seleksi Data Dan Extreme Learning Machine (ELM) Untuk Prediksi Binding Site Protein-Ligan. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
1213201032-Master-Thesis.pdf

Download (5MB)

Abstract

Computer-aided drug design atau desain obat berbantuan komputer mulai banyak dikembangkan saat ini. Langkah awal sebelum melakukan desain obat adalah mencari binding site protein – ligan. Binding site adalah suatu kantung atau lubang pada permukaan protein yang digunakan untuk menambatkan suatu senyawa ligan (obat). Dalam penelitian ini, prediksi binding site dirumuskan sebagai masalah klasifikasi biner, yaitu untuk membedakan lokasi yang bisa mengikat suatu ligan dan lokasi yang tidak bisa mengikat ligan. Extreme Learning Machine (ELM) dipilih sebagai algoritma klasifikasi pada penelitian ini, karena ELM mempunyai kelebihan pada waktu komputasinya yang cepat. Dataset dalam kasus nyata kebanyakan berupa imbalanced dataset, salah satunya adalah pada masalah prediksi binding site. Imbalanced data dapat diselesaikan dengan beberapa cara, salah satunya adalah dengan seleksi data. Dalam penelitian ini dilakukan integrasi langkah seleksi data dan ELM, dengan tujuan untuk mengatasi masalah inkonsistensi seleksi data dan klasifikasi. Performa dari integrasi seleksi data dan Extreme Learning Machine untuk prediksi binding site protein-ligan diukur mengunakan akurasi, precision, recall, dan g-mean. Hasil dari penelitia ini diperoleh akurasi rata-rata 96%, recall rata-rata 91.8472%, dan G-mean rata-rata adalah sebesar 94.26%.CPU Time yang dibutuhkan untuk training data protein rata-rata adalah 2.78607detik. ================================================================================================ Computer-aided drug design has been developed at this time. The initial step computer-aided drug design is find a protein - ligan binding site, which is a pocket or cleft on the surface of the protein used to bind a ligan (drug). In this study the binding site is defined as a binary classification problem, which is to distinguish the location that can bind a ligand and a location that cannot bind ligan. Extreme Learning Machine (ELM) is selected for classification in this study, because of the speed ELM has a fast learning process. In the case of realworld datasets are usually imbalanced datasets, one of which is at issue binding site prediction. Imbalanced data can be solved in several ways, one of which is with the selection of data. This study carried out the integration of data selection and classification, that to overcome the problem of inconsistency of data selection and classification. Performance of integrating data selection and Extreme Learning Machine for predicting protein-ligan binding site was measured using accuracy, precision, recall, and g-mean. The average of accuracy, recall, g-mean and CPU time in this research is 96%, 91.8472%, 94.26%, and 2.78607 second respectively.

Item Type: Thesis (Masters)
Additional Information: RTMa 516 Mah i
Uncontrolled Keywords: Extreme Learning Machine, imbalanced data, Protein-ligan binding site
Subjects: Q Science > QA Mathematics > QA640.7 Discrete geometry
Divisions: Faculty of Mathematics and Science > Mathematics > (S2) Master Theses
Depositing User: Mr. Marsudiyana -
Date Deposited: 05 Dec 2019 05:25
Last Modified: 05 Dec 2019 05:25
URI: http://repository.its.ac.id/id/eprint/72219

Actions (login required)

View Item View Item