Prediksi Interaksi Obat-Target Menggunakan Pendekatan Stacking Ensemble Learning

Prasetyo, Viko Pradana (2024) Prediksi Interaksi Obat-Target Menggunakan Pendekatan Stacking Ensemble Learning. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6026231040-Master_Thesis.pdf] Text
6026231040-Master_Thesis.pdf

Download (1MB)

Abstract

Proses penemuan obat, terutama interaksi obat-target (DTI), memerlukan waktu dan biaya yang besar untuk mendapatkan hasil eksperimen dan persetujuan global. Untuk menghemat waktu dan biaya, digunakan berbagai metode komputasi seperti machine learning dan deep learning. Namun, kedua metode ini memiliki kekurangan seperti kebutuhan data besar dan biaya komputasi tinggi serta rentan terhadap overfitting. Metode yang dapat mengatasi masalah ini adalah Stacking Ensemble Learning (SEL). Penelitian ini bertujuan untuk menerapkan pendekatan SEL untuk memprediksi DTI.
Studi ini menggunakan SEL dengan algoritme seperti AdaBoost, Gradient Boosting, dan Random Forest. Hasilnya menunjukkan peningkatan signifikan dengan menggunakan teknik oversampling SMOTE, seperti peningkatan skor akurasi CV rata-rata dari 0,881 menjadi 0,921 untuk AdaBoost, dari 0,862 menjadi 0,929 untuk Gradient Boosting, dan dari 0,861 menjadi 0,929 untuk Random Forest. Model meta learner yang diuji menunjukkan variasi performa: model 1 memiliki akurasi tertinggi 0,929 dan precision 0,960, model 2 memiliki recall tertinggi yaitu 0,976, sedangkan model 3 berfokus pada meminimalkan false positive dengan precision tertinggi, yaitu 0,991. Hasil rekomendasi juga telah divalidasi oleh pakar, yang membuktikan efektivitasnya. Penelitian ini menunjukkan bahwa SEL dapat meningkatkan prediksi DTI dan mempercepat proses penemuan obat.
===================================================================================================
The process of drug discovery, especially drug-target interactions (DTI), requires significant time and cost to obtain experimental results and global approval. To save time and costs, various computational methods are used, such as machine learning and deep learning. However, these methods have drawbacks, including the need for large data sets, high computational costs, and susceptibility to overfitting. A method that can address these issues is Stacking Ensemble Learning (SEL). This research aims to apply the SEL approach to predict DTI.
The study implemented SEL using base learners including AdaBoost, Gradient Boosting, and Random Forest, achieving significant performance improvements with SMOTE oversampling technique, where AdaBoost's mean CV score rose from 0.881 to 0.921, Gradient Boosting's from 0.862 to 0.929, and Random Forest's from 0.861 to 0.929. The meta learner models demonstrated varying result. Model 1 achieving the highest accuracy of 0.929 and a precision of 0.960, while model 2 improved recall to 0.976, and model 3 focused on minimizing false positives with a precision of 0.991. Additionally, the recommender system's results were validated by expert, confirming its effectiveness. This research highlights the potential of SEL in enhancing DTI prediction, offering a more efficient approach to drug discovery.

Item Type: Thesis (Masters)
Uncontrolled Keywords: akurasi, interaksi obat-target, prediksi, SMOTE, stacking ensemble learning, accuracy, drug-target interaction, prediction
Subjects: R Medicine > RM Therapeutics. Pharmacology
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 59101-(S2) Master Thesis
Depositing User: Viko Pradana Prasetyo
Date Deposited: 06 Aug 2024 02:35
Last Modified: 06 Aug 2024 02:35
URI: http://repository.its.ac.id/id/eprint/113479

Actions (login required)

View Item View Item