Pencarian Informasi Menggunakan Model Terdekomposisi: Aplikasi Pada Riset Penemuan Antibiotik

Juniarta, Nyoman (2016) Pencarian Informasi Menggunakan Model Terdekomposisi: Aplikasi Pada Riset Penemuan Antibiotik. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
5114201042-Master_Theses.pdf - Published Version
Restricted to Repository staff only

Download (1MB)

Abstract

Penemuan obat-obatan antibiotik adalah salah satu tantangan pada bidang kemoinformatika. Dibutuhkan antibiotik baru secara cepat dan efektif karena banyak bakteri menjadi kebal terhadap antibiotik lama. Molekul-molekul kimia yang tersimpan di beberapa perusahaan dan laboratorium menyediakan kandidat yang berpotensi sebagai antibiotik baru. Tetapi, terlalu banyak kandidat yang harus diteliti. Untuk mengatasinya, dibutuhkan pencarian informasi yang dapat mendeteksi kandidat-kandidat penting melalui atribut mereka. Jumlah atribut tersebut sangatlah besar. Tujuan penelitian ini adalah mempelajari atribut-atribut tersebut dan menentukan atribut yang penting, dengan kata lain, untuk mereduksi dimensi data molekul. Fokus penelitian ini ditujukan pada molekul-molekul antibiotik yang sudah ada di pasaran, dengan sekitar 500 atribut yang diperoleh dari penelitian sebelumnya. Sebagai prosedur seleksi fitur, penelitian ini menggunakan analisis log-linear untuk menemukan asosiasi di antara atribut. Karena jumlah atribut mencapai ratusan, maka digunakan Chordalysis yang bekerja pada model log-linear yang bisa didekomposisi. Penelitian ini menemukan bahwa atribut-atribut dari penelitian sebelumnya memiliki beberapa asosiasi. Dengan demikian, beberapa atribut yang redundan dapat dieliminasi. ================================================================================================================== Antibacterial drug discovery is one of the emerging challenges in chemoinformatics. There is an urgent need for finding new effective drugs faster because many bacteria become resistant to the old drugs. The chemical molecules stored in companies and laboratories’ databases provide potential candidates for developing new drugs. However, there are far too many candidates to investigate. This is where knowledge discovery could be of help, by sifting through the known properties of the molecule to select the most promising candidates for further experiments. The number of properties, or descriptors, characterizing the molecules is rather large. The aim of the present work is to study these descriptors and find out which ones really matter, that is, to reduce the dimension of the description space. We focus on a subset of antibacterial molecules already on the market, with around 500 descriptors obtained from the selection process in the previous work. As our feature selection procedure, we use log-linear analysis (LLA) to discover associations among descriptors. Given that the number of descriptors is high, we study Chordalysis that focuses on a specific subset of log-linear models: decomposable models. We find that the selected descriptors from the previous work still have many associations among them. Therefore, a number of redundant descriptors can still be left out.

Item Type: Thesis (Masters)
Uncontrolled Keywords: antibacterial drug, feature selection, knowledge discovery, probabilistic graphical model.
Subjects: Q Science > QA Mathematics > QA184 Algebra, Linear
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions: Faculty of Information Technology > Informatics Engineering > (S2) Master Theses
Depositing User: - NYOMAN JUNIARTA
Date Deposited: 29 Mar 2017 02:35
Last Modified: 27 Dec 2017 02:54
URI: http://repository.its.ac.id/id/eprint/2678

Actions (login required)

View Item View Item