Ghozi, Mohammad Refi Nur (2023) Pembangkitan Ontologi Penyakit Menular Pada Manusia Secara Otomatis. Masters thesis, Institut Teknologi Sepuluh Nopember.
Text
6026202013-Master_Thesis.pdf - Accepted Version Restricted to Repository staff only until 1 October 2025. Download (2MB) | Request a copy |
Abstract
Basis pengetahuan dalam bidang biomedis sangat penting dan umumnya dilakukan melalui pembuatan ontologi. Proses manual pembuatan ontology oleh para ahli memakan waktu dan tenaga, sehingga metode otomatis menjadi krusial. Dengan merebaknya sumber informasi teks dalam era digital seperti sekarang, data teks dapat digunakan untuk melakukan otomatisasi pembuatan ontologi guna mengurangi campur tangan manusia. Penelitian ini bertujuan untuk menghasilkan ontologi yang merepresentasikan pengetahuan mengenai penyakit menular pada manusia dengan melakukan metode ekstraksi konsep dan relasi dari sumber data teks yang berisi penyakit menular berupa eksikploedia Atlas of Human Infectious Disease (AHID). Penelitian ini terdiri dari beberapa tahapan, yaitu ekstraksi teks, part of speech (POS) tagging, ekstraksi konsep dan relasi, serta pembuatan dan integrasi ontologi. Ekstraksi konsep yang dilakukan secara otomatis menggunakan POS tagger Stanza CoreNLP terhadap 113 jenis penyakit menghasilkan 1.632 entitas konsep dengan 1.235 di antaranya merupakan entitas unik. Dari satu set entitas konsep yang dihasilkan dilakukan ekstraksi relasi dalam bentuk hubungan data triple antar konsep. Hasil ekstraksi relasi kemudian digunakan untuk membangkitkan ontologi secara otomatis menggunakan bahasa permrograman Python. Hasil validitas ontologi yang dibangkitkan secara otomatis dibandingkan dengan ontologi yang dibuat secara manual terhadap sampel beberapa jenis penyakit menunjukan kesamaan hasil sebesar 45%. Ontologi yang dihasilkan secara otomatis dalam penelitian ini kemudian diintegrasikan dengan ontologi yang sudah ada, yaitu Infectious Disease Ontology (IDO) dan Personalized Prediction of Infectious Disease Risk (PROSPECT IDR) untuk membentuk basis pengetahuan tentang penyakit menular pada manusia yagn lebih lengkap.
=================================================================================================================================
In the biomedical field, the knowledge base is generally created through the development of ontologies. Experts' manual creation of ontologies is timeconsuming and labor-intensive, so the automated method is essential. Text data can be used to automate the creation of ontologies to reduce the need for human intervention, given the proliferation of text-based information sources in the digital era. The objective of this study is to develop an ontology that represents human infectious disease knowledge. This will be accomplished by extracting concepts and relationships from the Exicplopedia Atlas of Human Infectious Diseases (AHID), a text data source containing information about infectious diseases. This research entails multiple phases, including text extraction, part-of-speech (POS) tagging, concept and relation extraction, and ontology creation and integration. Automatic concept extraction was performed using Stanza CoreNLP's POS tagger on 113 types of diseases, yielding 1,632 concept entities, of which 1,235 were unique. From the generated set of concept entities, relations in the form of triple data relationships between concepts are extracted. The results of relation extraction are then used to automatically generate ontologies with the Python programming language. The results of a comparison between the validity of the automatically generated ontology and the manually generated ontology for samples of various types of diseases reveal a similarity of 45%. The automatically generated ontologies in this study were then combined with existing ontologies, namely the Infectious Disease Ontology (IDO) and Personalized Prediction of Infectious Disease Risk (PROSPECT IDR), to create a more comprehensive knowledge base about infectious diseases in humans.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | ontologi, penyakit menular pada manusia, atlas of human infectious disease (AHID), konsep dan relasi, data triple antar konsep, ontology, infectious diseases in humans, concepts and relations, triple data between concepts |
Subjects: | R Medicine > R Medicine (General) T Technology > T Technology (General) |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 59101-(S2) Master Thesis |
Depositing User: | Mohammad Refi Nur Ghozi |
Date Deposited: | 18 Oct 2023 01:11 |
Last Modified: | 18 Oct 2023 01:11 |
URI: | http://repository.its.ac.id/id/eprint/104967 |
Actions (login required)
View Item |