Deteksi Isu Etik Berbasis Aspek Pada Ringkasan Penelitian Kesehatan Dengan Keyword Extraction

Hamidi, Mohammad Zaenuddin (2023) Deteksi Isu Etik Berbasis Aspek Pada Ringkasan Penelitian Kesehatan Dengan Keyword Extraction. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6025201004-Master_Thesis.pdf] Text
6025201004-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2025.

Download (1MB) | Request a copy

Abstract

Penelitian kesehatan harus melalui proses telaah etik yang bertujuan untuk mengantisipasi dugaan atas risiko fisik, sosial, ekonomi dan psikologis. Penelitian kesehatan dapat diterima secara etik apabila penelitian tersebut mampu dibuktikan dengan metode ilmiah yang valid. Telaah etik diperlukan untuk memastikan proses penelitian sesuai dengan aturan etik serta tidak ada pelanggaran prinsip dasar terutama terhadap hak subjek penelitian. Untuk memastikan aspek etik ada pada dokumen penelitian kesehatan dibutuhkan kata kunci yang relevan dengan aspek etik tersebut. Salah satu pendekatan yang umumnya digunakan adalah dengan menghitung frekuensi kemunculan kata dalam dokumen. Namun dalam kasus ini pendekatan ini kurang memungkinkan sehingga perlu pendekatan lain yang tidak hanya berfokus pada penggunaan frekuensi kemunculan kata. Untuk itu dibutuhkan pendekatan lain yaitu YAKE yang merupakan pendekatan yang tidak hanya menghitung dari frekuensi kata melainkan posisi dan konteks kata. Pendekatan YAKE dinilai lebih unggul dibandingkan dengan metode lainya karena dalam proses penentuan keyword banyak faktor yang digunakan salah satunya adalah posisi kata. Metode lain yang juga melakukan proses ekstraksi adalah keyBERT yang merupakan suatu model untuk melakukan proses ekstraksi dengan memanfaatkan word embedding BERT. Kaitannya dengan hal tersebut ekstraksi kata kunci dalam ringkasan penelitian kesehatan dapat memberikan kata kunci yang tidak hanya didapatkan berdasarkan frekuensi kata melainkan bebrapa faktor lain seperti konteks kata. Baik TF-IDF, keyBERT dan YAKE merupakan model yang menggunakan pendekatan unsupervised. Model unsupervised tidak menjamin dapat mewakili isi dokumen hal ini disebabkan karena kurangnya penggunaan informasi semantik. Sementara analisis semantik biasanya menimbulkan ketidakjelasan dan ketidakpastian sehingga pendekatan fuzzy dibutuhkan dalam kasus ini. Penelitian ini mengusulkan metode kombinasi keyword extraction dengan query expansion dan fuzzy untuk melakukan proses deteksi etik pada ringkasan penelitian kesehatan. Terdapat tiga langkah utama yang dilakukan pada penelitian ini yaitu melakukan keyword extraction, query expansion dan proses fuzzy. Proses pertama melakukan keyword extraction pada ringkasan penelitian kesehatan. Pada bagian lain dilakukan proses query expansion pada kata-kata yang dianggap mewakili aspek etik penelitian kesehatan. Selanjutnya dari kedua proses diatas dilakukan proses pencocokan antara hasil keyword extraction dengan query expansion dengan mencari nilai kemiripannya menggunakan wup_similarity. Nilai kemiripan antara hasil keyword extraction query expansion dicari keanggotaan fuzzynya. Untuk mendapatkan hasil terbaik beberapa skenario uji coba dilakukan seperti melakukan proses deteksi etik tanpa proses ekspansi serta melakukan proses ekspansi sebanyak dua kali. Selanjutnya metode ekstraksi kata kunci juga dikombinasikan dengan metode yang lainnya untuk melihat kinerja metode kata kunci yang diusulkan. Hasil penelitian menunjukkan bahwa kombinasi metode YAKE dan keyBERT dengan fuzzy paling unggul dibandingkan metode lainnya untuk melakukan proses deteksi isu etik. Hal ini dibuktikan dari beberapa skenario uji coba yang dilakukan metode kombinasi metode YAKE dan keyBERT dengan fuzzy selalu lebih unggul baik yang menggunakan proses query expansion pertama atau kedua. Hal ini dikarenakan pendekatan YAKE dan keyBERT mampu melakukan ekstraksi lebih beragam jika dibandingkan dengan metode TF-IDF yang hanya mengandalkan frekuensi kata. Selain itu penggunaan fuzzy dalam proses ini hanya mampu meningkatkan nilai prcision sementara recall dan nilai f1-score yang dihasilkan relatif tidak berubah dan bahkan cenderung mengalami penurunan.
==================================================================================================================================
Health research must go through an ethical review process to anticipate potential risks, both physical, social, economic, and psychological. Health research can be considered ethical if it can be scientifically proven using valid methods. Ethical review is necessary to ensure that the research process complies with ethical rules and regulations and does not violate any basic principles, particularly the rights of research subjects. To ensure that ethical aspects are present in health research documents, relevant keywords must be used. One approach that is commonly used is counting the frequency of words in the document. However, in this case, this approach may not be feasible, and another approach is needed that does not focus solely on word frequency. For this reason, another approach is needed, namely YAKE, which is an approach that does not only calculate word frequency but word position and context. The YAKE approach is considered superior compared to other methods because in the keyword determination process many factors are used, one of which is word position. Another method that also performs the extraction process is keyBERT which is a model for performing the extraction process by utilizing the word embedding BERT. In relation to this, keyword extraction in health research summaries can provide keywords that are not only obtained based on word frequency but several other factors such as word context. Both TF-IDF, keyBERT, and YAKE are unsupervised models that use a keyword-based approach to represent document content. However, unsupervised models may not accurately reflect the semantic meaning of the documents due to the lack of semantic information. In this case, semantic analysis can result in ambiguity and uncertainty, so a fuzzy approach is needed.
In this research, a combination method of keyword extraction, query expansion, and fuzzy is proposed to detect ethics in the health research summary. There are three main steps in this research: keyword extraction, query expansion, and fuzzy process. The first step performs keyword extraction on the health research summary. In another part, query expansion is performed on the words that are considered to represent the ethical aspect of health research. Next, the keyword extraction results are matched with the query expansion results by finding their similarity value using wup_similarity. The similarity value between the keyword extraction and query expansion results is found by calculating their fuzzy membership. To get the best results, several test scenarios are performed such as detecting ethics without the expansion process and performing expansion twice. Furthermore, the keyword extraction method is also combined with other methods to evaluate the performance of the proposed keyword method.
The results of the research show that the combination of YAKE and keyBERT with fuzzy methods is the most superior compared to other methods for detecting ethical issues. This is proven from several test scenarios where the combination of YAKE and keyBERT with fuzzy methods is always superior, whether using the first or second query expansion process. This is because the YAKE and keyBERT approach can extract a more diverse set of keywords compared to the TF-IDF method, which only relies on word frequency. In addition, the use of fuzzy in this process only improves the precision value while the recall and f1-score values generated are relatively unchanged and even tend to decrease.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Ekspansi Queri, Ekstraksi Kata Kunci, Fuzzy, Protokol Etik
Subjects: T Technology > T Technology (General) > T58.62 Decision support systems
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: MOHAMMAD ZAENUDDIN HAMIDI
Date Deposited: 10 Feb 2023 06:14
Last Modified: 10 Feb 2023 06:14
URI: http://repository.its.ac.id/id/eprint/95695

Actions (login required)

View Item View Item