Sistem Tanya Jawab Bilingual Berbasis Dokumen Frequently Asked Question dan Referensi Eksternal

Ihdiannaja, Ihdiannaja (2021) Sistem Tanya Jawab Bilingual Berbasis Dokumen Frequently Asked Question dan Referensi Eksternal. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111740007005-Undergraduate_Thesis.pdf] Text
05111740007005-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (2MB) | Request a copy

Abstract

Sistem tanya jawab merupakan sistem yang dibangun dengan tujuan menjawab pertanyaan yang diajukan berdasarkan koleksi dokumen yang tidak terstruktur dalam bahasa alami. Sistem tanya jawab dapat diterapkan dalam berbagai kebutuhan pengembalian informasi, salah satunya pengembalian informasi Frequently Asked Question (FAQ) relevan yang diajukan oleh pengguna. Penerapan sistem tanya jawab tersebut menjadikan FAQ menjadi lebih efisien karena pertanyaan yang serupa dapat dijawab secara otomatis oleh sistem. Pada kasus sistem tanya jawab FAQ yang terdiri dari 2 bahasa, sistem seringkali hanya menggunakan salah satu dari bahasa tersebut. Hal ini membuat sistem tanya jawab tidak mengembalikan informasi secara optimal.
Untuk itu, dalam tugas akhir ini dilakukan implementasi sistem tanya jawab bilingual yang mempertimbangkan kedua bahasa sebagai parameter pencarian informasi relevan berbasis dokumen FAQ dan referensi eksternal berupa terjemah referensi. Metode yang digunakan dalam pembuatan sistem yaitu Okapi BM25 yang memiliki karakteristik penghitungan kemiripan kalimat berdasarkan jumlah kata yang sama dan Bidirectional Encoder Representation from Transformer (BERT) yang menggunakan konteks kata dalam penghitungan relevansi kalimat.
Dataset yang digunakan pada pengujian merupakan data FAQ dari website PISS-KTB.com dengan jumlah 700 data. Terdapat 5 jenis atribut yang digunakan, yaitu kueri, pertanyaan, jawaban, dan referensi eksternal berupa referensi dalam Bahasa Arab dan terjemah referensi dalam Bahasa Indonesia. Dari percobaan yang dilakukan, penggunaan parameter referensi eksternal memiliki nilai evaluasi yang cukup baik dengan nilai Precision, MAP, dan MRR berturut 91%, 93%, dan 98%.
================================================================================================
Question answering system is a system built with the objective of answering asked queries based on an unstructured collection of documents in natural language. The question answering system can be applied to various information retrieval needs, such as Frequently Asked Question (FAQ) question answering to retrieve the relevant FAQ that asked by other user before. The implementation of FAQ question answering system makes FAQ more efficient because similar questions can be answered automatically by the system. In the case of the recent FAQ question answering system which consists of 2 languages, the system often only uses one of these languages. This makes the question answering system not retrieve information optimally.
Therefore, in this final project a bilingual question answering system is implemented that considers both languages as parameters for searching relevant information based on FAQ documents and external references. The method used in making the system is Okapi BM25 which has a characteristic feature that compute similarity based on the number of same words and Bidirectional Encoder Representation from Transformer (BERT) which uses word context in calculating sentence relevance.
The dataset used in the test is FAQ data from the PISSKTB.com website with a total of 700 data. There are 5 types of attributes used, namely queries, questions, answers, and external references in the form of references in Arabic and translation of references in Indonesian. From the experiments carried out, the use of external reference parameters has a good evaluation value with Precision, MAP, and MRR values of 91%, 93%, and 98% respectively.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Sistem Tanya Jawab Bilingual, FAQ, Okapi BM25, Bidirectional Encoder Representation form Tranformer, Bahasa Indonesia-Arab. Bilingual Question Answering, FAQ, Okapi BM25, Bidirectional Encoder Representation form Tranformer.
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
Z Bibliography. Library Science. Information Resources > ZA Information resources > Z699.5 Information storage and retrieval systems
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Ihdiannaja Ihdiannaja
Date Deposited: 29 Aug 2021 12:50
Last Modified: 29 Aug 2021 12:50
URI: http://repository.its.ac.id/id/eprint/90615

Actions (login required)

View Item View Item