Adaptasi Model Transformer mT5 Ke T5 Bahasa Indonesia untuk Automatic Question Generation dari Teks Bahasa Indonesia

Fuadi, Mukhlish (2022) Adaptasi Model Transformer mT5 Ke T5 Bahasa Indonesia untuk Automatic Question Generation dari Teks Bahasa Indonesia. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6022211044-Master_Thesis.pdf] Text
6022211044-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2025.

Download (3MB) | Request a copy

Abstract

Tingkat literasi memiliki hubungan terhadap kualitas kehidupan dalam suatu negara. Indonesia memiliki tingkat literasi yang masih berada dalam kategori rendah. Oleh karena itu, pemerintah Indonesia terus berupaya menumbuhkan budaya literasi. Kemampuan memahami bacaan merupakan salah satu komponen dalam literasi dan salah satu pendekatan untuk meningkatkan atau mengevaluasi kemampuan pemahaman pada suatu bacaan adalah dengan metode question - answering yakni menjawab pertanyaan seputar bacaan yang dibaca. Namun menyusun pertanyaan yang relevan, minim bias, cepat, dan dapat dijawab bukanlah hal yang mudah, membutuhkan konsentrasi dan waktu yang tidak sebentar. Automatic Question Generation (AQG) merupakan salah satu bagian dari Natural Language Processing (NLP) yang dapat membuat pertanyaan secara otomatis dari input teks. Penelitian terkait AQG telah banyak dilakukan namun masih sangat terbatas pada teks bahasa Indonesia, terlebih yang menggunakan variasi Transformer terkini. Penelitian ini menggunakan model Text-to-Text Transfer Transformer (T5) untuk membangun model AQG dari teks bahasa Indonesia. Dikarenakan model T5 merupakan model yang berbasis bahasa Inggris, pada penelitian ini model Transformer multilingual T5 (mT5) diadaptasi ke model T5 bahasa Indonesia sehingga memiliki ukuran yang lebih kecil untuk selanjutnya dilakukan fine-tuning untuk model AQG dari input teks bahasa Indonesia dengan menggunakan dataset SQuAD v2.0 yang telah diterjemahkan. Model AQG yang dihasilkan mencapai skor BLEU-1, BLEU-2, BLEU-3, BLEU-4, dan ROUGE-L masing-masing sebesar 33.15, 21.40, 14.65, 10.37, dan 33.77. Pertanyaan yang dibangkitkan tersusun dengan baik dan dapat dimengerti.
===============================================================================================================================
The literacy level is related to a country's quality of life. Indonesia has a literacy level that is still in the low category. Therefore, the Indonesian government continues to strive to foster a culture of literacy. The ability to understand reading is one of the components of literacy. One approach to improve or evaluate the ability to understand reading is the question-answer method, which is to answer questions about the reading. However, creating questions that are relevant, minimally biased, fast, and can be answered is a challenging task. It requires concentration and much time. Automatic Question Generation (AQG) is a part of Natural Language Processing (NLP) that can generate questions automatically from text input. Many studies related to AQG have been carried out but still need to be expanded in Indonesian texts, especially those that use the latest Transformer variations. This study uses the Text-to-Text Transfer Transformer (T5) model to build an AQG model from Indonesian text. Because the T5 model is an English- based model, the multilingual T5 (mT5) Transformer model was adapted to the Indonesian T5 model so that it has a smaller size for further fine-tuning of the AQG model from Indonesian text input using the translated SQuAD v2.0 dataset. The resulting AQG model achieved BLEU-1, BLEU-2, BLEU-3, BLEU-4, and ROUGE-L scores of 33.15, 21.40, 14.65, 10.37, and 33.77, respectively. The generated questions are well structured and can be understandable.

Item Type: Thesis (Masters)
Uncontrolled Keywords: question generation, transformer, t5
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning.
Q Science > QA Mathematics > QA336 Artificial Intelligence
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Electrical Engineering > 20101-(S2) Master Thesis
Depositing User: Mukhlish Fuadi
Date Deposited: 16 Jan 2023 10:14
Last Modified: 16 Jan 2023 10:14
URI: http://repository.its.ac.id/id/eprint/95418

Actions (login required)

View Item View Item