Deteksi Intensi dan Ekstraksi Label Semantik Menggunakan Metode Joint Learning dengan BERT dalam Bahasa Indonesia

Wibowo, Anggar Wahyu Nur (2021) Deteksi Intensi dan Ekstraksi Label Semantik Menggunakan Metode Joint Learning dengan BERT dalam Bahasa Indonesia. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111740000052-Undergraduate_Thesis.pdf] Text
05111740000052-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (2MB) | Request a copy

Abstract

Pada perkembangan teknologi saat ini, ketersediaan perangkat komputasi semakin mudah dijumpai. Banyak cara yang ada dalam interaksi antara manusia dengan perangkat komputasi, mulai dari pemberian perintah dengan bahasa mesin hingga tampilan antar muka grafis yang mudah dioperasikan. Salah satu cara komunikasi baru yang muncul saat ini adalah pemberian perintah (kueri) ke alat komputasi dengan bahasa natural manusia.
Untuk melakukan pengenalan kueri bahasa natural, terdapat pendekatan dalam translasinya ke bahasa mesin. Pendekatan yang umum dipakai antara lain dengan semantic parsing dan intent detection-slot filling. Dalam intent detection-slot filling atau deteksi intensi dan pengisian slot memiliki pendekatan yang lebih sederhana. Pendekatan tersebut berupa klasifikasi intensi dari kueri dan pemilihan kata untuk diisi ke slot yang ada. Pengisian slot ini dapat juga dipandang sebagai ekstraksi label semantik, dikarenakan setiap kata nantinya akan dilabelkan ke label yang mewakili peran akan kata tersebut dari kalimat yang diberikan.
Tugas akhir ini merupakan implementasi dari deteksi intensi dan pengisian slot dengan metode joint learning BERT pada teks perintah Bahasa Indonesia. Sistem merupakan model deep learning yang menggunakan BERT sebagai model pretrained-nya dan akan dilakukan ekstensi dengan dua blok untuk mengakomodasi setiap task intent detection-slot filling. Blok pertama akan mengidentifikasi intensi dari setiap kalimat input ke kategori yang telah ditentukan. Selain itu program juga akan melakukan pelabelan per kata dengan label slot. Joint learning dilakukan dalam pelatihan di antara kedua blok tersebut.
Implementasi diujikan pada dataset Bahasa Inggris dan Bahasa Indonesia. Pengujian pada dataset Bahasa Inggris mendapat nilai akurasi deteksi intensi terbaik 98,80% dan F1-score pelabelan slot terbaik 95,13%. Pengujian dengan dataset Bahasa Indonesia mendapat nilai akurasi deteksi intensi terbaik 93,95% dan F1-score pelabelan slot terbaik 87,07%.

=====================================================================================================

In today’s technological advancements, the availability of computing devices is increasingly easier to find. There are many ways for interaction between humans and computing devices, from giving commands in machine language to displaying an easy-to-operate graphical interface. One of the new ways of communication that has emerged at this time is giving commands (queries) to computing tools with natural human language.
To perform natural language query recognition, there is an approach in translating it to machine language. Common approaches include semantic parsing and intent detection-slot filling. In intent detection-slot filling or intent detection and slot filling has a simpler approach. The approach is in the form of classification of the intent of the query and the selection of words to be filled into the existing slots. Slot filling can also be seen as semantic label extraction, because each word will later be labeled to a label that represents the role of the word in the given sentence.
This undergraduate thesis is an implementation of intent detection and slot filling with joint learning using BERT in Indonesian utterances. The system is a deep learning model that uses BERT as its pretrained model and will be extended with two blocks to accommodate each intent detection-slot filling task. The first block will identify the intent of each input sentence into a predetermined category. In addition, the program will also perform word-by-word labeling with slot labels. Joint learning is used for training between the two blocks.
The implementation was tested on the English and Indonesian dataset. Testing on the English dataset resulted the best intent detection accuracy of 98.80% and the best F1-score of slot labeling 95.13%. While testing on the Indonesian dataset resulted the best intent detection accuracy of 93.95% and the best F1-score of slot labeling 87.07%.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: BERT, intent detection, joint learning, slot filling, deteksi intensi, pengisian slot
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Anggar Wahyu Nur Wibowo
Date Deposited: 13 Aug 2021 15:59
Last Modified: 01 Sep 2021 05:47
URI: http://repository.its.ac.id/id/eprint/86289

Actions (login required)

View Item View Item