Augmentasi Data Teks Melalui Penggabungan Model Conversation Graph Dan Metode Cluster Editing

Rahmatya, Vira Varicha (2023) Augmentasi Data Teks Melalui Penggabungan Model Conversation Graph Dan Metode Cluster Editing. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06111940000035-Undergraduate_Thesis.pdf] Text
06111940000035-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2025.

Download (6MB) | Request a copy

Abstract

Sistem Chatbot menjadi salah satu pilar teknologi dari dunia metaverse yang saat ini dikembangkan. Komponen utama dalam chatbot didasarkan atas keberhasilan dialog yang tengah berlangsung atau yang dikenal dengan dialogue succession. Dengan kebebasan komunikasi, perlu dibutuhkan kamus yang sangat besar untuk suatu model. Model Conversation Graph (ConvGraph) berusaha untuk melakukan augmentasi komunikasi yang ada untuk menutupi keterbatasan pada kamus. Namun, model ConvGraph yang didasarkan pada ucapan yang paling sering muncul mengakibatkan hanya mampu menangkap ucapan berikutnya tanpa ada informasi ucapan dan nilai bobot dari ucapan tersebut. Adapun cara untuk menangkap ucapan informatif dengan melakukan klaster pada graf dengan metode cluster editing. Metode cluster editing digunakan untuk membuatkan subgraf yang mendekati kriteria graf klik. Sehingga, penelitian Tugas Akhir ini menggabungkan model ConvGraph dan metode cluster editing untuk mengambil ucapan yang informatif (beserta nilai bobotnya) dalam suatu dialog. Selanjutnya, model yang diusulkan dinamakan Clique Conversation Graph (CliqConvGraph). Adapun penelitian Tugas Akhir ini bertujuan untuk menambahkan kamus dari ucapan yang informatif pada training data dari dialogue succession. Model yang diusulkan diuji pada publik dataset terkait dialog. Dari hasil eksperimen diperoleh bahwa model yang diusulkan mampu memberikan hasil ketepatan memprediksi dialog lebih akurat dibandingkan model basisnya.
==================================================================================================================================
Chatbot system has become one of the paramount technology in the Metaverse world. The main component of the chatbot system is based on dialogue succession by reviewing the number of utterances. Indeed, we need abundant words in the dictionary to help models learn well as people can communicate in freestyle. Model conversation graph (ConvGraph) attempts to augment the utterance in the existing dialogue systems to overcome the limited dictionary. However, ConvGraph only can capture the next utterance without knowing its slot and value. The way to capture informative utterances is by clustering the graph with the cluster editing method. In this study, we allow a clustering editing method to find a subgraph that is close enough to clique graph criteria. Hence, this study proposes an augmentation model by unifying ConvGraph with a cluster editing method to provide additional informative utterances with slot and value information, namely CliqConvGraph. This study aims to add informative utterances to the training data of the dialogue succession. We tested the proposed model in public dialogue dataset. From the experiments, the proposed model showed accurate dialogue prediction than baseline models.

Item Type: Thesis (Other)
Uncontrolled Keywords: Data Augmentation, Chatbot, Cluster Editing, Conversation Graph, Augmentasi Data
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning.
Q Science > QA Mathematics > QA166 Graph theory
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Mathematics > 44201-(S1) Undergraduate Thesis
Depositing User: Vira Varicha Rahmatya
Date Deposited: 24 Aug 2023 04:13
Last Modified: 24 Aug 2023 04:13
URI: http://repository.its.ac.id/id/eprint/101443

Actions (login required)

View Item View Item