Pengembangan Model Analisis Sentimen dengan Pengayaan Pengetahuan Berdasarkan Kamus Menggunakan Metode DictABSA dan KBBI pada Teks Berbahasa Indonesia

Izdihar, Awliya Hanun (2024) Pengembangan Model Analisis Sentimen dengan Pengayaan Pengetahuan Berdasarkan Kamus Menggunakan Metode DictABSA dan KBBI pada Teks Berbahasa Indonesia. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5026201017-Undergraduate_Thesis.pdf] Text
5026201017-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2026.

Download (4MB) | Request a copy

Abstract

Pariwisata memegang peranan yang penting bagi perekonomian Indonesia. Namun, pascapandemi COVID-19 memunculkan tren perilaku “Always in Doubt” pada para wisatawan sehingga wisatawan akan cenderung bersikap skeptis dalam memilih destinasi wisata yang akan dikunjungi. Analisis sentimen dapat dilakukan untuk memahami pandangan dan opini wisatawan. Akan tetapi, tidak seperti manusia, mesin atau komputer tidak memiliki latar belakang pengetahuan yang luas ataupun pengalaman hidup yang dapat membuat mesin kebingungan untuk memahami konteks atau data yang belum pernah dilihat sebelumnya.
Salah satu pendekatan yang bisa dilakukan adalah dengan menginjeksikan pengetahuan manusia untuk dipelajari oleh mesin. Tugas akhir ini bertujuan membangun model DictABSA menggunakan pengetahuan dari KBBI untuk membantu mesin melakukan klasifikasi polaritas sentimen dari ulasan-ulasan pariwisata yang telah ditulis oleh pengunjung. Tugas akhir ini dilakukan dengan memanfaatkan data ulasan turis terhadap pariwisata di Provinsi Bali yang ada pada laman TripAdvisor serta data makna kata dari KBBI untuk dipelajari oleh model. Model dilatih untuk mampu mengklasifikasikan polaritas sentimen yang ada pada data ulasan menggunakan pendekatan BERT-SPC. Keberhasilan performa model DictABSA diukur dengan membandingkan nilai f1-score dengan model yang tidak diinjeksikan pengetahuan KBBI. Upaya menginjeksikan pengetahuan bahasa Indonesia untuk analisis sentimen diharapkan dapat membantu pemerintah dan pihak terkait untuk memahami pandangan wisatawan terhadap pariwisata Indonesia. Selain itu, tugas akhir ini diharapkan dapat berkontribusi dalam pengembangan pengetahuan PBA terutama pada domain pariwisata di Indonesia.
Dari hasil penelitian yang telah dilakukan, didapatkan bahwa model dengan pengayaan pengetahuan (DictABSA) mampu memberikan performa model yang lebih baik dibandingkan model baseline tanpa pengayaan pengetahuan. Model DictABSA dengan pretrained language model indolem berhasil mencapai nilai f1-score sebesar 79,87%, sementara model baseline mendapat nilai 78,34%. Dalam penerapan DictABSA ke dalam bahasa Indonesia, perlu dilakukan penanganan untuk mengatasi permasalahan teks yang panjang (long range dependency). Salah satu cara mengatasinya adalah dengan melakukan seleksi pengetahuan. Posisi peletakan pengetahuan aspek juga dapat memengaruhi hasil performa model, di mana posisi pengetahuan yang diletakkan dekat dengan kata aspeknya dapat menghasilkan model dengan performa yang lebih baik.
================================================================================================================================
Tourism holds an important role on Indonesian economy. However, the post-COVID-19 pandemic has led to a trend of “Always in Doubt” behavior among tourists so that tourists will tend to be more skeptical in choosing tourism destinations to visit. Sentiment analysis can be done to understand the perspectives and opinions of the tourists. But unlike humans, machines or computers do not have extensive background knowledge nor life experiences which could make them confused in understanding the context or data that have never been seen before.
One of the possible approaches is by injecting human knowledge to be learned by the machine. This research aims to build a DictABSA model using knowledge from the Indonesian Language Dictionary (KBBI) to help machines classify the sentiment polarity of tourism reviews that have been posted by the tourists. This research was conducted by utilizing the data of tourist reviews of tourism in Bali Province on the TripAdvisor page along with word definitions data from the KBBI to be learned by the model. The model was trained to be able to classify the sentiment polarity in the review data using the BERT-SPC approach. The successful performance of the DictABSA model is measured by comparing the f1-score values with models that have not been injected with KBBI knowledge. The attempt to inject Indonesian language knowledge for sentiment analysis hopefully will be able to help the government and related parties to understand tourists' opinions on Indonesian tourism. In addition, this research is expected to bring contribution to the development of the NLP knowledge, especially in Indonesia's tourism domain.
Based on the conducted research, it is concluded that model with knowledge enrinchment (DictABSA) is able to deliver better performance compared to the baseline model without any knowledge enrichment. DictABSA model with indolem’s pretrained language model managed to achieve 79.87% f1-score, while the baseline model achieved 78.34%. In implementing DictABSA into Indonesian, it is necessary to overcome the long text problem (long range dependency). One possible way to overcome this problem is by performing a knowledge selection. Positioning the knowledge of aspects may also affect the performance of the model, where the knowledge that is placed close to its aspect can produce may result in a better performing model.

Item Type: Thesis (Other)
Uncontrolled Keywords: Analisis Sentimen Berbasis Aspek, Aspect-based Sentiment Analysis, BERT-SPC, KBBI, Knowledge Infusion Mechanisms, Pariwisata, Pengayaan Pengetahuan, Tourism
Subjects: G Geography. Anthropology. Recreation > G Geography (General) > G155 Tourism
Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 57201-(S1) Undergraduate Thesis
Depositing User: Awliya Hanun Izdihar
Date Deposited: 01 Aug 2024 01:47
Last Modified: 01 Aug 2024 01:47
URI: http://repository.its.ac.id/id/eprint/110941

Actions (login required)

View Item View Item