Analisis Dan Kategorisasi Triplet Sentimen Level Aspek Pada Ulasan Hotel Menggunakan Span-Aste Dan Wu-Palmer Similarity Score (Studi Kasus: Provinsi Bali)

Ziaulhaq, Ibadurrahman (2023) Analisis Dan Kategorisasi Triplet Sentimen Level Aspek Pada Ulasan Hotel Menggunakan Span-Aste Dan Wu-Palmer Similarity Score (Studi Kasus: Provinsi Bali). Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05211940000052-Undergraduate-Thesis.pdf] Text
05211940000052-Undergraduate-Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2025.

Download (8MB) | Request a copy

Abstract

Indonesia adalah negara dengan kekayaan sumber daya alam yang melimpah dan mengembangkan daerah tersebut menjadi destinasi wisata dapat memberikan keuntungan besar bagi negara. Bali menjadi tujuan wisatawan mancanegara terbanyak di Indonesia dengan 583.930 orang pada periode Januari-September 2022 menjadikannya aset penting dalam pertumbuhan ekonomi. Berdasarkan data BPS pada tahun 2021, pengeluaran terbesar wisatawan saat berlibur di Indonesia adalah untuk akomodasi. Untuk memilih akomodasi terbaik, pengunjung akan mencari ulasan online pada situs seperti Tripadvisor untuk memvalidasi keputusan mereka. Namun dengan banyaknya ulasan yang ada, menyaring dan mengumpulkan informasi penting menjadi tugas yang sulit. Penelitian terdahulu mampu menganalisis sentimen ulasan berbahasa Inggris pada level aspek, tetapi tidak mampu dalam menganalisis penyebab didapatkannya polaritas sentimen. Aspek yang didapatkan juga sangat spesifik dan tidak dilakukan pengelompokan.
Pada penelitian ini, digunakan model Span-level Aspect Sentiment Triplet Extraction (Span-ASTE) untuk menganalisis ulasan berbahasa Inggris tentang hotel di Bali. Model ini akan menghasilkan tiga komponen yaitu aspek, sentimen, dan opini. Pada penelitian ini akan dilakukan kategorisasi aspek-aspek yang dihasilkan dengan menggunakan Wu-Palmer Similarity Score.
Hasil yang didapat menunjukkan kemampuan model dalam memprediksi triplet dalam berbagai kompleksitas teks. Dengan hasil f1-score pada kompleksitas terendah bernilai 0,77 dan 0,60 pada kompleksitas tertinggi. Evaluasi terpisah terhadap kemampuan model dalam memprediksi polaritas sentimen menunjukkan hasil yang sangat baik dengan rata-rata f1-score 0,95. Ditemukan bahwa pada hasil prediksi model terdapat perbedaan pemilihan kata dengan dataset yang menyebabkan penurunan pada nilai f1-score, akan tetapi dengan evaluasi kualitatif ditemukan bahwa beberapa hasil prediksi salah masih dapat dirasionalisasi. Kategorisasi pada aspek dengan skor Wu-Palmer menunjukkan hasil yang baik dengan rata-rata skor 0,84 dan menunjukkan kemampuan dalam mengategorisasi aspek dengan hasil memuaskan. Penelitian ini juga menunjukkan kapabilitas dari komponen-komponen yang dibuat dalam mengolah link Tripadvisor menjadi informasi berguna dengan proof of concept yang dilakukan pada ulasan baru.
================================================================================================================================
Indonesia is a country rich with natural resources. Developing these areas into tourist destination can provide a huge benefit to the country. Bali has become the most popular international tourist destination in Indonesia with 583,930 visitors in the period of January-September 2022 making it an important asset in economic growth.
Based on BPS in 2021, the biggest expense when travelling in Indonesia is for accommodation. To choose the right accommodation, a traveler would look through online reviews such as Tripadvisor to validate their decision. However, with the number of online reviews available, filtering and gathering useful important information becomes a challenge. Previous research has been able to conduct an aspect level sentiment analysis on English reviews but has not been able to identify the causes of said sentiment. The results of the aspects are also very specific and not grouped.
In this research, a Span-level Aspect Sentiment Triplet Extraction (Span-ASTE) model will be used to analyze English reviews on hotels in Bali. This model will provide three components which are aspect, sentiment, and opinion. In this research a categorization on the aspects will also be done using Wu-Palmer Similarity Score.
The results achieved showed the model’s capability in predicting the triplets in different complexity of text. With f1-score on the lowest complexity reaching 0.77 and 0.60 on the highest complexity. A separate evaluation is also done on the model’s ability to predict sentiment showing a promising result with the average f1-score of 0.95 for all complexity. The results of the model’s predictions showed some difference in the choosing of words to represent the aspects and opinions, causing the decrease in f1-score, however by analyzing the results it is shown that the predicted results can still be rationalized. The categorization of the aspects using Wu-Palmer shows a pleasing result with the average score of 0.84 and showcasing the categorization of aspects with good results. This research also showcases a proof of concepts of the developed components in its ability to handle new reviews turning it into useful information.

Item Type: Thesis (Other)
Uncontrolled Keywords: Aspect Sentiment Triplet Extraction, Span-ASTE, Tripadvisor, Wu-Palmer Similarity
Subjects: G Geography. Anthropology. Recreation > G Geography (General) > G155 Tourism
Q Science > Q Science (General) > Q325.5 Machine learning.
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Information Technology > Information System > 57201-(S1) Undergraduate Thesis
Depositing User: Ibadurrahman Ziaulhaq
Date Deposited: 26 Jul 2023 15:12
Last Modified: 26 Jul 2023 15:12
URI: http://repository.its.ac.id/id/eprint/99539

Actions (login required)

View Item View Item