Ekstraksi Topik Review Tamu Hotel Menggunakan Latent Dirichlet Allocation dan Non-Negative Matrix Factorization

Patricia, Giovani (2021) Ekstraksi Topik Review Tamu Hotel Menggunakan Latent Dirichlet Allocation dan Non-Negative Matrix Factorization. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06211740000091_Undergraduate_Thesis.pdf] Text
06211740000091_Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (2MB) | Request a copy

Abstract

Tripadvisor dapat berkembang dan menjadi lebih besar dengan adanya ulasan tamu. Ulasan para tamu berpotensi membantu pihak hotel dalam meningkatkan kualitas layanan-nya. Untuk mendapatkan informasi yang bermanfaat bagi peru-sahaan, terdapat banyak cara untuk mengetahui prediksi sentimen tamu dari ulasan yang diberikan salah satunya dengan metode klasifikasi yaitu analisis sentimen menggunakan Naïve Bayes Classifier (NBC) dan dibutuhkan suatu pemodelan topik yang dilakukan dengan metode Latent Dirichlet Allocation (LDA) dan Non-Negative Matrix Factorization (NMF). Sebelum melakukan prediksi dan klasifikasi, data terlebih dahulu dilakukan praproses teks. Jika data menunjukkan imbalanced pada masing-masing kategori, maka dilakukan teknik SMOTE untuk mengatasinya. Data yang digunakan adalah data sekunder yang merupakan data ulasan tamu dari tahun 2015 hingga 2021. Ulasan akan diklasifikasikan menjadi dua kategori sentimen, yaitu sentimen positif dan negatif. Hasil penelitian menunjukkan aplikasi SMOTE pada data dapat meningkatkan nilai ketepatan klasifikasi, serta hasil pemodelan topik menunjukkan metode LDA secara keseluruhan memiliki nilai topic coherence yang lebih baik daripada metode NMF dengan jumlah topik yang terdapat dalam ulasan, Hotel Royal Ambarrukmo sebesar 8 topik positif dan 8 topik negatif, Hotel Novotel sebesar 3 topik positif dan 7 topik negatif, dan Hotel Grand Tjokro sebesar 10 topik positif dan 10 topik negatif. Kesimpulan dari uji topik koherensi menyatakan bahwa model yang dihasilkan dengan metode LDA pada penelitian ini dapat diinterpretasi manusia dengan baik.
=====================================================================================================
Tripadvisor is the world's largest travel platform that provides information about facilities, locations, tourism, and reviews about the hospitality business.The large number of reviews given to guests makes it difficult to read reviews as a whole because it takes a long time. To obtain useful information for the company, review data is processed into useful information by classification and clustering methods, namely sentiment analysis and topic modeling that produce the topics in the review. This study uses three methods, specifically Naïve Bayes Classifier (NBC), Latent Dirichlet Allocation (LDA), and Non-Negative Matrix Factorization (NMF). Before classification, the data is preprocessing and weighting. Reviews generally have imbalanced data in class categories, this study uses SMOTE to overcome imbalanced data. Reviews will be classified into two class categories, namely positive and negative sentiments. The results showed that the application of SMOTE with the NBC method resulted in a better classification accuracy value. The conclusion of the topic coherence test states that the model generated by the LDA method in this study can be interpreted by humans well.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Analisis Sentimen, Pemodelan Topik, Latent Dirichlet Allocation, Naïve Bayes Classifier, Non-Negative Matrix factorization, Sentiment Analysis, Topic Modeling
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning.
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Giovani Patricia
Date Deposited: 02 Sep 2021 14:39
Last Modified: 02 Sep 2021 14:39
URI: http://repository.its.ac.id/id/eprint/91305

Actions (login required)

View Item View Item