Analisis Sentimen Berdasar Aspek Review Kuliner dan Restoran Menggunakan Latent Dirichlet Allocation dan Support Vector Machine Untuk Meningkatkan Profitabilitas Bisnis Kuliner dan Restoran di Surabaya

Ajipangestu, Drajad Bima (2021) Analisis Sentimen Berdasar Aspek Review Kuliner dan Restoran Menggunakan Latent Dirichlet Allocation dan Support Vector Machine Untuk Meningkatkan Profitabilitas Bisnis Kuliner dan Restoran di Surabaya. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 0720 Tesis_09211950054002_DrajadBima final.pdf] Text
0720 Tesis_09211950054002_DrajadBima final.pdf - Accepted Version
Restricted to Repository staff only

Download (2MB) | Request a copy
[thumbnail of 0720 Tesis_09211950054002_DrajadBima final.pdf] Text
0720 Tesis_09211950054002_DrajadBima final.pdf - Accepted Version
Restricted to Repository staff only

Download (2MB) | Request a copy
[thumbnail of 09211950054002-Master_Thesis.pdf] Text
09211950054002-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (2MB) | Request a copy

Abstract

Makanan merupakan hal yang selalu dekat dengan kita, seiring dengan berkembangnya jumlah penduduk, bisnis kuliner dan restoran terus berkembang. Di kala Pandemi Covid-19, walaupun banyak orang yang tidak bepergian, tetapi sesekali pasti ingin membeli makanan favorit mereka di luar rumah baik itu beli langsung di tempat maupun online. Dengan semakin bertumbuhnya wisata kuliner dan restoran di Indonesia, persaingan antar pelaku bisnis tersebut semakin tinggi. Maka dari itu pada penelitian ini dilakukan analisa sentiment review pelanggan yang mereka tulis di media sosial untuk mendapatkan aspek kuliner dan restoran yang paling berpengaruh dan memiliki sentimen positif tinggi dari pelanggan di Surabaya. Penelitian ini melakukan analisis sentimen review kuliner dan restoran di Surabaya dan bertujuan untuk mendapatkan strategi peningkatkan profitabilitas restoran yang ada di Surabaya. Setiap tweet mengenai kuliner dan restoran akan dikumpulkan sebagai data dan dikategorikan menjadi empat aspek yang kami tentukan yaitu: Price, Taste, Place dan Service.
Dalam penelitian ini, data Twitter akan diambil menggunakan Twitter API dan disimpan dalam format JSON. Selanjutnya, akan dilakukan preprocessing. Kemudian dilakukan kategorisasi aspek dengan menggabungkan metode Latent Dirichlet Allocation (LDA) dan semantic similarity untuk meng-kategorisasikan dokumen kedalam 4 aspek kuliner (Price, Taste, Place dan Service). Kemudian dalam menghitung Semantic Similatiry, term list akan diperluas dengan menggunakan metode Term Frequency-Inverse Cluster Frequency (TF-ICF). Setelah itu masuk ke tahap klasifikasi dengan Word Embedding untuk mengekstrak ekstraksi fitur menggunakan metode Global Vector for Word Representation (GloVe). Klasifikasi yang digunakan pada penelitian ini adalah dengan menggunakan Support Vectorc Machine (SVM) dengan 3 modifikasi parameter dari metode SVM yaitu C-SVC, SVC Linear, SVCnu dengan berbagai perubahan kernel untuk mendapatkan hasil terbaik. Analisa sentimen dalam penelitian ini akan membandingkan antara klasifikasi sentimen dengan menggunakan 3 metode perubahan SVM dan Klasifikasi tambahan menggunakan SentiCircle. Performa skenario terbaik untuk analisa sentimen akan diaplikasikan.
Performa dari setiap metode dievaluasi menggunakan precision, recall dan F1-Measure. Hasil dari uji coba menunjukkan bahwa performa kategorisasi aspek tertinggi dilakukan dengan melakukan penggabungan metode Latent Dirichlet Allocation (LDA) untuk mencari hidden topic, digabungkan dengan Term Frequency-Inverse Cluster Frequency (TF-ICF) 100% untuk peluasan term dan Semantic Similarity untuk kategorisasi aspek yang mendapatkan hasil performa hingga mencapai 91% dan performa Word Embedding untuk representasi angka vector dengan GloVe dan SVM nuSVC dengan kernel RBF dan perubahan parameter nu 0.1 untuk klasifikasi sentimen mendapatkan performa mencapai 88%. Sehingga, peneliti melakukan penggabungan metode LDA+TF-ICF 100% + Semantic Similarity untuk melakukan kategorisasi aspek dan menggunakan GloVe+SVM NuSVC 0.1 untuk melakukan klasifikasi sentimen pada setiap review. Kemudian, pada evaluasi akhir yang dilakukan, peneliti mendapatkan bahwa aspek service pada kuliner dan restoran memiliki review dengan sentiment negative tinggi yang mencapai 10,869% dibanding dengan sentiment review pada aspect lainnya (price: 4.348, taste: 6.522, place: 4.521) sehingga pemilik bisnis kuliner perlu melakukan perbaikan-perbaikan untuk lebih memperhatikan pelayanan pelanggan dengan tujuan untuk mengurangi jumlah review negative pada aspect service tersebut. Hasil juga menunjukkan bahwa perubahan sentiment (pada positive atau negative sentiment) dipengaruhi oleh aspect yang dimiliki oleh setiap review. Analisa sentimen dari review terhadap aspek kuliner dan restoran dilakukan untuk membantu manajer bisnis atau pemilik usaha kuliner melakukan perbaikan layanan dalam tujuan untuk peningkatan profitabilitas restoran di Surabaya.
====================================================================================================
Food is something that is always close to us, along with the growing population, the culinary and restaurant business continues to grow. During the Covid-19 Pandemic, although many people don't travel, sometimes they definitely want to buy their favorite food outside the home, whether it's buying directly on the spot or online. With the growing growth of culinary tourism and restaurants in Indonesia, the competition between these business actors is getting higher. Therefore, in this study, an analysis of the customer review sentiments they wrote on social media was carried out to get the most influential culinary and restaurant aspects and have high positive sentiment from customers in Surabaya. This study analyzes the sentiment analysis of culinary and restaurant reviews in Surabaya and aims to obtain a strategy to increase the profitability of restaurants in Surabaya. Every tweet about culinary and restaurant will be collected as data and categorized into four aspects that we determine, namely: Price, Taste, Place and Service.
In this study, Twitter data will be retrieved using the Twitter API and stored in JSON format. Next, preprocessing will be carried out. Then the aspect categorization is carried out by combining the Latent Dirichlet Allocation (LDA) and semantic similarity methods to categorize the document into 4 culinary aspects (Price, Taste, Place and Service). Then in calculating Semantic Similatiry, the term list will be expanded using the Term Frequency-Inverse Cluster Frequency (TF-ICF) method. After that, enter the classification stage with Word Embedding to extract feature extraction using the Global Vector for Word Representation (GloVe) method. The classification used in this study is to use the Support Vectorc Machine (SVM) with 3 modifications to the parameters of the SVM method, namely C-SVC, SVC Linear, SVCnu with various kernel changes to get the best results. Sentiment analysis in this study will compare sentiment classification using 3 methods of changing SVM and additional classification using SentiCircle. The best scenario performance for sentiment analysis will be applied.
The performance of each method was evaluated using precision, recall and F1-Measure. The results of the trial show that the highest aspect categorization performance is carried out by combining the Latent Dirichlet Allocation (LDA) method to find hidden topics, combined with Term Frequency-Inverse Cluster Frequency (TF-ICF) 100% for term extension and Semantic Similarity for aspect categorization. which got performance results up to 91% and Word Embedding performance for vector number representation with GloVe and SVM nuSVC with RBF kernel and parameter changes to nu 0.1 for sentiment classification got performance reaching 88%. Thus, the researchers combined the LDA+TF-ICF 100% + Semantic Similarity method to categorize aspects and used GloVe+SVM NuSVC 0.1 to classify sentiments for each review. Then, in the final evaluation carried out, the researcher found that the service aspect in culinary and restaurant has a review with a high negative sentiment that reaches 10.869% compared to sentiment reviews on other aspects (price: 4,348, taste: 6,522, place: 4,521) so that business owners culinary needs to make improvements to pay more attention to customer service with the aim of reducing the number of negative reviews on this service aspect. The results also show that changes in sentiment (on positive or negative sentiment) are influenced by the aspect of each review. Sentiment analysis from reviews of culinary and restaurant aspects is carried out to help business managers or culinary business owners make service improvements in order to increase the profitability of restaurants in Surabaya.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Twitter, Restoran, Analisis review, Kuliner, Kategorisasi Aspek, Klasifikasi sentimen, TF-ICF, LDA, GloVe, SVM. ==================================================== Twitter, Restaurant, Review analysis, Culinary, Aspect Categorization, Sentiment classification, TF-ICF, LDA, GloVe, SVM.
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
T Technology > T Technology (General) > T57.8 Nonlinear programming. Support vector machine. Wavelets. Hidden Markov models.
T Technology > T Technology (General) > T58.5 Information technology. IT--Auditing
Divisions: Faculty of Creative Design and Digital Business (CREABIZ) > Technology Management > 61101-(S2) Master Thesis
Depositing User: Drajad Bima Ajipangestu
Date Deposited: 06 Aug 2021 02:52
Last Modified: 06 Aug 2021 02:52
URI: http://repository.its.ac.id/id/eprint/84978

Actions (login required)

View Item View Item