PENERAPAN WEIGHTED WORD EMBEDDING PADA PENGKLASIFIKASIAN TEKS BERBASIS RECURRENT NEURAL NETWORK UNTUK LAYANAN PENGADUAN PERUSAHAAN TRANSPORTASI

Rahman, Muhammad David (2020) PENERAPAN WEIGHTED WORD EMBEDDING PADA PENGKLASIFIKASIAN TEKS BERBASIS RECURRENT NEURAL NETWORK UNTUK LAYANAN PENGADUAN PERUSAHAAN TRANSPORTASI. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
05211640000066-Undegraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (2MB) | Request a copy

Abstract

Twitter menjadi salah satu media sosial yang paling sering dan paling populer digunakan oleh perusahaan sebagai penyedia layanan pelanggan perusahaan. Adanya ribuan cuitan yang dapat masuk dalam setiap hari, tentu akan merepotkan operator layanan untuk mengkategorikan jenis berbagai cuitan tersebut, lebih-lebih jika proses pemilahan kategori cuitan harus dilakukan secara manual. Dalam Tugas Akhir ini, kategoriasi cuitan secara otomatis dibangun dan diimplementasi¬kan menggunakan model klasifikasi berbasis recurrent neural network (RNN) yang dikombinasikan dengan model weighted word embedding (WWE). RNN merupakan salah satu jenis jaringan syaraf tiruan yang populer dan banyak digunakan dalam persoalan klasifikasi, sedangkan WWE merupakan metode yang memungkinkan untuk meng¬hubungkan kata-kata yang serupa dengan mengukur jarak semantik antara vektor yang disematkan pada kata tersebut dan memberikan bobot yang berbeda pada setiap kata pada suatu kelas tertentu. Implementasi model penggabungan RNN dan WWE diuji coba menggunakan data pengaduan di perusahaan transportasi untuk data cuitan pada tahun 2015-2016. Hasil uji coba menunjukkan bahwa implementasi WWE baik yang menggunakan model FastText (Weighted FastText) maupun model Word2Vec (Weighted Word2Vec) memberikan hasil yang lebih baik dibandingkan dengan hasil kinerja yang menggabungkan RNN dan model word embedding biasa. Dengan menggunakan metode evaluasi berbasis 10-fold cross validation, model gabungan RNN-Weighted FastText dan RNN-Weighted Word2Vec berturut-turut memberikan hasil akurasi sebesar 88,2% dan 87,5%. Di lain pihak, dengan menggunakan metode evaluasi yang sama, model gabungan RNN-FastText dan RNN-Word2Vec memberikan hasil akurasi yang sama sebesar 83,4%. =============================================================== Twitter is one of the most frequently used platforms by companies as their customer service platform. There are thousands of incoming tweets posted in a day, it will certainly be inconvenient for service operators to categorize the tweets. If the operators still using manual process will certainly require a long time. In this final project, tweet categorization automatically built and implemented using a recurrent neural network (RNN) model which is combined with the weighted word embedding (WWE) model. RNN is one of the most popular and widely used neural network in solving the classification problems, whereas WWE model enables similar words to be associated one each other by measuring the semantic distance between vectors embedded in the word and assign different weight on each word in its particular class. The Implementation of the combined RNN and WWE model was tested using customer complaint data in public transportation company from its twitter account ranging from year 2015 to 2016. The results showed that the implementation using both FastText (weighted FastText) and Word2Vec (weighted Word2Vec) models are better than using the common word embedding model without the weight. By using the evaluation method based on 10-fold cross validation, the combined model of RNN-Weighted FastText and RNN-Weighted Word2Vec gave an accuracy of 88.2% and 87.5%, respectively. On the other hand, using the same evaluation method, both the combined model RNN-FastText and RNN-Word2Vec gave the same accuracy of 83.4%.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: FastText, Klasifikasi teks, Layanan Pengaduan Transportasi, Recurrent Neural Network, Twitter, Weighted Word Embedding, Word2Vec FastText, Recurrent Neural Network, Text Classification, Transportation Customer Service, Twitter, Weighted Word Embedding, Word2Vec
Subjects: H Social Sciences > HF Commerce > HF5415.5 Customer services. Customer relations
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 57201-(S1) Undergraduate Thesis
Depositing User: Muhammad David Rahman
Date Deposited: 24 Aug 2020 05:30
Last Modified: 24 Aug 2020 05:30
URI: http://repository.its.ac.id/id/eprint/79946

Actions (login required)

View Item View Item