Analisis Sentimen Teks Bahasa Indonesia Pada Media Sosial Menggunakan Algoritma Convolutional Neural Network ( Studi Kasus : Operator Telekomunikasi )

Afnandika, Adrian (2018) Analisis Sentimen Teks Bahasa Indonesia Pada Media Sosial Menggunakan Algoritma Convolutional Neural Network ( Studi Kasus : Operator Telekomunikasi ). Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
05211440000134-Undergraduate_Theses.pdf - Published Version
Restricted to Repository staff only

Download (3MB) | Request a copy

Abstract

Dewasa ini media sosial merupakan salah satu media untuk membagikan informasi secara cepat. Sebagian besar informasi yang tersebar dalam media sosial dapat berupa pendapat individu terhadap sebuah objek tertentu yang disebut sebuah sentimen. Umunya terdapat dua macam sentimen yaitu sentimen positif maupun negatif. Hal ini dapat dimanfaatkan untuk mendapatkan insight terkait objek tersebut. Industri telekomunikasi saat ini semakin berkembang di Indonesia dimana memiliki banyak pengguna. Tidak sedikit pengguna tersebut mengungkapkan pendapatnya terkait layanan atau produk dari operator telekomunikasi di indonesia. Dari fenomena tersebut analisis sentimen dapat dilakukan untuk mendapatkan insight dari objek yang akan di analisis. Namun dalam penerapanya analisis sentimen membutuhkan algoritma yang dapat melakukan klasifikasi pendapat. Dalam penelitian sebelumnya membandingkan beberapa algoritma untuk melakukan analisis sentimen dalam berbahasa inggris. CNN (Convolutional Neural Network) merupakan algoritma yang memiliki akurasi terbaik dibandingkan algoritma lain, sehingga dalam penelitian ini menggunakan algoritma tersebut untuk melakukan analisis sentimen dalam berbahasa indonesia. Dalam penerapanya CNN membutuhkan input vektor kata agar dapat ditraining menjadi suatu model, sehingga dalam penelitian ini menggunakan dua macam library yaitu word2vec dan fasttext. Data yang digunakan berjumlah 11.659, dengan pembagian label data sebagai berikut, label sangat positif adalah 2.310 tweets, label positif 2.352 tweets, label netral 2.328 tweets, label negatif 2.344 tweets dan label sangat negatif 2.325 tweets. Hasil terbaik merupakan CNN dengan label positif dan negatif dengan tingkat akurasi 96.80 %. Filter region size sangat mempengaruhi untuk meningkatkan akurasi model. Selain itu penggunaan learning algorithm word embedding memiliki pengaruh besar terhadap akurasi model. Penggunaan parameter model dengan tepat dapat meningkatkan akurasi hingga 11.07 %. ============== Today social media is one of the media to share information quickly. Most of the information spread in social media can be an individual's opinion of a particular object called a sentiment. There are two kinds of sentiments that are positive and negative sentiments. It can be used to get insight related to the object. The telecommunication industry is now growing in Indonesia where has many users. Not a few users are expressing opinions related to services or products from telecom operators in Indonesia. From that phenomenom, sentiment analysis can be done to get the insight of the object to be in the analysis. However, in the application of sentiment analysis requires an algorithm that can classify opinions. In a previous study comparing several algorithms to perform sentiment analysis in English. CNN (Convolutional Neural Network) is an algorithm that has the best accuracy compared to other algorithms, so in this study using the algorithm to perform sentiment analysis in Indonesian language. In implementing CNN requires word vector input to be trained into a model, so in this study using two kinds of libraries namely word2vec and fasttext.. The data used amounted to 11,659, with the data label distribution as follows, the very positive label is 2,310 tweets, positive label 2,352 tweets, neutral label 2,328 tweets, negative label 2,344 tweets and very negative label 2,325 tweets. The best result is CNN with positive and negative label with 96.80% accuracy. The filter region size greatly influences to improve model accuracy. In addition, the use of learning algorithm word embedding has a major influence on the accuracy of the model. Proper use of model parameters can increase accuracy by up to 11.07%.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Analisis Sentimen, Klasifikasi, Convolutional Neural Network, Industri Telekomunikasi, Sentiment Analysis, Classification, Convolutional Neural Network, Telecommunication Industry, sentiment information, individual's opinion, classify opinions.
Subjects: H Social Sciences > HM Sociology > HM742 Online social networks.
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Q Science > QA Mathematics > QA9.58 Algorithms
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Information and Communication Technology > Information Systems > (S1) Undergraduate Theses
Depositing User: Afnandika Adrian
Date Deposited: 26 Sep 2018 04:39
Last Modified: 26 Sep 2018 04:39
URI: http://repository.its.ac.id/id/eprint/52636

Actions (login required)

View Item View Item