Pengembangan Lexicon Emosi Untuk Analisis Sentimen Twitter Bahasa Indonesia, Studi Kasus Covid-19

Wijaya, Gian Ega (2023) Pengembangan Lexicon Emosi Untuk Analisis Sentimen Twitter Bahasa Indonesia, Studi Kasus Covid-19. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111940000214-Undergraduate_Thesis.pdf] Text
05111940000214-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 September 2026.

Download (4MB) | Request a copy

Abstract

Maraknya wabah Covid-19 membuat masyarakat waspada, beberapa hal yang dapat dilakukan untuk mengetahui kondisi masyarakat adalah dengan melakukan sentimen analisis pada sebuah media sosial, salah satu media sosial yang memiliki fitur utama untuk menulis adalah Twitter, dengan menggunakan Twitter masyarakat dibebaskan beropini tentang apapun, dalam konteks Covid-19 tentu banyak masyarakat yang menuliskan opininya ke dalam Twitter, untuk mengetahui bagaimana kondisi sentimen yang ada pada masyarakat pada twitter dapat dilakukan dengan melakukan analisis sentimen, salah satu contoh yang digunakan untuk analisis sentimen adalah klasifikasi emosi menggunakan pendekatan lexicon, pendekatan ini bekerja dengan mencocokkan setiap kata yang ada pada kalimat dengan kamus lexicon, sehingga kata yang terdeteksi sebagai emosi dan emosi yang sering muncul pada kalimat tersebut akan digunakan sebagai cerminan emosi dari kalimat tersebut. Salah satu lexicon yang cukup populer adalah EmoLex, lexicon tersebut menyediakan berbagai pengukuran sentimen hingga emosi, dengan menggunakan data yang diambil dari twitter dan dilakukan pelabelan data, pada tugas akhir ini akan dibuat sebuah lexicon yang dikembangkan menggunakan emolex dan diekspansi menggunakan word embedding meliputi Word2Vec, Fasttext, GloVe dengan mengukur kedekatan makna dari kata yang ada pada lexicon, kedekatan makna dari setiap word embedding dicoba dengan menggunakan beberapa threshold. Setelah lexicon berhasil diekspansi didapatkan lexicon untuk dilakukan klasifikasi pada dataset yang telah diberi label. Dari hasil percobaan didapatkan akurasi tertinggi yaitu 31 % dari lexicon tanpa penambahan EmoLex dan diekspansi menggunakan Word2Vec dengan threshold cosine similarity 0,75
=================================================================================================================================
The rise of the Covid-19 outbreak has made people aware, several things that can be done to find out the condition of society is to do sentiment analysis on social media, one of the social media that has the main feature for writing is Twitter, by using Twitter people are free to have opinions about anything, in the context of Covid-19, of course, many people write their opinions on Twitter, to find out how the sentiment conditions that exist in society on Twitter can be done by conducting sentiment analysis, one example used for sentiment analysis is the classification of emotions using the lexicon approach, this approach works by matching every word in the sentence with the lexicon dictionary, so that words that are detected as emotions and emotions that often appear in the sentence will be used as a reflection of the emotion of the sentence. One lexicon that is quite popular is EmoLex, this lexicon provides various measurements of sentiment to emotion, using data taken from Twitter and data labeling, in this final project a lexicon will be created which will be developed using emolex and expanded using word embedding including Word2Vec, Fasttext, GloVe by measuring the closeness of the meaning of the words in the lexicon, the closeness of the meaning of each embedding word is tried using several thresholds. After the lexicon has been successfully expanded, a lexicon is obtained for classification on the dataset that has been labeled. From the experimental results above, the highest accuracy was obtained, namely 31% of the lexicon without the addition of EmoLex and expanded using Word2Vec with a cosine similarity threshold of 0.75

Item Type: Thesis (Other)
Uncontrolled Keywords: Covid-19, Emolex, Lexicon, Twitter, Word Embedding; Twitter, Lexicon, Word Embedding, Emolex.
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Gian Ega Wijaya
Date Deposited: 11 Aug 2023 01:36
Last Modified: 11 Aug 2023 01:36
URI: http://repository.its.ac.id/id/eprint/103633

Actions (login required)

View Item View Item