Analisis Sentimen Teks Berbahasa Indonesia Pada Media Sosial Menggunakan Universal Language Model Fine-Tuning (ULMFiT) Studi Kasus: E-Commerce

Nawangsari, Andira Gita (2019) Analisis Sentimen Teks Berbahasa Indonesia Pada Media Sosial Menggunakan Universal Language Model Fine-Tuning (ULMFiT) Studi Kasus: E-Commerce. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05211540000051-Undergraduate_Thesis.pdf] Text
05211540000051-Undergraduate_Thesis.pdf

Download (4MB)
[thumbnail of 05211540000051-Undergraduate_Thesis.pdf]
Preview
Text
05211540000051-Undergraduate_Thesis.pdf

Download (4MB) | Preview

Abstract

Berdasarkan survey dari Asosiasi Penyelenggara Jasa Internet Indonesia (APJII) pada tahun 2017[1], 54,68% penduduk Indonesia, atau setara dengan 143,26 juta jiwa, telah terpapar oleh internet. Angka ini meningkat dibandingkan tahun sebelumnya. Salah satu layanan yang paling sering diakses oleh pengguna internet adalah media sosial yang diakses oleh sebanyak 87,13% pengguna internet. Memberikan penilaian dan ulasan terhadap produk dan layanan yang telah dipakai pun seringkali dilakukan oleh pengguna media sosial. Selain itu, dalam melakukan pengambilan keputusan, mengetahui pendapat orang lain merupakan salah satu faktor penentu dalam apa keputusan yang akan diambil oleh sebagian besar dari pengguna media sosial. Salah satu objek yang tak luput dalam penilaian dari pengguna media sosial adalah e-commerce. Pertumbuhan online shopper di Indonesia sendiri selalu naik dari tahun ke tahun, dan diperkirakan mencapai angka 11,9% dari total populasi di Indonesia pada tahun 2018. Adanya fakta ini mendorong untuk dilaksanakannya proses analisis sentimen berdasarkan data yang tersedia pada media sosial, khususnya Twitter. Untuk melakukan analisis sentimen tersebut, pada tugas akhir ini digunakanlah ULMFiT atau Universal Language Model Fine-tuning yang merupakan metodologi untuk memanfaatkan transfer learning pada pengolahan bahasa alami agar didapatan hasil klasifikasi yang memuaskan hanya dengan dataset yang kecil. Pada penelitian ini, diguanakan tiga jenis skenario untuk pembuatan pretrained model, empat jenis pada proses fine-tuning, dan delapan jenis pada pembuatan classifier dengan tiga jenis subtask. Performa pretrained model diperoleh dari model dengan menggunakan data twitter sebagai sumbernya, dengan akurasi 53%. Sedangkan fine-tuning memiliki performa terbaik pada akurasi 62% menggunakan skenario full dan discriminative learning rates. Pada klasifikasi pada dua jenis kelas, yaitu positif dan negatif, diperoleh akurasi terbaik 95.76% dengan skenario full, pada klasifikasi dengan tiga kelas termasuk kelas netral, diperoleh akurasi 80.86% dengan skenario full discr, dan pada klasifikasi dengan lima kelasi diperoleh akurasi 80.56% pada skenario full. =================================================================================================================================
Based on a survey of the Indonesian Internet Service Providers Association (APJII) in 2017[1], 54.68% of Indonesia's population, or equivalent to 143.26 million people, has been exposed to the internet. This number increased compared to the previous year. One of the most frequently accessed services by internet users is social media which is accessed by 87.13% of internet users. Providing ratings and reviews of products and services that have been used is often done by users of social media. In addition, in making decisions, knowing the opinions of others is one of the determining factors in what decisions will be made by the majority of social media users. One object that does not escape the assessment of social media users is e-commerce. The growth of online shopper in Indonesia itself always increases from year to year, and is estimated to reach 11.9% of the total population in Indonesia in 2018. This fact encourages the implementation of sentiment analysis process based on available data on social media, especially Twitter. To carry out this sentiment analysis, ULMFiT or Universal Language Fine-tuning Model is used as a methodology to utilize transfer learning in natural language processing so that satisfactory classification results are obtained with only a small dataset. In this study, three types of scenarios were used for the manufacture of pretrained models, four types of fine-tuning processes, and eight types in making classifiers with three types of subtasks. The pretrained model performance was obtained from the model using Twitter data as the source, with 53% accuracy. While fine-tuning has the best performance on 61.73% accuracy using ‘full’ and ‘discriminative learning rates’ scenario. On the classification of two types of classes: positive and negative, obtained the best accuracy 95.76% with ‘full’ scenario, on the classification of three classes, including a class of neutral, obtained accuracy of 80.86% with ‘full discr’ scenario, and on the classification with five classes was obtained accuracy of 80.56% with ‘full’ scenario.

Item Type: Thesis (Other)
Additional Information: RSSI 004.678 Naw a-1 2019
Uncontrolled Keywords: Analisis, sentimen, twitter, e-commerce, NLP, pretrained model, ULMFiT
Subjects: T Technology > T Technology (General)
T Technology > T Technology (General) > T11 Technical writing. Scientific Writing
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Information and Communication Technology > Information Systems > 57201-(S1) Undergraduate Thesis
Depositing User: Andira Gita Nawangsari
Date Deposited: 22 Mar 2024 03:05
Last Modified: 22 Mar 2024 03:05
URI: http://repository.its.ac.id/id/eprint/64488

Actions (login required)

View Item View Item