Analisis Sentimen Pada Twitter Menggunakan Latent Dirichlet Allocation (LDA) Untuk Mengetahui Opini Publik Terhadap Berita Covid-19

Rizal, Muhammad Fatkhur (2021) Analisis Sentimen Pada Twitter Menggunakan Latent Dirichlet Allocation (LDA) Untuk Mengetahui Opini Publik Terhadap Berita Covid-19. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 09211950053001-Master_Thesis.pdf] Text
09211950053001-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (2MB) | Request a copy

Abstract

Peristiwa Pandemi Covid-19 saat ini telah menjadikan lockdown dibeberapa negara, dan penggunaan media sosial sebagai penyampaian informasi menjadi meningkat. Penyebaran informasi yang tidak akurat tentu menjadi ancaman tersendiri dalam hal pengambilan keputusan publik. Maka dari itu perlu adanya model klasifikasi yang dapat membantu mengetahui opini publik yang lebih baik.
Dalam penelitian ini dilakukan prapengolahan teks pada dataset yang masih berbentuk Bag of Word (BoW) untuk menghilangkan noise sehingga menghasilkan dokumen yang siap untuk dilakukan seleksi ciri menggunakan Part of Speech (POS), dalam proses pelatihan dilakukan menggunakan metode Latent Dirichlet Allocation (LDA) dengan model Gibbs Sampling yang selanjutnya digunakan untuk proses pengujian menggunakan uji validasi 10 fold cross validation.
Dari hasil data pengujian dan pelatihan dengan model klasifikasi POS dan LDA mampu memberikan nilai akurasi sebesar 66%, hasil tersebut lebih tinggi 5,7% dibandingkan klasifikasi tanpa menggunakan POS. Dengan hasil tersebut model klasifikasi ini berkontribusi dalam mengetahui informasi yang tersemat dalam dokumen twitter yang masih berbentuk korpus untuk digunakan sebagai informasi bagi para ahli dan peneliti dalam pengambilan keputusan publik.
==================================================================================================
The current Covid-19 pandemic has led to lockdowns in several countries, and the use of social media as information delivery has increased. Dissemination of inaccurate information is certainly a threat in terms of public decision making. Therefore, there is a need for a classification model that can help determine public opinion better.
In this study, text preprocessing was carried out on a dataset that was still in the form of a Bag of Word (BoW) to remove noise so as to produce documents that were ready for feature selection using Part of Speech (POS), in the training process using the Latent Dirichlet Allocation (LDA) method with Gibbs Sampling model which is then used for the testing process using a 10 fold cross validation test.
From the results of the test and training data with the POS and LDA classification models, it is able to provide an accuracy value of 66%, the result is 5.7% higher than the classification without using POS. With these results, this classification model contributes to finding out the information embedded in the Twitter document which is still in the form of a corpus to be used as information for experts and researchers in making public decisions.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Part-of-Speech, Latent Dirichlet Allocation (LDA), Gibbs Sampling, analisis sentimen, Covid-19. Part-of-Speech, Latent Dirichlet Allocation (LDA), sentiment analysis, Covid-19.
Subjects: Q Science > QA Mathematics > QA402 System analysis.
Divisions: Faculty of Creative Design and Digital Business (CREABIZ) > Technology Management > 61101-(S2) Master Thesis
Depositing User: Muhammad Fatkhur Rizal
Date Deposited: 08 Sep 2021 08:42
Last Modified: 08 Sep 2021 08:42
URI: http://repository.its.ac.id/id/eprint/91805

Actions (login required)

View Item View Item