Perbandingan Performansi Word Embedding Dalam Klasifikasi Konten Palsu Pada Topik Pemilihan Umum 2024

Ummah, Rohmatul (2024) Perbandingan Performansi Word Embedding Dalam Klasifikasi Konten Palsu Pada Topik Pemilihan Umum 2024. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5002201007_Undergraduate_Thesis.pdf] Text
5002201007_Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (4MB) | Request a copy

Abstract

Pemilihan Umum (Pemilu) memiliki peran sentral dalam demokrasi, memberikan hak kepada warga untuk memilih pemimpin dan perwakilan pemerintah. Namun, di era digital dan dominasi media sosial, penyebaran informasi palsu terkait pemilu di Twitter menjadi ancaman serius terhadap integritas demokrasi. Oleh karena itu, penelitian ini bertujuan untuk melakukan perbandingan performansi terhadap metode Word Embedding, seperti Word2vec, FastText, dan IndoBERT, dalam klasifikasi konten informasi palsu terkait Pemilu 2024 di Twitter. Dalam penelitian ini, data hasil preprosessing diproses oleh metode Word Embedding kemudian hasilnya diklasifikasikan menggunakan algoritma klasifikasi seperti Support Vector Machine, Naive Bayes, Logistic Regression, dan Random Forest. Perbandingan dilakukan untuk membandingkan kemampuan representasi dari metode word embedding dengan membandingkan menggunakan uji performansi. Penelitian ini juga bertujuan untuk mengklasifikasi tweet masyarakat terkait isu pemilu, sehingga dapat membedakan antara konten palsu dan fakta. Model Word Embedding yang dibandingkan pada penelitian ini menunjukkan performa yang sangat baik dalam klasifikasi konten palsu di Twitter. Metode Word Embedding yang memberikan performa terbaik adalah IndoBERT dengan klasifikasi algoritma Support Vektor Machine, mencapai akurasi sebesar 0,97 dan F1 Score sebesar 0,97. Penelitian ini memberikan wawasan penting mengenai efektivitas berbagai metode Word Embedding dalam klasifikasi informasi palsu terkait Pemilu, yang dapat menjadi acuan dalam upaya menjaga integritas demokrasi di era digital.

Item Type: Thesis (Other)
Uncontrolled Keywords: Klasifikasi konten palsu, Perbandingan model, Pemilu, Twitter, Word Embedding, Fake content content classification, model comparison , Election, Twitter, Word Embedding
Subjects: J Political Science > JA Political science (General)
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Mathematics > 44201-(S1) Undergraduate Thesis
Depositing User: Rohmatul Ummah
Date Deposited: 08 Aug 2024 01:31
Last Modified: 08 Aug 2024 01:31
URI: http://repository.its.ac.id/id/eprint/114504

Actions (login required)

View Item View Item