Deteksi Berita Palsu Otomatis Berbahasa Indonesia Menggunakan BERT

Amiri, Aufa Nabil (2021) Deteksi Berita Palsu Otomatis Berbahasa Indonesia Menggunakan BERT. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
07211740000029-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (5MB) | Request a copy

Abstract

Berita palsu atau yang biasa disebut hoaks adalah suatu yang hal yang sering melanda Indonesia. Dengan adanya sosial media, suatu berita palsu dapat memiliki tingkat penyebaran yang sangat luas. Selain itu, masyarakat Indonesia memiliki tingkat kecende- rungan untuk menyebarkan berita palsu yang cukup tinggi. Se- hingga, suatu metode pendeteksi berita palsu harus ada. Penelitian ini memanfaatkan algoritma BERT yang digunakan untuk mende- teksi apakah suatu berita adalah berita hoaks atau tidak secara otomatis. Dari suatu teks yang mentah, akan dilakukan tokenisasi sebelum akhirnya dimasukkan ke dalam algoritma BERT. Selan- jutnya, keluaran dari BERT akan dijadikan sebagai inputan dari algoritma klasifikasi Linear Regression. Barulah pada saat ini, kita bisa mendapatkan klasifikasi apakah suatu teks itu berupa berita hoaks atau tidak. Tujuan dari penelitian ini adalah untuk membu- at sebuah model yang dapat digunakan untuk melakukan klasifikasi suatu teks apakah termasuk ke dalam berita hoaks atau tidak. Ha- sil dari penelitian ini adalah model yang dapat mendeteksi berita hoaks dengan tingkat akurasi sebesar 89%. ===================================================================================================== Fake news or usually called hoax, is one of things that ofen pla- guing Indonesia. With a social media, a fake news can spread wider and faster than ever before. On another note, Indonesian people ha- ve quite a high tendencies to share fake news. Based on that note, we are in dire need of a method to detect fake news. This research is using BERT method to automatically detect whether a news can be considered as hoax or not. From a raw text, we are doing a toke- nization process before we feed the text to the BERT method. Next, the pooled output of the BERT is being used as the input for Linear Regression, a tested-and-true method for classifying task. Now that we have pass-through all those steps, we can determine whether a text is a hoax or not. The purpose of this research is to create a machine learning model to help the people to determine whether a text can be considered as hoax or not. And the result is a model to classifying a hoax text with the accuracy of 89%.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: BERT, Hoaks, Klasifikasi, Linear Regression, BERT, Hoax, Fake News Classification, Linear Re- gression
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning.
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Computer Engineering > 90243-(S1) Undergraduate Thesis
Depositing User: Aufa Nabil Amiri
Date Deposited: 02 Sep 2021 02:16
Last Modified: 02 Sep 2021 02:16
URI: https://repository.its.ac.id/id/eprint/91367

Actions (login required)

View Item View Item