Deteksi Ujaran Kebencian Dan Klasifikasi Dugaan Unsur Tindak Pidana Pada Twitter Menggunakan Hybrid Vocabulary Graph Convolutional Network

Ghozali, Imam (2023) Deteksi Ujaran Kebencian Dan Klasifikasi Dugaan Unsur Tindak Pidana Pada Twitter Menggunakan Hybrid Vocabulary Graph Convolutional Network. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6025211021-Master_Thesis.pdf] Text
6025211021-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2025.

Download (3MB) | Request a copy

Abstract

Hate speech atau ujaran kebencian yang dilakukan secara daring merupakan dampak buruk dari perkembangan media sosial. Ujaran kebencian adalah bentuk komunikasi yang kasar, mengintimidasi, melecehkan seseorang atau sekelompok orang. Hal tersebut dapat menimbulkan dampak yang merugikan baik secara langsung maupun tidak langsung terhadap orang atau kelompok lain. Telah banyak penelitian mengenai ujaran kebencian namun belum ada yang menghubungkan ujaran kebencian dengan klasifikasi tindak pidana. Penelitian ini mengusulkan deteksi ujaran kebencian dan klasifikasi dugaan unsur tindak pidana pada Twitter dengan menggunakan hybrid vocabulary graph convolutional network (VGCN). Pada penelitian ini VGCN embedding digabungkan dengan BERT embedding untuk membangun word embedding baru. Hasil dari word embedding tersebut selanjutnya dimasukkan ke dalam bidirectional gate recurrent unit (BiGRU) yang dikombinasikan dengan convolutional neural network (CNN) sebagai metode klasifikasi. Terdapat tiga klasifikasi yang dilakukan pada penelitian ini, pertama dilakukan deteksi ujaran kebencian (hate/non-hate), selanjutnya dilakukan klasifikasi kategori ujaran kebencian (hs_religion, hs_race, hs_physical, hs_gender, hs_other), dan klasifikasi terakhir adalah klasifikasi level ujaran kebencian (hs_weak, hs_moderate, hs_strong). Setelah tiga model klasifikasi selesai dibangun, model tersebut dapat digunakan untuk menentukan dugaan unsur tindak pidana berdasarkan pasal yang dilanggar. Hasil percobaan menunjukkan bahwa metode yang diusulkan hybrid VGCN mampu mengungguli metode yang lain pada deteksi ujaran kebencian, namun tidak lebih baik dibandingkan dengan metode lain pada klasifikasi kategori dan level ujaran kebencian. Penambahan VGCN pada model deep learning mampu memberikan hasil lebih baik dibandingkan deep learning tanpa VGCN pada seluruh percobaan yang dilakukan. Penentuan dugaan pasal yang dilanggar dapat menggunakan model hybrid VGCN (HD5) untuk deteksi ujaran kebencian, fine-tuning BERT (HC2) untuk klasifikasi kategori ujaran kebencian dan fine-tuning BERT (HLC2) untuk klasifikasi level ujaran kebencian
=============================================================================================================================
Online hate speech is a negative impact on internet-based social media development. Hate speech is a form of communication that is rude, intimidating, and harassing a person or group. Hate speech can adversely impact either directly or indirectly other people or groups. There have been many studies on hate speech, but no one has connected hate speech with the classification of criminal acts. This study proposed detecting hate speech and classifying alleged criminal elements on Twitter using a hybrid vocabulary graph convolutional network (VGCN). This research combined VGCN embedding with BERT embedding to build a new word embedding. The word embedding results entered into a bidirectional gate recurrent unit (BiGRU) combined with a convolutional neural network (CNN) as a classification method. There were three classifications carried out in this study. The first classification was detecting hate speech, which contains two classes, hate and non-hate. Then the classification of hate speech categories: hs_religion, hs_race, hs_physical, hs_gender, hs_other. The last classification was hate speech levels hs_weak, hs_moderate, and hs_strong. Then, after three classification models have been built, these models can be used to determine the alleged elements of a crime based on the violated article. The experimental results showed that the proposed VGCN hybrid method could outperform other methods in detecting hate speech. However, the proposed model was not better than other methods in classifying categories and levels of hate speech. In addition, adding VGCN to the deep learning model could provide better results than deep learning without VGCN in all experiments conducted. Determination of alleged infringed articles could employ the hybrid VGCN model (HD5) for hate speech detection, fine-tuning BERT model (HC2) for hate speech categorization, and fine-tuning BERT model (HLC2) for hate speech level classification

Item Type: Thesis (Masters)
Uncontrolled Keywords: BERT, BiGRU, CNN, tindak pidana, ujaran kebencian, VGCN, BERT, BiGRU, CNN, hate speech, criminal act, VGCN.
Subjects: Q Science > QA Mathematics > QA166 Graph theory
Q Science > QA Mathematics > QA336 Artificial Intelligence
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: Imam Ghozali
Date Deposited: 01 Feb 2023 03:14
Last Modified: 01 Feb 2023 03:14
URI: http://repository.its.ac.id/id/eprint/95937

Actions (login required)

View Item View Item