Deteksi Hate Speech Menggunakan Long-Short Term Memory (LSTM) dan Gate Recurrent Unit (GRU) di Twitter Berbahasa Indonesia

Irsyad, Akhmad (2020) Deteksi Hate Speech Menggunakan Long-Short Term Memory (LSTM) dan Gate Recurrent Unit (GRU) di Twitter Berbahasa Indonesia. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 052850010014-Master_Thesis.pdf]
Preview
Text
052850010014-Master_Thesis.pdf - Accepted Version

Download (4MB) | Preview

Abstract

Hate speech adalah penggunaan bahasa yang agresif, kasar atau ofensif yang menargetkan kelompok atau orang tertentu, yang menyerang jenis kelamin (seksisme), kelompok etnis atau ras (rasisme) atau keyakinan dan agama. Teknologi media sosial memungkinkan pesan untuk dikirim dengan cepat, menjadi luas dan bahkan viral jika topik tersebut menarik perhatian publik. Sayangnya, ini juga berarti bahwa Hate speech dapat menyebar dengan mudah dan cepat sehingga dapat menyebabkan konflik antar kelompok dalam masyarakat, maka dari itu peneliti mencoba mendeteksi hate speech berbahasa indonesia yang ada di media sosial khususnya Twitter. Penelitian ini dilakukan dengan menggunakan twitter sebagai sumber datanya. Dalam penelitian ini peneliti mencoba membandingkan metode word embedding yang telah ada seperti countinous Bag-Of-Word (CBOW), skip-gram dan Embeddings from Language Models (ELMo). Tujuan dari penelitian ini adalah dapat dapat mendeteksi hate speech yang menggunakan bahasa Indnesia dengan menggunakan metode deep learning seperti Long-Short Term Memory (LSTM) dan Gate Recurrent Unit (GRU). Dari penelitian yang dilakukan di peroleh hasil Dari semua percobaan yang dilakukan percobaan GRU-Skipgram adalah percobaan dengan F1-score terbesar dengan nilai 94.67%. dan recall terbesar adalah GRU-Skipgram dengan nilai recall 99.09%. GRU-CBOW memiliki precision terbesar dengan nilai 90.96%.
=================================================================================================================================
Hate speech is the use of aggressive, abusive, or offensive language that targets certain groups or people who attack gender (sexism), ethnic or racial groups (racism) or beliefs, and religion. Social media technology allows messages to be sent quickly, to be broad, and even viral if the topic attracts public attention. Unfortunately, this also means that Hate speech can spread easily and quickly so that it can cause conflict between groups in society. Therefore researchers try to detect Indonesian hate speeches on social media, especially Twitter. This research was conducted using Twitter as the data source. In this study, researchers tried to compare existing word embedding methods such as continuous Bag-Of-Word (CBOW), skip-gram, and Embeddings from Language Models (ELMo). The purpose of this research is to be able to detect hate speech using the Indonesian language by using deep learning methods such as Long-Short Term Memory (LSTM) and Gate Recurrent Unit (GRU). From the research conducted in the results obtained from all experiments conducted GRU-Skipgram experiments are experiments with the largest F1-score with a value of 94.67%. and the largest recall is GRU-Skipgram with a recall value of 99.09%. GRU-CBOW has the greatest precision with a value of 90.96%.

Item Type: Thesis (Masters)
Additional Information: RTSI 006.312 Irs d-1 2020
Uncontrolled Keywords: Hate Speech, Deep Learning, Word Embedding, Bag-Of-Word (CBOW), skip-gram, Embeddings from Language Models (ELMo), Long-Short Term Memory (LSTM), Gate Recurrent Unit (GRU)
Subjects: Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 59101-(S2) Master Thesis
Depositing User: akhmad irsyad
Date Deposited: 12 Mar 2025 04:29
Last Modified: 12 Mar 2025 04:29
URI: http://repository.its.ac.id/id/eprint/74007

Actions (login required)

View Item View Item