Penggunaan Embedding BERT dan Keras dengan Metode CNN Untuk Mendeteksi Body-Shaming Pada Twitter Berbahasa Indonesia

Takariputra, Bayu Satria (2024) Penggunaan Embedding BERT dan Keras dengan Metode CNN Untuk Mendeteksi Body-Shaming Pada Twitter Berbahasa Indonesia. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111640000101-Undergraduate_Thesis.pdf] Text
05111640000101-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 July 2026.

Download (1MB) | Request a copy

Abstract

Twitter adalah salah satu media sosial yang memungkinkan penggunanya untuk berbagi pesan berbasis teks yang biasa dikenal dengan sebutan tweet, dan berinteraksi dengan sesama penggunananya seperti mengikuti akun pengguna Twitter yang lain, memberikan tanda suka atau like kepada tweet orang lain, serta membalas atau membagikan tweet yang ditulis oleh orang lain. Dalam penggunaannya, Twitter kerap kali digunakan sebagai sarana untuk membagikan berita, informasi, ide, serta pandangan politik. Namun, kasus perundungan atau bullying secara online juga tidak lepas dari platform media sosial ini, salah satu contohnya adalah body-shaming atau penghinaan terhadap kondisi fisik orang lain. Penelitian ini akan melakukan deteksi body-shaming pada platform Twitter. Pertama, penelitian ini akan mengambil data tweet berbahasa Indonesia dalam kurun waktu tertentu. Kemudian, akan dilakukan text pre-processing untuk mengambil kata kunci tertentu berdasarkan data tweet yang sudah tersedia. Selanjutnya, dengan menggunakan embedding BERT (Bidirectional Encoder Representations from Transformer) dan Keras dengan model CNN (Convolutional Neural Network), maka masing-masing tweet dapat digolongkan ke dalam kategori body-shaming atau bukan. Hasil yang didapatkan dalam penelitian ini adalah nilai akurasi sebesar 73,97% untuk embedding BERT dan 76,71% untuk embedding Keras.
====================================================================================================================================
Twitter is a social media that allows its users to share text-based messages commonly known as tweet and interact with fellow users such as following other Twitter user accounts, giving likes or likes to other people's tweets, and replying or sharing tweets that are written by someone else. In its use, Twitter is often used to share news, information, ideas, and political views. However, cases of bullying or bullying online also cannot be separated from this social media platform, one example is body-shaming or insulting the physical condition of other people. This research will detect body-shaming on the Twitter platform. First, this research will retrieve Indonesian language tweet data in a certain period. Then, text pre-processing will be carried out to retrieve certain keywords based on the available tweet data. Furthermore, by using BERT (Bidirectional Encoder Representations from Transformer) and Keras Embedding with CNN (Convolutional Neural Network) model, each tweet can be classified into the category of body-shaming or not. The results obtained in this research were an accuracy value of 73.97% for the BERT embedding and 76.71% for the Keras embedding.

Item Type: Thesis (Other)
Uncontrolled Keywords: BERT, Body-shaming, CNN, Keras, Pra-pemrosesan Teks, Twitter; BERT, Body-shaming, CNN, Keras, Text Pre-processing, Twitter
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Bayu Satria Takariputra
Date Deposited: 20 Feb 2024 01:33
Last Modified: 20 Feb 2024 01:33
URI: http://repository.its.ac.id/id/eprint/107609

Actions (login required)

View Item View Item