Seleksi Fitur Untuk Mendeteksi Social Bot Pada Media Sosial Twitter (Studi Kasus: Kampanye Pemilu Presiden Indonesia 2019)

Pratama, Pandu Gumelar (2020) Seleksi Fitur Untuk Mendeteksi Social Bot Pada Media Sosial Twitter (Studi Kasus: Kampanye Pemilu Presiden Indonesia 2019). Masters thesis, Institut Teknologi Sepuluh November.

[thumbnail of 05211750012017-Master_Thesis.pdf] Text
05211750012017-Master_Thesis.pdf - Accepted Version

Download (2MB)

Abstract

Saat ini media sosial dianggap sebagai sebuah alat bantu yang penting bagi sebuah organisasi untuk berkomunikasi dengan antar pengguna mulai dari meningkatkan popularitas, menampung opini, komentar dan ide, hingga dapat mempengaruhi pengguna lainnya. Salah satu isu terkait pengaruh media sosial adalah pengguaan bot atau social bot yaitu sebuah program terotomatisasi pada social media. Untuk mengatasi masalah mengenai social bot, terdapat beberapa pendekatan untuk mengindetifikasi sebuah bot dari sebuah akun seperti mengecek waktu pembuatan akun dengan menggunakan machine learning.Dengan banyaknya fitur yang ada maka dilakukan pengujian untuk mendapatkan kombinasi fitur yang minimal namun tetap memberikan hasil yang optimal. Pada penelitian ini data yang digunakan berasal dari media sosial Twitter dengan menggunakan studi kasus data pendukung calon presiden Republik Indonesia 2019 yaitu Joko Widodo dan Prabowo Subianto selama masa kampanye, dengan menggunakan dua pendekatan yaitu melalui melalui data dari akun seperti jumlah tweet, jumlah follower dan following dan berasal dari tweet yaitu jumlah retweet, reply dan jumlah hashtag. Pada Penelitian ini digunakan beberapa model algoritma yaitu Support Vector Machine, Random Forest, dan Naïve Bayes. Penelitian ini menggunakan 49 fitur yang terdiri dari 23 fitur yang berasal dari profil dan 26 fitur yang berasal dari tweet. Dari fitur yang sudah dikumpulkan, kemudian dilakukan pengujian terhadap seluruh fitur, lalu diambil sepuluh fitur tertinggi untuk dilakukan uji kombinasi. Uji kombinasi fitur meliputi tiga fokus area yaitu pada profile, tweet dan keduanya. Hasil penelitian ini menghasilkan informasi bahwa umur akun merupakan fitur utama yang paling berkontribusi untuk mendeteksi sebuah social bot dengan keterangan 8620 akun atau 68% dari keseluruhan sampel yang terdeteksi sebagai social bot mempunyai umur akun kurang dari 10 bulan, kemudian fitur yang berasal dari profil memberikan hasil yang baik dengan ROC 0.78 dengan waktu eksekusi enam detik. Terakhir, dari penelitian ini menghasilkan informasi yaitu kombinasi fitur paling optimal antara lain umur akun, friendship (Rasio following dan follower) , followership (Rasio follower dan following), jumlah favourite, dan interestingness (Rasio jumlah tweet dengan jumlah favourite) dengan rata – rata ROC yaitu 0.77 dari model algoritma yang digunakan.
===================================================================================================================================
Nowadays, social media is considered an essential tool for a company to communicate with users or another customer from gaining popularity, getting an opinion, comments, or ideas to affecting other users. One of the issues in social media is the use of bot or social bot, which is an automated program on social media. To solve this problem, there are several approaches to identified one using machine learning by checking features such as account creation date. With the numerous numbers of features, there will be testing to get minimal numbers or features but with the optimal result. In this research, the data that will be used are from social media Twitter using case study from Indonesia 2019 presidential candidates supporter’s Twitter account during campaign period using two approaches which are account level such as tweet counts, following counts and follower counts and from tweet level such as retweet counts, reply counts and number of hashtag used. In this research, some algorithm models will be used, such as Support Vector Machine, Random Forest, and Naïve Bayes. In this research, 49 features will be tested, which consist of 23 features from profile and 26 features from tweet. After feature testing, ten highest contributing features will be chosen and continued with feature combination testing based on three focus area, which are profile, tweet, and both profile and tweet. The results from this research are the features from profile gives a good results with 0.78 ROC and six seconds execution time, then the account age determined as the essential factor of detecting social bot with 8620 accounts or 68% of total accounts that have been labelled as bot have less than 10 months in term of account age. Lastly, the optimum feature combination in this research are account age, friendship (ratio between following and follower), followership (ratio between follower and following), favourite count and interestingness (ratio between tweet count and favourite count) with average ROC score 0.77 from the algorithm model used in this research.

Item Type: Thesis (Masters)
Additional Information: 3100020085152 RTSI 004.678 Pra s-1
Uncontrolled Keywords: Media sosial, Social Bot, Machine Learning
Subjects: H Social Sciences > HM Sociology > HM742 Online social networks.
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Q Science > QA Mathematics > QA76.9 Computer algorithms. Virtual Reality. Computer simulation.
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 59101-(S2) Master Thesis
Depositing User: Pratama Pandu Gumelar
Date Deposited: 22 Dec 2022 06:06
Last Modified: 22 Dec 2022 06:06
URI: http://repository.its.ac.id/id/eprint/74340

Actions (login required)

View Item View Item