Deteksi Spam pada Hasil Pencarian Media Sosial Instagram Menggunakan Convolutional Neural Network

Lazuardy, Wildan Fajria (2019) Deteksi Spam pada Hasil Pencarian Media Sosial Instagram Menggunakan Convolutional Neural Network. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111340000116_Undergraduate-Theses.pdf] Text
05111340000116_Undergraduate-Theses.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (1MB) | Request a copy

Abstract

Instagram merupakan media sosial untuk berbagi momen dalam bentuk foto maupun video yang kini tengah banyak diminati. Pada pertengahan tahun 2017 tercatat bahwa terdapat lebih dari 45 juta orang di Indonesia merupakan pengguna aktif di Instagram. Namun popularitas dari Instagram juga banyak dimanfaatkan oleh pihak-pihak tertentu untuk menyebarkan kiriman spam demi kepentingan pribadi mereka. Oleh karena itu, diperlukan sebuah sistem untuk mendeteksi spam yang terdapat pada Instagram untuk menyaring informasi yang memang berguna dan diharapkan oleh para pengguna Instagram.
Data masukan pada tugas akhir ini diambil dengan metode webcrawling dan didapatkan 8000 kiriman Instagram. Data kemudian dipisah sesuai dengan tipe datanya yaitu teks dan citra. Algoritma yang digunakan untuk proses training data adalah algoritma Convolutional Neural Network (CNN). Terdapat empat model CNN yang dibangun yaitu model 3-layer, 5-layer, AlexNet, dan VGG16. Jumlah data yang digunakan dalam proses training sebanyak 7600 data sedangkan data yang digunakan untuk proses testing berjumlah 400 data. Selanjutnya dilakukan penghitungan nilai akurasi dari model-model yang telah dibangun dengan cara menggabungkan hasil prediksi dari model data citra dan teks.
Dari hasil uji coba didapatkan nilai akurasi tertinggi sebesar 98,5% yang diperoleh dari model 5-layer dengan menggunakan dimensi kernel sebesar 2x2 pixel. Hasil uji coba juga menunjukkan bahwa penggabungan nilai prediksi pada data citra dan teks dapat meningkatkan nilai akurasi yang dihasilkan.
================================================================================================
Instagram is a social media that allows its users to share their moments through photos and videos. In recent years, Instagram has become very popular social media and has billion users throughout the world. In mid of 2017, it was announced that Instagram has more than 45 million users in Indonesia. But the popularity of Instagram also causes spam posts flooding. Therefore, it is necessary to make a spam detection system to filter posts data so users can find useful and related information in Instagram.
We use webcrawling method to take 8000 post data from Instagram. Each post has two category: text and image, and each category will be trained separately. There are four types of CNN models that will be used in this theses namely 3-layer, 5-layer, AlexNet, and VGG16 model. Each class of those data will be predicted by combining the value of its image and text prediction.
The result shows that the best accuracy of our model is 98.5%. It is obtained by using 5-layer model with 2x2 pixels kernel dimension. The test results also show that combining prediction values on image and text data can increase the accuracy.

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 005.8 Laz d-1 2018
Uncontrolled Keywords: Instagram, deep learning, convolutional neural network, spam detection
Subjects: Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
T Technology > T Technology (General) > T58.5 Information technology. IT--Auditing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Lazuardy Wildan Fajria
Date Deposited: 23 Oct 2021 08:32
Last Modified: 23 Oct 2021 08:32
URI: http://repository.its.ac.id/id/eprint/61435

Actions (login required)

View Item View Item