Implementasi Algoritma Deteksi Spam Yang Tersisipi Informasi Citra Dengan Metode Svm Dan Random Forest

Wibowo, Agus Tri (2016) Implementasi Algoritma Deteksi Spam Yang Tersisipi Informasi Citra Dengan Metode Svm Dan Random Forest. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
5110100156-Undergraduate Thesis.pdf

Download (2MB) | Preview

Abstract

Email spam dapat didefinisikan sebagai email sampah yang kedatangannya tidak dikehendaki oleh penerima email tersebut. Perkembangan metode deteksi email spam mengikuti perkembangan metode dari para spammer. Mulai deteksi email spam berdasarkan teks dan atribut dari email hingga citra yang terkandung pada email tersebut. Pada Tugas Akhir dilakukan implementasi deteksi spam menggunakan random forest dan SVM berdasarkan fitur tekstur pada citra yang disisipkan pada email. Untuk mengklasifikasikan citra yang spam dengan yang bukan spam diperlukan ekstraksi fitur teksur yang berjumlah total 302 fitur. Karena banyaknya dimensi fitur yang perlu untuk diproses, maka metode PCA digunakan untuk mereduksi dimensi fitur menjadi jauh lebih kecil. Dari hasil uji kinerja didapatkan rata-rata nilai akurasi, precision dan recall 98.64%, 99.02% dan 98.29% untuk random forest serta 97.84%, 98.26% dan 97.43% untuk SVM tanpa melakukan PCA pada dataset Image Spam Hunter (ISH). Jika digunakan PCA nilai-nilai tersebut menjadi 97.28%, 97.69% dan 96.94% untuk random forest serta 97.22%, 98.04% dan 96.53% viii untuk SVM. Jika ditinjau dari waktu komputasi, penggunaan PCA menyebabkan waktu komputasi menjadi 3.10 kali lebih cepat untuk SVM dan 1.82 kali lebih cepat untuk random forest. Sedangkan jika digunakan untuk mendeteksi dataset baru, rata-rata nilai akurasi, precision dan recall untuk SVM didapatkan 81.01%, 84.81% dan 78.82% lebih tinggi dibandingkan random forest dengan rata-rata72.47%, 67.09% dan 75.18%. =============================================================================================== Spam email can be defined as trash email which was not desired by the said email receiver. Development of spam detection follows the development of spammer’s method to spread spam. From spam detection using text body and attribute in the email to image contained within email. This Undergraduate Thesis was proposed to implement spam detection using random forest and SVM by using texture features of image contained within spam.To classify spam images, 302 texture features must be extracted from the said images. To reduce this huge dimension PCA was used. From performance test, it was found that the proposed method resulted average accuracy, precision dan recall of 98.64%, 99.02% and 98.29% for random forest also 97.84%, 98.26% and 97.43% for SVM using Image Spam Hunter (ISH) dataset. If PCA were used those values would become 97.28%, 97.69% and 96.94% for random forest also 97.22%, 98.04% and 96.53% for SVM. By using PCA computation time would become 3.10 times faster for SVM dan 1.82 times faster for random forest. When new dataset were used, the proposed method resulted average accuracy, precision and recall of 81.01%, x 84.81% and 78.82% for SVM and 72.47%, 67.09% dan 75.18% for random forest.

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 005.8 Wib i
Uncontrolled Keywords: spam, email, tekstur, random forest, support vector machine
Subjects: Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Information Technology > Informatics Engineering > (S1) Undergraduate Theses
Depositing User: Mr. Tondo Indra Nyata
Date Deposited: 27 Sep 2017 03:32
Last Modified: 27 Dec 2018 08:40
URI: http://repository.its.ac.id/id/eprint/48877

Actions (login required)

View Item View Item