Deteksi Depresi Berdasarkan Data Twitter Menggunakan Convolutional Neural Network

Salbari, Faris (2019) Deteksi Depresi Berdasarkan Data Twitter Menggunakan Convolutional Neural Network. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111440000119-Faris_Salbari-Undergraduate_Theses.pdf] Text
05111440000119-Faris_Salbari-Undergraduate_Theses.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2022.

Download (1MB) | Request a copy

Abstract

Twitter adalah layanan jejaring sosial yang memiliki pengguna cukup banyak di Indonesia. Karena Twitter berbentuk microblogging, pengguna banyak memanfaatkannya untuk bercerita tentang masalah di kehidupan sehari-harinya. Dari tweet ini dapat dideteksi apakah pengguna ada indikasi depresi atau tidak.
Data yang digunakan pada tugas akhir ini diambil dengan metode webcrawling dan didapatkan 1000 tweet Twitter yang kemudian dilabeli secara manual menjadi 500 tweet depresi dan 500 tweet bukan depresi. Kemudian pada data tersebut dilakukan text preprocessing. Diterapkan juga word embedding dengan metode Word2Vec Skip-gram dan word encoding seperti sequencing dan padding agar data dapat diproses oleh algoritma CNN. Selanjutnya proses training data menggunakan model-model CNN yaitu model AlexNet, ZFNet, VGG16, VGG19, LeNet-5, serta model yang dirancang oleh penulis dan menggunakan Stratified 5-Fold cross validation sebagai metode validasi.
Hasil uji coba menunjukkan bahwa nilai rata-rata akurasi tertinggi sebesar 75,33% yang diperoleh dari arsitektur model yang dirancang oleh penulis. Arsitektur model tersebut terdiri dari 3 layer dengan jumlah filter sebanyak 16 pada tiap layer dan menggunakan optimizer Nadam dengan learning rate 0,0001. Arsitektur model tersebut memiliki rata-rata akurasi yang lebih tinggi dari lima arsitektur model lainnya.
================================================================================================
Twitter is a social networking service that has many
users from Indonesia. Because twitter is a kind of
microblogging service, most of their users use twitter to tell
their problems in their daily life.
The data that is used in this undergraduate thesis is
retrieved using webcrawling method and obtained 1000 tweets
from Twitter which is labelled and divided manually to 500
depressed tweets and 500 non-depressed tweets. Then text
preprocessing is applied to the data. Word embedding using the
method of Word2Vec Skip-gram and word encoding such as
sequencing and padding are applied so the data can be
processed by CNN algorithm. Then the data will be trained
using CNN models such as AlexNet, ZFNet, VGG16, VGG19,
LeNet-5, and a model designed by the writer of this
undergraduate thesis. Stratified 5-Fold cross validation is
applied as validation method.
The result of the training shows the best average
accuracy score is 75,33% resulted from the model designed by
the writer. The model architecture is consisting of 3 layers with
16 filters on every layer and using Nadam optimizer with
learning rate of 0,0001. and using Stratified 5-Fold cross validation as validation method. The model resulted accuracy average higher than the other five models

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 006.3 Sal d-1 2019
Uncontrolled Keywords: convolutional neural network, deteksi depresi, text preprocessing, twitter, word2vec, word embedding, word encoding
Subjects: H Social Sciences > H Social Sciences (General)
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
T Technology > T Technology (General)
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Salbari Faris
Date Deposited: 31 Dec 2021 03:14
Last Modified: 31 Dec 2021 03:14
URI: http://repository.its.ac.id/id/eprint/61814

Actions (login required)

View Item View Item