Perbandingan Model Klasifikasi Berdasarkan Input Teks (Sinopsis) Menggunakan Support Vector Machine Dan Convolutional Neural Network Terhadap Klasifikasi Genre Film

Madana, Yama Praja (2021) Perbandingan Model Klasifikasi Berdasarkan Input Teks (Sinopsis) Menggunakan Support Vector Machine Dan Convolutional Neural Network Terhadap Klasifikasi Genre Film. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06211740000033-Undergraduate_Thesis.pdf] Text
06211740000033-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (1MB) | Request a copy

Abstract

Salah satu hiburan yang cukup popular pada saat pandemic adalah film. Untuk mempermudah memilah film-film yang sesuai dengan alur cerita yang diinginkan, umumnya penikmat film melihat genre yang diinginkan. Akan tetapi, untuk mengkategorikan genre pada film masih memerlukan kemampuan manusia yaitu dengan menonton film ataupun membaca sinopsisnya terlebih dahulu. Hal ini memerlukan waktu dan tenaga yang cukup besar mengingat jumlah film yang semakin banyak. Oleh karena itu dibuat sebuah sistem untuk membantu menggolongkan suatu film dengan cepat yang salah satunya dapat menggunakan suatu model klasifikasi. Pada penelitian ini dilakukan pengelompokan genre sebuah film yang tercantum pada website IMDB.com. menjadi 4 kelompok besar yaitu drama, aksi, komedi, dan horror melalui sinopsis pada sebuah film menggunakan metode support vector machine (SVM) dan convolutional neural network (CNN). Model CNN dengan Word2vec memberikan akurasi yang lebih baik, yaitu rata-rata precision 69%, recall 61% dan f1-score 64% daripada model SVM dengan tf-idf yang memberikan nilai kebaikan model dengan rata-rata precision 62%, recall 51% dan f1-score 54% dalam melakukkan klasifikasi pada genre film.
=====================================================================================================
One of the most popular entertainment during a pandemic is movies. To make it easier to sort out films that match the desired storyline, generally movie enjoyers look at the desired by it’s genre. However, to categorize genres in films still requires human ability, we need to watch the film or read the synopsis at first. This requires considerable time and effort considering the increasing number of films. Therefore, a system was created to help classify a film quickly, one of which can use a classification model. In this study, the genre of a film listed on the IMDB.com website is grouped. 4 major groups, drama, action, comedy, and horror through the synopsis on film using the support vector machine (SVM) and convolutional neural network (CNN) methods. The CNN model with Word2vec provides better accuracy, which is gives an average precision of 69%, recall 61% and f1-score 64% compared to the SVM model with tf-idf which gives a good value for the model with an average precision of 62%, recall 51% and f1-score 54% in classifying genres film.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Convolutional Neural Network, Film, Genre, Classification, Sinopsis, Suport Vector Machine, Synopsis
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning.
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Yama Praja Madana
Date Deposited: 07 Sep 2021 08:52
Last Modified: 07 Sep 2021 08:52
URI: http://repository.its.ac.id/id/eprint/91794

Actions (login required)

View Item View Item