Klasifikasi Judul Penelitian Untuk Pemodelan Topik Menggunakan Metode Graph Convolutional Network

Farandy, Bastian (2021) Klasifikasi Judul Penelitian Untuk Pemodelan Topik Menggunakan Metode Graph Convolutional Network. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111740000190-Undergraduate_Thesis.pdf] Text
05111740000190-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2023.

Download (2MB) | Request a copy

Abstract

Perkembangan pesat dibidang teknologi dan ilmu pengetahuan mendorong banyaknya penelitian baru. Penelitian adalah proses atau kegiatan dalam penyelidikan sistematis yang bertujuan untuk memberikan informasi untuk memecahkan masalah. Dalam tahun ke tahun, penelitian yang dilakukan semakin banyak. Jumlah penelitian yang semakin banyak ini akan membuat masalah baru apabila tidak dikategorikan dengan baik. Permasalahan ini salah satunya dapat diselesaikan dengan topic modelling. Topic Modelling merupakan teknik yang secara otomatis menganalisa data teks untuk menentukan persebaran kata dalam suatu dokumen.
Topic Modelling secara umum dilakukan dengan machine learning seperti Latent Dirichlet Allocation (LDA). Metode topic modelling ini umumnya unsupervised dan topic modelling menghasilkan label pada setiap data. Label ini dibutuhkan ketika dilakukan pendekatan dengan deep learning karena deep learning membutuhkan sebuah target label dalam melakukan klasifikasi. Pada tugas akhir ini, penulis mencoba untuk melakukan klasifikasi judul penelitian menggunakan metode Graph Convolutional Network dengan pendekatan topic modelling. Graph Convolutional Network (GCN) merupakan metode yang memanfaatkan graf dalam pembentukan matriks fitur yang kemudian akan dimasukkan ke dalam arsitektur berbasis Convolutional Neural Network (CNN). GCN ini mengandalkan beberapa algoritma dan perhitungan mulai dari Pointwise Mutual Information (PMI) dan Term Frequency-Inverse Document Frequency (TF-IDF) sebagai ekstraksi fitur, filtrasi kata dan berbagai praproses data.
Dataset yang digunakan berasal dari data Penerimaan Pendanaan Penelitian Perguruan Tinggi Negeri Badan Hukum (PTNBH) tahun 2018-2020. Hasil pengujian menunjukkan bahwa klasifikasi judul penelitian menggunakan metode Graph Convolutional Network mendapatkan akurasi yang baik, yakni diatas 88%.
===================================================================================================
Rapid developments in the field of technology and science encourage a lot of new research. Research is a process or activity in a systematic investigation that aims to provide information to solve problems. From year to year, more and more research is being carried out. This increasing number of studies will create new problems if they are not categorized properly. One of these problems can be solved by topic modeling. Topic Modeling is a technique that automatically analyzes text data to determine the distribution of words in a document. Topic Modeling is generally done with machine learning such as Latent Dirichlet Allocation (LDA). This topic modeling method is generally unsupervised and topic modeling produces a label for each data. This label is needed when approaching deep learning because deep learning requires a target label in classifying.
In this undergraduate thesis, the writer tries to classify research titles using the Graph Convolutional Network method with a topic modeling approach. Graph Convolutional Network (GCN) is a method that utilizes graphs in the formation of a feature matrix which will then be incorporated into the Convolutional Neural Network (CNN)-based architecture. GCN relies on several algorithms and calculations ranging from Pointwise Mutual Information (PMI) and Term Frequency-Inverse Document Frequency (TF-IDF) as feature extraction, word filtration and various data preprocessing.
The dataset used comes from data on Legal Entity State University Research Funding Receipts (PTNBH) in 2018-2020. The test results show that the classification of research titles using the Graph Convolutional Network method gets good accuracy, which is above 88%.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Topic Modelling, Latent Dirichlet Allocation, Judul, Pointwise Mutual Information (PMI), Term Frequency-Inverse Document Frequency (TF-IDF), Graph Convolutional Network, dan Convolutional Neural Network
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
Q Science > QA Mathematics > QA166 Graph theory
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
R Medicine > R Medicine (General) > R858 Deep Learning
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Bastian Farandy
Date Deposited: 04 Aug 2021 06:00
Last Modified: 04 Aug 2021 06:00
URI: http://repository.its.ac.id/id/eprint/84791

Actions (login required)

View Item View Item