Pencarian Question-Answer Dengan Pendekatan Convolutional Neural Network Untuk Topik Bahasan Agama Berbahasa Indonesia

Bintana, Rizqa Raaiqa (2018) Pencarian Question-Answer Dengan Pendekatan Convolutional Neural Network Untuk Topik Bahasan Agama Berbahasa Indonesia. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
5114201039-Master Thesis.pdf - Accepted Version

Download (3MB) | Preview

Abstract

Komunitas tanya-jawab dibentuk untuk mempermudah seseorang dalam memperoleh informasi yang dibutuhkannya melalui suatu komunitas. Kondisi yang bisa terjadi dalam komunitas tanya-jawab adalah ketika pencari informasi tidak mampu menemukan informasi yang mereka butuhkan, sehingga mereka akan menginputkan pertanyaan baru. Hal ini dapat mengakibatkan jumlah arsip dalam komunitas tanya-jawab meningkat (pertanyaan ganda). Oleh karena itu, menjadi permasalahan yang penting untuk bisa menemukan pertanyaan dari dalam arsip komunitas tanya-jawab yang sama secara semantik dengan pertanyaan baru yang diinputkan oleh penanya. Dalam penelitian ini diusulkan penggunaan metode agglomerative hierarchical clustering untuk mengelompokkan dokumen pertanyaan-jawaban dari arsip komunitas tanya-jawab dengan tujuan efisiensi pemrosesan pada tahapan pemodelan kalimat pertanyaan-jawaban dan pencocokan semantik antar kalimat pertanyaan-jawaban, serta penggunaan convolutional neural network untuk pemodelan semantik kalimat yang bertujuan untuk mendapatkan kata-kata yang merepresentasikan isi kalimat atau dokumen. Dari hasil uji coba untuk proses pengelompokkan dokumen dengan data yang dimiliki, hasil yang diperoleh belum cukup baik dengan akurasi 0,115. Hal ini dikarenakan jumlah kata yang jauh berbeda antar dokumen serta frekuensi kemunculan kata dalam masing-masing dokumen sangat mempengaruhi hasil cluster. Dan hasil uji coba untuk proses menemukan pertanyaan yang sama secara semantik dengan pertanyaan baru (query) dari dalam arsip dokumen tanya-jawab menggunakan metode convolutional neural network, diperoleh nilai mean average precision-nya, yaitu 0,422. Sedangkan dengan menggunakan vector space model, sebagai pembanding, diperoleh nilai mean average precision-nya, yaitu 0,282. =================================================================================================== Community-based question answering (CQA) helps people to obtain the information they need through a community. The condition that may occur in CQA is when the information seekers cannot obtain the information they need, thus they will post a new question. This condition can cause CQA archive increased (duplicated question). Therefore, it becomes important problems to find semantically similar questions from CQA archive towards a new question. In this study, we propose the use of agglomerative hierarchical clustering methods for grouping the question-answer documents from CQA archive for document processing more efficient. We also use convolutional neural network methods for semantic modeling of sentence to obtain words that it represents the content of sentence or document. From the results for the process of grouping the documents with the data held, the results obtained are not good enough with an accuracy is 0,115. This is because the number of words are much different between a document and the other, and the frequency of occurrence of words in each document greatly affects the cluster results. And the results for the process of finding the same question semantically to a new question (or query) from the question-answer documents archive using the convolutional neural network method, obtained the mean average precision value is 0,422. Whereas by using vector space model, as a comparison, obtained mean average precision value is 0,282.

Item Type: Thesis (Masters)
Additional Information: RTIf 004.35 Bin p-1
Uncontrolled Keywords: agglomerative hierarchical clustering; convolutional neural network; komunitas tanya-jawab; temu kembali pertanyaan; agglomerative hierarchical clustering, community-based question answering; convolutional neural network; question retrieval
Subjects: Q Science > QA Mathematics > QA278.55 Cluster analysis
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Information Technology > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: BINTANA RIZQA RAAIQA
Date Deposited: 03 Jul 2018 04:45
Last Modified: 29 Sep 2020 04:21
URI: https://repository.its.ac.id/id/eprint/51751

Actions (login required)

View Item View Item