Temu Kembali Informasi Berbasis Pemodelan Topik Menggunakan Kombinasi LSI dan VSM Pada Sistem Tanya-Jawab

Bahri, Syamsul (2018) Temu Kembali Informasi Berbasis Pemodelan Topik Menggunakan Kombinasi LSI dan VSM Pada Sistem Tanya-Jawab. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 07111650067002-Master_Thesis.pdf]
Preview
Text
07111650067002-Master_Thesis.pdf - Accepted Version

Download (4MB) | Preview

Abstract

Dalam Penerapan e-government untuk menuju tata pemerintahan yang baik (good governance), pemerintah pusat maupun daerah menyediakan layanan tanya-jawab pada sistem online. Layanan tanya-jawab ini sangat penting karena dapat memfasilitasi permintaan informasi secara lebih mudah serta dapat diakses kapan saja, tanpa harus menunggu jam layanan kantor buka. Dalam pelaksanaan layanan tersebut masih dilakukan secara manual, sehingga perlu dikembangkan suatu sistem tanya-jawab yang dikerjakan oleh komputer. Suatu sistem tanya-jawab dibentuk oleh beberapa elemen/modul. Salah satu elemen penting dalam sistem tanya-jawab tersebut elemen temu kembali informasi yang bertanggung jawab dalam pengambilan dokumen-dokumen yang relevan dengan pertanyaan (query) pengguna. Metode yang banyak digunakan dalam membangun temu kembali informasi adalah menggunakan adalah metode Vector Space Model (VSM) dan Latent Semantic Indexing (LSI), dimana keduanya merepresentasikan dokumen ke dalam vektor ruang. Namun kedua metode tersebut memiliki keterbatasan masing-masing. Untuk itu dalam penelitian ini diusulkan model kombinasi antara metode VSM dan LSI untuk memperbaiki beberapa batasan pada keduanya. Dalam mencari dokumen yang relevan dengan query, model kombinasi ini bekerja dengan cara mengambil terlebih dahulu dokumen yang memiliki kesamaan topik dengan query menggunakan pemodelan topik dalam hal ini metode LSI. Kemudian setelah itu mengurutkannya berdasarkan kesamaan term menggunakan metode VSM untuk diambil beberapa dokumen dengan nilai kemiripan tertinggi. Untuk menguji kinerja dari model kombinasi tersebut dalam mencari dokumen relevan pada sistem tanya-jawab, maka pada penelitian ini akan menggunakan data layanan tanya-jawab pada sistem Pengadaan Secara Elektronik (SPSE) sebagai data eksperimen. Dari hasil eksperimen yang dilakukan ditemukan bahwa model yang diusulkan mampu meningkatkan presisi metode dasarnya yakni LSI dan VSM yang berdiri sendiri. Model kombinasi (LSI+VSM) memperoleh precision at 1 (P@1)=0,7 dengan Mean Average Precision (MAP)=0,579 sedangkan pada model dasarnya diperoleh P@1=0,5 dengan MAP=0,237 untuk LSI, P@1=0,38 dengan MAP=0,247 untuk VSM biasa serta P@1=0,44 dengan MAP=0,258 untuk VSM dengan pembobotan profesional (VSM+PP).
===========================================================================================================
In order to achieve good governance through implementation of e-government, the central and local governments provide a question-answering services for online system. This question-answering services are essential to facilitate information requests to make it easier and accessible at any time. In the implementation of the services are still done manually, so it is necessary to develop a computerized question-answering system (QAS). A QAS is formed by several elements/modules. One of important element in QAS is the information retrieval (IR) that is responsible for retrieving relevant documents to the user requests. A widely used methods for developing the information retrieval system are using Vector Space Model (VSM) and Latent Semantic Indexing (LSI), where they represent documents into space vectors. However, both models have their respective limitation. For this reason, in this research proposed a combination model between VSM and LSI to fix some limitations on both. In searching for documents relevant to the query, this combination model works by retrieving documents that have the same topic as the query first using the topic modeling in this case the LSI method and then sort it based on the term similarity using the VSM method to retrieve some documents with the highest similarity value. To evaluate the performance of that combination model in searching relevant documents on the question-answering system, hence in this research will be use question-answer data on the Electronic Procurement System (SPSE) as experimental data. From the experimental results, it was found that the proposed model was able to improve the precision of its basic method i.e. the stand-alone LSI and VSM. The combination model (LSI + VSM) obtained precision at 1 (P@1)=0.7 with Mean Average Precision (MAP)=0.579 whereas in the basic methods obtained P@1=0.5 with MAP=0.237 for the LSI, P@1=0.38 with MAP=0.247 for the traditional VSM and P@1=0.44 with MAP=0.258 for the VSM with professional weight concept.

Item Type: Thesis (Masters)
Additional Information: RTE 005.74 Bah t-1 3100018078904
Uncontrolled Keywords: information retrieval, LSI, QAS, topic modeling, VSM, pemodelan topik, sistem tanya-jawab,temu kembali informasi
Subjects: T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105.546 Computer algorithms
Z Bibliography. Library Science. Information Resources > ZA Information resources > Z699.5 Information storage and retrieval systems
Divisions: Faculty of Electrical Technology > Electrical Engineering > 20101-(S2) Master Thesis
Depositing User: Syamsul Bahri
Date Deposited: 07 Feb 2019 03:51
Last Modified: 23 Oct 2020 07:06
URI: http://repository.its.ac.id/id/eprint/53070

Actions (login required)

View Item View Item