Temu Kembali Informasi Menggunakan Elasticsearch pada Unstructured Datatext Multidimensi

Novitasari, Rista (2015) Temu Kembali Informasi Menggunakan Elasticsearch pada Unstructured Datatext Multidimensi. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 2213206716-master_thesis.pdf]
Preview
Text
2213206716-master_thesis.pdf - Published Version

Download (1MB) | Preview

Abstract

Salah satu bagian penting dalam pengelolaan data karya ilmiah adalah
proses pencarian informasi biasa disebut dengan temu kembali informasi
(information retrieval). Adapun tujuan utama dari temu kembali informasi ini
adalah menemukan kembali dokumen karya ilmiah yang berisi informasi yang
relevan dengan apa yang diinputkan oleh pengguna pada sistem terdistribusi.
Teknik temu kembali informasi berbasis big data ini menggunakan metode
ElasticSearch pada lingkungan komputasi terdistribusi yang menggunakan
Hadoop. Dengan teknik ini suatu dokumen yang diinputkan akan dibuatkan index
dari isi dokumen tersebut. Dari percobaan yang dilakukan didapatkan rata-rata
waktu search requet yaitu 1.304 detik dan waktu index request yaitu 1.093 detik.
Rata-rata waktu pencarian kata pada dokumen sangat singkat. Dari percobaan
yang dilakukan didapatkan rata-rata waktu pencarian dokumen yaitu 0.0485 detik.
===================================================================================================================
One important part of the scientific work of data management is the
process of information retrieval commonly referred to as information retrieval
(information retrieval). The main purpose of information retrieval is to rediscover
scientific papers document that contains information that is relevant to what is
entered by the user in a distributed system.
Information retrieval techniques based big data using methods
ElasticSearch in distributed computing environments that use Hadoop. With this
technique an input document will be created index of the contents of the
document. Obtained from experiments conducted average search time is 1304
seconds requet and index time the request is 1093 seconds. The average search
time is very brief word on the document. Obtained from experiments conducted
average search time is 0.0485 seconds document.

Item Type: Thesis (Masters)
Additional Information: RTE 005.74 Nov t
Uncontrolled Keywords: ElasticSearch, Hadoop, MapReduce, Big Data.
Subjects: T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105 Data Transmission Systems
Divisions: Faculty of Industrial Technology > Electrical Engineering > 20101-(S2) Master Thesis
Depositing User: Mr. Fandika aqsa
Date Deposited: 14 Jun 2017 02:29
Last Modified: 15 Jun 2017 02:12
URI: http://repository.its.ac.id/id/eprint/41650

Actions (login required)

View Item View Item