Temu Kembali Informasi Menggunakan Elasticsearch pada Unstructured Datatext Multidimensi

Novitasari, Rista (2015) Temu Kembali Informasi Menggunakan Elasticsearch pada Unstructured Datatext Multidimensi. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
2213206716-master_thesis.pdf

Download (1MB) | Preview

Abstract

Salah satu bagian penting dalam pengelolaan data karya ilmiah adalah proses pencarian informasi biasa disebut dengan temu kembali informasi (information retrieval). Adapun tujuan utama dari temu kembali informasi ini adalah menemukan kembali dokumen karya ilmiah yang berisi informasi yang relevan dengan apa yang diinputkan oleh pengguna pada sistem terdistribusi. Teknik temu kembali informasi berbasis big data ini menggunakan metode ElasticSearch pada lingkungan komputasi terdistribusi yang menggunakan Hadoop. Dengan teknik ini suatu dokumen yang diinputkan akan dibuatkan index dari isi dokumen tersebut. Dari percobaan yang dilakukan didapatkan rata-rata waktu search requet yaitu 1.304 detik dan waktu index request yaitu 1.093 detik. Rata-rata waktu pencarian kata pada dokumen sangat singkat. Dari percobaan yang dilakukan didapatkan rata-rata waktu pencarian dokumen yaitu 0.0485 detik. =================================================================================================================== One important part of the scientific work of data management is the process of information retrieval commonly referred to as information retrieval (information retrieval). The main purpose of information retrieval is to rediscover scientific papers document that contains information that is relevant to what is entered by the user in a distributed system. Information retrieval techniques based big data using methods ElasticSearch in distributed computing environments that use Hadoop. With this technique an input document will be created index of the contents of the document. Obtained from experiments conducted average search time is 1304 seconds requet and index time the request is 1093 seconds. The average search time is very brief word on the document. Obtained from experiments conducted average search time is 0.0485 seconds document.

Item Type: Thesis (Masters)
Additional Information: RTE 005.74 Nov t
Uncontrolled Keywords: ElasticSearch, Hadoop, MapReduce, Big Data.
Subjects: T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105 Data Transmission Systems
Divisions: Faculty of Industrial Technology > Electrical Engineering > (S2) Master Theses
Depositing User: Mr. Fandika aqsa
Date Deposited: 14 Jun 2017 02:29
Last Modified: 15 Jun 2017 02:12
URI: http://repository.its.ac.id/id/eprint/41650

Actions (login required)

View Item View Item