Ekstraksi Kata Kunci Berdasarkan Hipernim Dengan Inisialisasi Klaster Menggunakan Fuzzy Association Rule Mining Pada Pengelompokan Dokumen

Rozi, Fahrur (2015) Ekstraksi Kata Kunci Berdasarkan Hipernim Dengan Inisialisasi Klaster Menggunakan Fuzzy Association Rule Mining Pada Pengelompokan Dokumen. Masters thesis, Institut Teknology Sepuluh Nopember.

[img] Text
5113201008-Master Thesis.pdf - Published Version
Restricted to Repository staff only

Download (4MB) | Request a copy

Abstract

Pertumbuhan dunia digital dalam dokumen teks terutama di World Wide Web mengalami pertumbuhan pesat. Peningkatan dokumen teks ini menyebabkan terjadinya penumpukan informasi, sehingga diperlukan sebuah pengorganisasian yang efisien untuk pengelolaan dokumen teks. Salah satu metode yang dapat mengelompokkan dokumen dengan tepat adalah menggunakan fuzzy association rule. Tahap ekstraksi kata kunci serta tipe fuzzy yang digunakan berpengaruh terhadap kualitas pengelompokan dokumen. Penggunaan hipernim dalam ekstraksi kata kunci untuk mendapatkan suatu cluster label dapat memperluas makna dari cluster label, sehingga dapat diperoleh suatu meaningful cluster label, selain itu ambiguitas dan uncertainties yang terjadi di dalam aturan fuzzy logic systems (FLS) tipe-1 dapat diatasi dengan fuzzy set tipe-2. Penelitian ini mengusulkan sebuah metode yaitu ekstraksi kata kunci berdasarkan hipernim dengan inisialisasi klaster menggunakan fuzzy association rule mining pada pengelompokan dokumen. Metode ini terdiri dari empat tahap, yaitu : preprocessing dokumen, ekstraksi key terms dari hipernim, ekstraksi kandidat cluster, dan konstruksi cluster tree. Pengujian terhadap metode ini dilakukan dengan tiga jenis data berbeda, yaitu Classic, Reuters, dan 20 Newsgroup. Pengujian dilakukan dengan membandingkan nilai overall f-measure dari metode tanpa hipernim (level 0), metode dengan hipernim level 1, dan metode dengan hipernim level 2. Berdasarkan pengujian didapatkan bahwa penggunaan hipernim dalam ektraksi kata kunci mampu menghasilkan rata-rata overall f-measure sebesar 0.5783 untuk data classic, 0.4001 untuk data reuters, dan 0.5269 untuk data 20 newsgroup. =========================================================================================================== The development of the digital world in text documents, especially on the World Wide Web is very fast. With the rapid growth of text document can lead to information overload, so we need an efficient method to manage of text documents. One of method that can accurately classify documents is using fuzzy association rule. Key terms extraction stage and type of fuzzy that used for clustering affected on the quality of the document clustering. Using hipernim in the key terms extraction to obtain a cluster label can expand the meaning of cluster label and obtain a meaningful cluster label, the ambiguities and uncertainties that occur in the rules of fuzzy logic systems (FLS) type-1 can be overcome with fuzzy sets type-2. This research propose a method of key terms extraction based on hipernim with initialization cluster using fuzzy association rule mining in document clustering. This method consists of four stages, that is: preprocessing documents, key terms extraction with hipernim, candidate clusters extraction, and cluster tree construction. This research method was tested on three different types of data, that is : Classic, Reuters, and 20 Newsgroup. We have conducted experiment by comparing overall f-measure of method without hypernym (level 0), method with hypernym level 1, and method with hypernym level 2. Based on testing, method with hypernym in the extraction of keyword can produce overall f-measure 0.5783 for classic data, 0.4001 for reuters data, and 0.5269 for 20 newsgroup data.

Item Type: Thesis (Masters)
Additional Information: RTIf 006.312 Roz e
Uncontrolled Keywords: Fuzzy set tipe-2, hipernim, association rule, clustering dokumen
Subjects: Q Science > QA Mathematics > QA76.9.D343 Data mining
Divisions: Faculty of Information Technology > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: Mr. Tondo Indra Nyata
Date Deposited: 22 Oct 2019 02:30
Last Modified: 22 Oct 2019 02:30
URI: http://repository.its.ac.id/id/eprint/71332

Actions (login required)

View Item View Item