Ekstraksi Kata Kunci Berdasarkan Hipernim Dengan Inisialisasi Klaster Menggunakan Fuzzy Association Rule Mining Pada Pengelompokan Dokumen

Rozi, Fahrur (2015) Ekstraksi Kata Kunci Berdasarkan Hipernim Dengan Inisialisasi Klaster Menggunakan Fuzzy Association Rule Mining Pada Pengelompokan Dokumen. Masters thesis, Institut Teknology Sepuluh Nopember.

[thumbnail of 5113201008-Master Thesis.pdf] Text
5113201008-Master Thesis.pdf - Published Version
Restricted to Repository staff only

Download (4MB) | Request a copy

Abstract

Pertumbuhan dunia digital dalam dokumen teks terutama di World Wide
Web mengalami pertumbuhan pesat. Peningkatan dokumen teks ini menyebabkan
terjadinya penumpukan informasi, sehingga diperlukan sebuah pengorganisasian
yang efisien untuk pengelolaan dokumen teks. Salah satu metode yang dapat
mengelompokkan dokumen dengan tepat adalah menggunakan fuzzy association
rule. Tahap ekstraksi kata kunci serta tipe fuzzy yang digunakan berpengaruh
terhadap kualitas pengelompokan dokumen. Penggunaan hipernim dalam
ekstraksi kata kunci untuk mendapatkan suatu cluster label dapat memperluas
makna dari cluster label, sehingga dapat diperoleh suatu meaningful cluster label,
selain itu ambiguitas dan uncertainties yang terjadi di dalam aturan fuzzy logic
systems (FLS) tipe-1 dapat diatasi dengan fuzzy set tipe-2. Penelitian ini
mengusulkan sebuah metode yaitu ekstraksi kata kunci berdasarkan hipernim
dengan inisialisasi klaster menggunakan fuzzy association rule mining pada
pengelompokan dokumen. Metode ini terdiri dari empat tahap, yaitu :
preprocessing dokumen, ekstraksi key terms dari hipernim, ekstraksi kandidat
cluster, dan konstruksi cluster tree. Pengujian terhadap metode ini dilakukan
dengan tiga jenis data berbeda, yaitu Classic, Reuters, dan 20 Newsgroup.
Pengujian dilakukan dengan membandingkan nilai overall f-measure dari metode
tanpa hipernim (level 0), metode dengan hipernim level 1, dan metode dengan
hipernim level 2. Berdasarkan pengujian didapatkan bahwa penggunaan hipernim
dalam ektraksi kata kunci mampu menghasilkan rata-rata overall f-measure
sebesar 0.5783 untuk data classic, 0.4001 untuk data reuters, dan 0.5269 untuk
data 20 newsgroup.
===========================================================================================================
The development of the digital world in text documents, especially on the
World Wide Web is very fast. With the rapid growth of text document can lead to
information overload, so we need an efficient method to manage of text
documents. One of method that can accurately classify documents is using fuzzy
association rule. Key terms extraction stage and type of fuzzy that used for
clustering affected on the quality of the document clustering. Using hipernim in
the key terms extraction to obtain a cluster label can expand the meaning of
cluster label and obtain a meaningful cluster label, the ambiguities and
uncertainties that occur in the rules of fuzzy logic systems (FLS) type-1 can be
overcome with fuzzy sets type-2. This research propose a method of key terms
extraction based on hipernim with initialization cluster using fuzzy association
rule mining in document clustering. This method consists of four stages, that is:
preprocessing documents, key terms extraction with hipernim, candidate clusters
extraction, and cluster tree construction. This research method was tested on three
different types of data, that is : Classic, Reuters, and 20 Newsgroup. We have
conducted experiment by comparing overall f-measure of method without
hypernym (level 0), method with hypernym level 1, and method with hypernym
level 2. Based on testing, method with hypernym in the extraction of keyword can
produce overall f-measure 0.5783 for classic data, 0.4001 for reuters data, and
0.5269 for 20 newsgroup data.

Item Type: Thesis (Masters)
Additional Information: RTIf 006.312 Roz e
Uncontrolled Keywords: Fuzzy set tipe-2, hipernim, association rule, clustering dokumen
Subjects: Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Divisions: Faculty of Information Technology > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: Mr. Tondo Indra Nyata
Date Deposited: 22 Oct 2019 02:30
Last Modified: 22 Oct 2019 02:30
URI: http://repository.its.ac.id/id/eprint/71332

Actions (login required)

View Item View Item