Perancangan Dan Pembuatan Aplikasi Clustering Term Dokumen Menggunakan Algoritma Divisive Information-Theoretic Feature Clustering Sebagai Metode Pengurangan Feature Pada Klasifikasi Dokumen Teks

Susanto, Heru Eko (2005) Perancangan Dan Pembuatan Aplikasi Clustering Term Dokumen Menggunakan Algoritma Divisive Information-Theoretic Feature Clustering Sebagai Metode Pengurangan Feature Pada Klasifikasi Dokumen Teks. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5199100092-Undergraduate Thesis.pdf]
Preview
Text
5199100092-Undergraduate Thesis.pdf - Published Version

Download (12MB) | Preview

Abstract

Salah satu penyebab tingginya waktu komputasi pada algoritma klasifikasi
dokumen disebabkan oleh besamya dimensi feature dari framing set. Agar
algoritma klasifikasi dapat bekelja dengan optimal maka perlu dilakukan
pengurangan dimensifeature.
Metode pengurangan dimensi feature secara umum dapat dikelompokan
menjadi dua kelompok utama, yaitu penf,rurangan dimensi feature dengan.feature
selection dan feature clustering. Feature clustering melakukan penggabungan
.feature menjadi beberapa klaster. Algoritma Divisive Information-Theoretic
Feature Clustering adalah distributional feature clustering yang menggunakan
distribusi statistik darifeature. Distribusi.feature ini diperoleh dari dokumen yang
digw1akan sebagai training set. Algoritma inj menggabungkan feafllre ke kJaster
berdasarkan kedekatan setiap feature dengan klaster yang diukur dengan
menggunakan Kullback-Leibler divergence. Algoritma ini juga merupakan
algoritma klastering yang bertipe hard clustering. Klaster-klaster yang dihasilkan
selanjutnya digunakan sebagai penganti feature dalam algoritma klasifikasi naiVe
bayes.
Uji coba dilakukan dengan menggunakan data UseNet Collection (20NG),
yang terdiri dari 19997 dokumen. Dokwnen-dokumen tersebut dikelompokan ke
dalam 20 topic yang berbeda, dimana setiap dokumen hanya memiliki satu topic.
Hasil uji coba klasifikasi dengan word cluster sebagai pengganti feature pada
algoritma klasifikasi nai"ve bayes diperoleh hasil yang bervariasi. Dari hasil uji
coba klasifikasi dapat diambil kesimpulan bahwa klasifikasi dengan feature
clustering lebih baik daripadafeature selection padajumlahfeature yang sedikit.

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 005.1 Sus p
Subjects: T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105.546 Computer algorithms
Divisions: Faculty of Information Technology > Information System
Depositing User: ansi aflacha
Date Deposited: 21 Oct 2019 07:11
Last Modified: 21 Oct 2019 07:11
URI: http://repository.its.ac.id/id/eprint/71299

Actions (login required)

View Item View Item