Algoritma Perbaikan Penentuan Titik Pusat Awal Berbasis Hirarki Untuk Klasterisasi Data Kategorikal

Karlita, Tita (2006) Algoritma Perbaikan Penentuan Titik Pusat Awal Berbasis Hirarki Untuk Klasterisasi Data Kategorikal. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
5104201005-Master-Thesis.pdf - Published Version

Download (19MB) | Preview

Abstract

Algoritma klasterisasi k-means didesain hanya untuk bekerja pada data berjenis numerik. Dilain pihak algoritma k-modes dikembangkan berdasarkan pada paradigma algoritma k-means agar dapat digunakan untuk mengklaster data kategorikal dengan menggunakan ukuran keserupaan yang didasarkan pada metode frekuensi kemunculan suatu nilai dalam suatu atribut untuk memutakhirkan titik pusat klaster. Kebanyakan algoritma k-modes yang dipublikasikan pada saat ini menentukan titik pusat awal dengan cara random. Pemilihan titik pusat yang berbeda dapat menghasilkan klaster yang berbeda sehingga hasil klaster tidak stabil. Dalam tesis ini dikembangkan algoritma k-modes yang menggunakan algoritma klasterisasi hirarki yang diaplikasikan pada data sub-sampel untuk menghasilkan titik pusat awal yang baik. Data sub-sampel yang dibentuk dengan proses reduksi data menjadi masukan bagi algoritma klasterisasi hirarki. Selanjutnya sejumlah titik pusat yang dihasilkan oleh klasterisasi hirarki dijadikan sebagai masukan titik pusat awal bagi algoritma k-modes. Hasil uji coba menunjukkan bahwa algoritma perbaikan penentuan titik pusat awal berbasis hirarki mampu menghasilkan hasil klaster yang lebib baik dan stabil hila dibandingkan dengan algoritma klasterisasi yang penentuan titik pusat awalnya dilakukan secara random. Selain itu, basil uji coba juga menunjukkan bahwa hasil klaster dari proses klasterisasi yang melibatkan proses reduksi data mempunyai tingkat akurasi yang sama jika dibandingkan dengan basil klaster dari

Item Type: Thesis (Masters)
Additional Information: RTIf 005.1 Kar a
Uncontrolled Keywords: klasterisasi data, algoritma k-modes, reduksi data, data kategorikal, data mining.
Subjects: Q Science > QA Mathematics > QA76.9 Computer algorithms. Virtual Reality. Computer simulation.
Divisions: Faculty of Information Technology > Informatics Engineering > (S2) Master Theses
Depositing User: ansi aflacha
Date Deposited: 04 Jul 2018 08:43
Last Modified: 04 Jul 2018 08:43
URI: http://repository.its.ac.id/id/eprint/52096

Actions (login required)

View Item View Item