Studi Kinerja Algoritma Optimasi pada Metode Quantum Clustering dengan Kernel Entropy Component Analysis untuk Reduksi Dimensi

Pamusti, Riansya (2018) Studi Kinerja Algoritma Optimasi pada Metode Quantum Clustering dengan Kernel Entropy Component Analysis untuk Reduksi Dimensi. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111440000175-Riansya-Pamusti-Buku_TA.pdf]
Preview
Text
05111440000175-Riansya-Pamusti-Buku_TA.pdf - Accepted Version

Download (2MB) | Preview

Abstract

Clustering merupakan proses partisi dataset menjadi beberapa bagian yang disebut dengan cluster. Data yang terdapat dalam satu cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda dengan cluster yang lain. Proses partisi tidak dilakukan secara manual melainkan dengan suatu algoritma clustering. Oleh karena itu, clustering sangat berguna untuk menemukan kelompok yang terdapat dalam dataset. Penentuan jumlah cluster pada algoritma clustering merupakan tantangan tersendiri yang umumnya dilakukan degan uji coba secara empiris. Tugas Akhir ini mengimplementasikan algoritma clustering yang merupakan kombinasi dari algoritma kernel entropy component analysis (KECA) sebagai pre-processing dengan quantum clustering (QC) sebagai clustering. Dengan algoritma KECA, bisa diperoleh dimensi yang jauh lebih kecil dari data yang sesungguhnya. Setelah itu, QC digunakan untuk mengelompokkan data yang telah diproses oleh algoritma KECA. Algoritma QC bisa mendapat jumlah cluster secara otomatis tanpa mengetahui jumlah cluster yang sesungguhnya. Tugas Akhir ini diimplementasikan QC dalam lima macam algoritma optimasi untuk menemukan quantum potential minima. Dataset yang digunakan dalam proses uji coba terdiri dari lima buah dataset buatan dan tiga buah dataset dari UCI. Hasil akhir yang didapat menunjukkan bahwa setiap algoritma optimasi menunjukkan hasil yang tidak jauh berbeda. Namun, hasil yang buruk selalu didapat saat menggunakan algoritma optimasi AdaGrad. Hasil penggunaan KECA-QC terbaik terdapat pada dataset Cluster in cluster dengan akurasi sempurna 100% dan hasil terburuk terdapat pada dataset Corners dengan akurassi 33.58%.
================================================================================================================
Clustering is the process of partitioning dataset into subsets called clusters. Data within a cluster have similar characteristics between each other and are different from other clusters. Partitions are not done manually but with a clustering algorithm. Therefore, clustering is very useful to find unknown groups in the dataset. Determining the number of clusters in the clustering algorithm is a challenge that is generally done by empirical testing. In this undergraduate theses, We just implement combination of quantum clustering (QC) algorithm with kernel entropy component analysis (KECA) for clustering dataset. With KECA algorithm we can get far smaller size of data, so it significantly reduce the computation for the clustering. After that, use the QC algorithm to cluster the data processed by KECA algorithm. QC algorithm can obtain number of cluster without knowing the real number of cluster. In this undergraduated theses QC was implemented using five optimization algorithm to find quantum potential minima. The dataset used in this experiment consists of five artificial datasets and three from UCI datasets. The results show that every optimization algorithm obtain nearly similar results. However, when the AdaGrad optimization algorithm used, poor results are always obtained. The best results of KECA-QC usage are found on the Cluster in cluster dataset with 100% perfect accuracy and the worst result is in the Corners dataset with 33.58% accuracy.

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 004.35 Pam s-1 2018 3100019079105
Uncontrolled Keywords: Data mining, Clustering, Quantum Clustering, Kernel Entropy Component Analysis
Subjects: Q Science > QA Mathematics > QA278.55 Cluster analysis
Q Science > QA Mathematics > QA76.9 Computer algorithms. Virtual Reality. Computer simulation.
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Information and Communication Technology > Informatics > 55201-(S1) Undergraduate Thesis
Depositing User: Riansya Pamusti Pamusti
Date Deposited: 14 Feb 2019 08:04
Last Modified: 23 Nov 2020 06:27
URI: http://repository.its.ac.id/id/eprint/53870

Actions (login required)

View Item View Item