Metode Ensembel Rock dan SWFM untuk pengelompokan data campuran Numerik dan kategorik pada kasus aksesi jeruk

-, Alvionita (2017) Metode Ensembel Rock dan SWFM untuk pengelompokan data campuran Numerik dan kategorik pada kasus aksesi jeruk. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 1315201008-Master-Theses.pdf]
Preview
Text
1315201008-Master-Theses.pdf - Published Version

Download (4MB) | Preview

Abstract

Salah satu permasalahan yang sering ditemui dalam analisis kelompok adalah data yang berskala campuran numerik dan kategorik. Metode untuk mengelompokkan data campuran diantaranya metode ensembel dan metode Similarity Weight and Filter Method (SWFM). Tahap pengelompokan metode ensembel dilakukan dengan algoritma pengelompokan data kategorik, salah satunya adalah metode ROCK (RObust Clustering using linKs). Terdapat banyak penelitian dan pengembangan mengenai kedua metode tersebut, namun penelitian mengenai perbandingan kinerja dari kedua metode masih terbatas. Oleh karena itu, penelitian ini melakukan perbandingan kinerja antara metode ensembel ROCK dan ensembel SWFM. Kedua metode digunakan pada studi kasus pengelompokkan aksesi jeruk hasil fusi protoplasma yang merupakan data campuran numerik dan kategorik. Metode pengelompokan terbaik ditentukan dengan kriteria rasio antara simpangan baku di dalam kelompok (SW) dan simpangan baku antar kelompok (SB) terkecil. Berdasarkan 25 objek pengamatan pada studi kasus, metode ensembel ROCK dengan nilai θ sebesar 0,27 menghasilkan tiga kelompok dengan nilai rasio sebesar 0,1358, sedangkan metode ensembel SWFM menghasilkan dua kelompok dengan nilai rasio sebesar 0,3059. Hasil tersebut menunjukkan bahwa metode ensembel ROCK memberikan kinerja pengelompokan lebih baik daripada metode ensembel SWFM. Karakteristik hasil ensembel ROCK yang diperoleh adalah (a) kelompok 1 beranggotakan 10 aksesi dengan buah berukuran kecil tetapi berat, berkulit tebal, berwarna dominan kuning kehijauan, permukaan dominan halus, tekstur pulp beragam, dan berkadar air sedang, (b) kelompok 2 beranggotakan 7 aksesi dengan buah berukuran sedang tetapi berat, berkulit tipis, warna kulit beragam, permukaan beragam, tekstur pulp beragam, dan berkadar air tinggi, dan (c) kelompok 3 beranggotakan 3 aksesi dengan buah berukuran besar tetapi ringan, berkulit tebal, berwarna kuning kehijauan, permukaan halus, pulp lembut, dan berkadar air sedang.

=============================================================================

One of the problems often encountered in clustering analysis (cluster) is a mixed numerical and categorical dataset. The method is used to analyze the mixed dataset including ensemble method and Similarity Weight and Filter Method (SWFM) method. In the ensemble method, the clustering is done with categorical data clustering algorithm, one of them is a ROCK method (Robust Clustering using links). There is a lot of research and development concerning both methods, but research about performance comparative between methods is still limited. Therefore, this study do a performance comparison between the ensemble ROCK method and ensemble SWFM method. Both of these method are used for the case study about clustering of citrus accessions which have a mixed numerical and categorical dataset. Best clustering method is determined by the smallest rasio of standard deviation in groups (SW) and standard deviation between groups (SB). Clustering result for 25 observation obtained by using the ensemble ROCK method with values of θ is 0,27 produces three groups of data with ratio value of 0,1358, while the ensemble SWFM method produces two groups of data with ratio value of 0,3059. These results suggest that ROCK ensemble method provides better performance than the ensemble SWFM method. Characteristics of ensemble ROCK’s results are (a) group 1 consisted of 10 accessions with a small but heavy fruit, thick-skinned, the color dominant greenish yellow, predominantly smooth surface, diverse pulp, and medium water content, (b) group 2 consisted of 7 accession with medium size but heavy fruit, thin-skinned, variety color, diverse surface, diverse pulp, and high water content, and (c) group 3 consists of 3 accession with large but lightweight fruit, thick-skinned, yellow-green color, smooth surface, soft pulp, and medium water content.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Data Campuran; Data Numerik; Data Kategorik; Pengelompokan Ensembel; Similarity Weight; Filter Method; ROCK; Aksesi Jeruk; Mixed Data; Numeric Data; Categorical Data; Clustering Ensemble; Similarity Weight; Filter Method; ROCK; Citrus Accession
Subjects: Q Science > QA Mathematics > QA278 Cluster Analysis. Multivariate analysis. Correspondence analysis (Statistics)
Divisions: Faculty of Mathematics and Science > Statistics > 49101-(S2) Master Thesis
Depositing User: ALVIONITA -
Date Deposited: 28 Feb 2017 08:08
Last Modified: 05 Mar 2019 07:20
URI: http://repository.its.ac.id/id/eprint/2440

Actions (login required)

View Item View Item