Ensemble Fuzzy, K-Prototypes & Density Peaks Clustering Mixed) pada Pengelompokan Data Pelamar Bidikmisi Sejawa-Timur Tahun 2016-2017

Qadrini, Laila (2018) Ensemble Fuzzy, K-Prototypes & Density Peaks Clustering Mixed) pada Pengelompokan Data Pelamar Bidikmisi Sejawa-Timur Tahun 2016-2017. Masters thesis, ITS.

[thumbnail of TESIS LAILA QADRINI.pdf]
Preview
Text
TESIS LAILA QADRINI.pdf - Accepted Version

Download (902kB) | Preview

Abstract

Metode Pengelompokan pada data mining berbeda dengan metode konvensional yang biasa digunakan untuk pengelompokkan. Perbedaannya adalah data mining memiliki dimensi data yang tinggi yaitu bisa terdiri dari puluhan ribu atau jutaan record dengan puluhan ataupun ratusan atribut. Selain itu pada data mining data bisa terdiri dari tipe data campuran seperti data numerik dan kategorik. Permasalahan yang sering ditemui dalam analisis pengelompokan adalah data yang berskala campuran numerik dan kategorik. Penelitian ini bertujuan untuk membandingkan hasil pengelompokan dari. Ensembel Fuzzy, K-Prototypes dan DPC-M. Ketiga Algoritma ini diterapkan untuk mengelompokkan pelamar beasiswa Bidikmisi di Jawa Timur selama tahun 2016-2017. Secara umum, validasi pengelompokan dapat dikategorikan ke dalam tiga kelas, yaitu validasi pengelompokan internal, validasi pengelompokan eksternal, dan validasi relatif. Pada penelitian ini kita fokus pada indeks validitas internal dan eksternal kelompok, berdasarkan hasil penelitian menunjukkan bahwa, secara keseluruhan, Algoritma Ensembel Fuzzy memiliki hasil pengelompokan yang lebih baik daripada Algoritma K-Prototypes dan DPC-M.
===================================================================================================
The Clustering method in data mining differs from the conventional method commonly used for clustering. The difference is that data mining has a high data dimension that can consist of tens of thousands or millions of records with tens or hundreds of attributes. In addition to data mining data can consist of mixed data types such as numerical and categorical data. The problems that are often encountered in clustering analysis are numerical and categorical mixed data. This study aims to compare the results of clustering from. Fuzzy Ensembles, K-Prototypes and DPC-M. These three algorithms are applied to classify Bidikmisi scholarship applicants in East Java during 2016-2017. In general, clustering validation can be categorized into three classes, which are internal clustering validation, external clustering validation, and relative validation. In this study we focus on internal and external group validity indexes, based on the results of the research indicating that, overall, The Fuzzy Ensemble Algorithm has better clustering results than K-Prototypes Algorithm and DPC-M.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Ensemble Fuzzy, K-Prototypes, Density Peaks Clustering Mixed (DPC-M)
Subjects: Q Science > QA Mathematics > QA278.55 Cluster analysis
Divisions: Faculty of Mathematics and Science > Statistics > 49101-(S2) Master Thesis
Depositing User: Laila Qadrini
Date Deposited: 04 Aug 2021 23:40
Last Modified: 04 Aug 2021 23:40
URI: http://repository.its.ac.id/id/eprint/58523

Actions (login required)

View Item View Item