Analisis kelompok dengan metode kernel K-means (studi kasus pengelompokan kabupaten/kota di Indonesia berdasarkan penduduk dengan faktor-faktor risiko penyebab penyakit hipertensi)

Maysaroh, Siti (2015) Analisis kelompok dengan metode kernel K-means (studi kasus pengelompokan kabupaten/kota di Indonesia berdasarkan penduduk dengan faktor-faktor risiko penyebab penyakit hipertensi). Masters thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
1313201711-Dissertation.pdf

Download (5MB)
[img] Text
1313201711-Paper-1313201711-makalah-paperpdf.pdf

Download (1MB)
[img] Text
1313201711-Presentation-1313201711-presentationpdf.pdf

Download (1MB)

Abstract

K-means clustering adalah salah satu metode pengelompokan nonhirarki yang paling banyak digunakan karena algoritma K-means lebih sederhana dan cepat prosesnya. Namun K-Means Clustering memiliki kelemahan di dalam memproses data yang berdimensi banyak, yang sifatnya tidak dapat dipisahkan secara linier. Dalam perkembangannya, fungsi kernel digunakan untuk mengatasi pengelompokan data yang bersifat tidak linier. Metode pengelompokan yang menggunakan fungsi kernel tersebut dikenal dengan Kernel K-Means Clustering. Dalam penelitian ini akan dibahas mengenai konsep pengelompokkan dengan metode Kernel K-Means, serta penerapannya pada data simulasi dan data riil. Data simulasi yang digunakan berupa data yang bersifat linier dan non linier. Sedangkan data riil yang digunakan adalah data persentase penduduk yang memiliki faktor–faktor risiko penyebab penyakit hipertensi. Tujuan dari penelitian ini adalah untuk mengkaji konsep metode kernel k-means clustering, membandingkan pengelompokan pada data simulasi dan data riil, serta melakukan pengelompokan kabupaten/kota di Indonesia berdasarkan faktor-faktor resiko penyebab penyakit hipertensi pada kelompok usia produktif menggunakan metode K-Means Clustering dan Kernel K-Means Clustering. Algoritma Kernel K-Means pada prinsipnya hampir sama dengan metode K-Means, perbedaannya terletak pada inputnya, yaitu pada Kernel K-Means data dipetakan pada dimensi baru menggunakan fungsi kernel. Dari hasil studi simulasi dengan kriteria kesesuaian plot, nilai clustering error dan nilai indeks validitas kelompok, metode pengelompokan Kernel K-Means lebih baik daripada metode K-Means. Begitu pula pada data riil hasil pengelompokan dengan metode Kernel K-Means lebih baik daripada K-Means. ============================================================================================================ K-means clustering is a method of nonhierarchi grouping which is most widely used due to its simple and quick process algorithm of K-means. The KMeans Clustering had weakness in processing non-linier and multi dimensions data. To overcome these problems, kernel function is used to make the grouping process or better known as Kernel K-Means Clustering. In this study will be discussed on the concept of grouping the Kernel K-Means method, and its application to the simulation data and the real data. The simulation data was data that linearly separable and non linearly separable. While the real data was data the percentage of people who have these risk factors cause hypertension. The purpose of this study is to assess the Kernel K-Means clustering, compare grouping the simulated data and real data, as well as grouping districts / cities in Indonesia based on risk factors for disease-causing hypertension in the productive age group using the K-Means Clustering and Kernel K-Means Clustering. Kernel K-Means algorithm on a principle similar to K-Means method, the difference lies in the input, namely the Kernel K-Means mapped data on a high dimension using kernel functions. Based on application to the simulation data and the real data , with the criteria for grouping that is plotting, value of clustering error and validity index, grouping method using Kernel K-Means is better than K-means.

Item Type: Thesis (Masters)
Additional Information: RTSt 519.53 May a
Uncontrolled Keywords: Analisis Kelompok, K-Means Clustering, Kernel K-Means Clustering,indeks S_Sbw
Subjects: Q Science > QA Mathematics > QA278.55 Cluster analysis
Divisions: Faculty of Mathematics and Science > Statistics > (S2) Master Theses
Depositing User: - Taufiq Rahmanu
Date Deposited: 21 Nov 2019 06:59
Last Modified: 21 Nov 2019 06:59
URI: http://repository.its.ac.id/id/eprint/71946

Actions (login required)

View Item View Item