Implementasi Nearest Neighbor pada Data Kategorik dengan Pembobotan Atribut Menggunakan Weighted Simple Matching Coefficient

Wijaya, Romario (2017) Implementasi Nearest Neighbor pada Data Kategorik dengan Pembobotan Atribut Menggunakan Weighted Simple Matching Coefficient. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5113100062-Undergraduate_Theses.pdf]
Preview
Text
5113100062-Undergraduate_Theses.pdf - Published Version

Download (2MB) | Preview

Abstract

Pada era saat ini, aplikasi komputer atau perangkat bergerak yang diperuntukkan untuk para pakar maupun yang diperuntukkan untuk orang awam terus dikembangkan ke arah yang lebih cerdas untuk memudahkan pekerjaan manusia. Aplikasi yang dibuat haruslah memiliki kemampuan untuk memberikan rekomendasi hasil analisa input. Contoh input yang paling sering dianalisa adalah data, baik itu data numerik maupun data kategorik. Di sinilah peran klasifikasi sangat dibutuhkan oleh para pembuat aplikasi untuk terus mengembangkan aplikasinya agar semakin cerdas dan diminati banyak orang.
Metode klasifikasi yang paling umum, simpel dan mudah untuk diterapkan salah satunya adalah k-Nearest-Neighbor (k-NN). Algoritma k-NN dinilai cepat karena merupakan Instance-based learning atau lazy-learning yang tidak memerlukan fase latihan yang panjang pada awal proses. Namun dalam penerapannya, untuk melakukan klasifikasi terhadap data kategorik, diperlukan cara khusus dalam menghitung jarak antar data yang ada. Salah satu cara khusus dalam menghitung jarak antar data yang paling sering diterapkan adalah menggunakan Simple Matching Coefficient (SMC). Dalam penelitian kali ini, akan diimplementasikan sebuah metode klasifikasi terhadap data kategorik yang menggunakan metode klasifikasi Nearest-Neighbor dengan pembobotan atribut menggunakan Weighted Simple Matching Coefficient (WSMC). Dengan diimplementasikannya metode kali ini, diharapkan dapat mendapatkan hasil klasifikasi yang optimal.
Uji coba yang dilakukan terhadap 6 dataset dengan atribut bersifat kategorik, menunjukkan kemampuan metode dalam melakukan klasifikasi. Dengan rata-rata akurasi tertinggi didominasi oleh metode lokal. Rata-rata akurasi tertinggi untuk dataset Nursery, Cars, Gerakan tangan, Soybeans, Vote dan Dhermatology berturut-turut sebesar 77.31%, 80.35%, 97.00%, 91.64%, 92.41%, dan 95.90%.
==============================================================================================
In this day, computer application or mobile application for the expert or for the common people is always developed in many smart ways to perform such a big help for people. The application that was made must have an ability to perform such input analyic recommendation. One of input type is data, the type can be either numeric or categorical. And this time, the use of classification is needed to make the application more smart and demanded by many people.
One of classification method that very common, and simple to be implemented is k-Nearest Neighbor(k-NN). K-NN Algorithm is considered fast enough because it is Instance based learning or lazy-learning classification which doesn’t need to perform such long training phase in the beginning process.But, in the further implementation for categorical data, a specific method is needed to calculate distance between the data. One of the method that is commonly used is Simple Matching Coefficient (SMC). In this research, a method of classification against categorical data using k-NN with attribute weighting using Weighted Simple Matching Coefficient (WSMC) method is implemented. By the implementation of this method, hopefully we can get the optimal classification result.
The testing phase is done against 3 set of data with attribute construct in categorical value. It’s showing that the abillity of this method to perform classification. With the highest average of accuracy is dominated by local method. The highest average of accuracy for set of data Nursery, Cars, Hand Movement, Soybeans, Vote, and Dhermatology are 77.31%, 80.35%, 97.00%, 91.64%, 92.41%, and 95.90% respectively.

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 006.32 Wij i-1
Uncontrolled Keywords: Nearest-Neighbor, categorical data, attribute weighting
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science. EDP
T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105 Data Transmission Systems
Divisions: Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Romario Wijaya .
Date Deposited: 14 Nov 2017 06:37
Last Modified: 05 Mar 2019 07:49
URI: http://repository.its.ac.id/id/eprint/43372

Actions (login required)

View Item View Item