Penerapan Metode C4.5, KNN, SVM, RF dalam Klasifikasi Talenta Karyawan Untuk Memperoleh Tingkat Akurasi Tertinggi

Stephanie, Cecilia (2019) Penerapan Metode C4.5, KNN, SVM, RF dalam Klasifikasi Talenta Karyawan Untuk Memperoleh Tingkat Akurasi Tertinggi. Masters thesis, Institut Teknologi Sepuluh Nopember”.

[thumbnail of 09211750054009-Master_Thesis.pdf]
Preview
Text
09211750054009-Master_Thesis.pdf

Download (3MB) | Preview

Abstract

Karyawan merupakan salah satu poin penting penggerak perusahaan. Dengan adanya sumber daya manusia yang kuat, perusahaan memiliki daya saing dan keunggulan kompetitif dibandingkan kompetitor. Manajemen talenta karyawan diperlukan untuk mengelola talenta karyawan. Salah satu bagian penting dari manajemen talenta adalah identifikasi talenta karyawan. Saat ini, PT. XYZ belum memiliki alat untuk melakukan identifikasi talenta karyawan. Oleh karena itu, peneliti melakukan penelitian untuk membantu perusaaan PT.XYZ dalam melakukan klasifikasi talenta karyawan dengan tingkat akurasi tertinggi. Penelitian ini menggunakan data karyawan dari PT. XYZ sejumlah 1261 data. Karyawan akan diklasifikasikan dalam matriks 4 kotak manajemen talenta. Metode yang digunakan untuk mencari tingkat akurasi tertinggi yaitu C4.5, K-nearest neighbours (KNN), Support Vector Machine (SVM), Random Forest (RF). Pengujian metode pembelajaran menggunakan metode 10-fold cross validation. Confusion matrix digunakan untuk mengevaluasi hasil klasifikasi terhadap model dengan data aktual yang ada. Berdasarkan uji coba yang dilakukan, metode KNN memiliki tingkat akurasi tertinggi yaitu 90.13%, tingkat presisi 91%, dan tingkat recall 98.95%. Jumlah tetangga (nilai k) paling optimal untuk metode KNN adalah 5 dengan tingkat akurasi 88.35%. Tingkat akurasi kedua pada penelitian ini didapat melalui metode C4.5 sebesar 89.17% dengan tingkat presisi 90.32% serta tingkat recall 98.59%. Data demografi karyawan (seperti gender, status pernikahan, jumlah anak, dan usia) tidak bisa dijadikan acuan sebagai manajemen talenta karyawan karena nilai koefisien Pearsonnya dibawah 0.2. Nilai koefisien Pearson dari variabel yang akan dijadikan acuan sebaiknya diatas 0.5.
=================================================================================================================================
Employees are one of the important points driving the company. With the existence of strong human resources, companies have competitiveness and competitive advantage compared to competitors. Employee talent management is needed to manage employee talents. One important part of talent management is the identification of employee talents. At present, PT. XYZ does not have a tool to identify employee talents. Therefore, the researcher conducted a research to help the company PT. XYZ in classifying employee talents with the highest level of accuracy. This study uses employee data from PT. XYZ is 1261 data. Employees will be classified in a matrix of 4 talent management boxes. The method used to find the highest level of accuracy is C4.5, K-nearest neighbors (KNN), Support Vector Machine (SVM), Random Forest (RF). Testing the learning method uses the 10-fold cross validation method. Confusion matrix is used to evaluate the results of the classification of the model with the actual data available. Based on the trials conducted, the KNN method has the highest accuracy rate of 90.13%, 91% precision level, and 98.95% recall rate. The optimal number of neighbors (k value) for the KNN method is 5 with an accuracy rate of 88.35%. The second level of accuracy in this study was obtained through the C4.5 method of 89.17% with a precision level of 90.32% and a recall rate of 98.59%. Employee demographic data (such as gender, marital status, number of children, and age) cannot be used as a reference for employee talent management because the Pearson coefficient value is below 0.2. The value of the Pearson coefficient of the variable that will be used as a reference should be above 0.5.

Item Type: Thesis (Masters)
Additional Information: RTMT 658.54 Ste p-1
Uncontrolled Keywords: klasifikasi karyawan, C4.5, K-nearest neighbours(KNN), Support Vector Machine (SVM), Random Forest (RF)
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
T Technology > T Technology (General) > T58.5 Information technology. IT--Auditing
T Technology > T Technology (General) > T58.6 Management information systems
Divisions: Faculty of Business and Management Technology > Management Technology > 61101-(S2) Master Thesis
Depositing User: Miss Cecilia Stephanie
Date Deposited: 26 Mar 2025 04:04
Last Modified: 26 Mar 2025 04:04
URI: http://repository.its.ac.id/id/eprint/66371

Actions (login required)

View Item View Item