Ekstraksi Fitur Produktivitas Dinamis Berdasarkan Topik Ilmiah Untuk Klasterisasi Peneliti

Haniefardy, Addien (2021) Ekstraksi Fitur Produktivitas Dinamis Berdasarkan Topik Ilmiah Untuk Klasterisasi Peneliti. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06211850017003-Master_Thesis.pdf] Text
06211850017003-Master_Thesis.pdf - Accepted Version

Download (2MB)

Abstract

Pengelompokkan peneliti seringkali menggunakan informasi tekstual yang terdapat pada artikel ilmiah peneliti, contohnya judul, abstrak, dan kata kunci sehingga menghasilkan kelompok peneliti dengan kemiripan informasi tekstual pada artikel ilmiah mereka. Pengelompokkan peneliti juga seringkali menggunakan jumlah publikasi dan sitasi sehingga menghasilkan kelompok peneliti yang memiliki jumlah publikasi dan sitasi yang cenderung sama. Berdasarkaan kedua metode di atas, penelitian ini mencoba untuk menganalisis penggunaan topik artikel ilmiah pada proses ekstraksi fitur produktivitas. Fitur ini merupakan fitur yang didapatkan melalui penghitungan kinerja peneliti berdasarkan jumlah publikasi dan sitasi. Hasil ekstraksi fitur akan digunakan untuk klasterisasi peneliti menggunakan metode K-Means++. Sebelum data peneliti diklasterisasi, terlebih dahulu data peneliti dianalisis untuk menghilangkan kemungkinan adanya outlier. Evaluasi hasil klaster dilakukan dengan mempertimbangkan nilai Sum Squared Error dan Silhouette. Hasilnya, klaster optimal didapatkan dengan nilai K sama dengan 8 dan nilai silhouette sama dengan 0.15396. Kemudian, hasil klaster dianalisis untuk dapat memberikan label terhadap masing-masing klaster dengan mempertimbangkan topik artikel ilmiah, jumlah publikasi dan jumlah sitasi.
===================================================================================================================================
Researcher clustering often uses textual information contained in scientific articles, for example titles, abstracts, and keywords, resulting in groups of researchers with similar textual information from their scientific articles. Researchers clustering also often uses the number of publications and citations, resulting in groups of researchers who tend to have the same number of publications and citations. Based on the two methods above, this study attempts to analyze the use of scientific article topics in the productivity feature extraction process. This feature is a feature obtained through calculating the performance of researchers based on the number of publications and citations. The results of feature extraction will be used for clustering researchers using the K-Means++ method. Before it is clustered, the researcher data must be analyzed first to eliminate the possibility of outliers. Evaluation of cluster results is carried out by considering the Sum Squared Error and Silhouette values. As a result, the optimal cluster is obtained with a K value equal to 8 and a silhouette value equal to 0.15396. Then, the results of the clusters are analyzed to be able to label each cluster by considering the topic of scientific articles, number of publications and number of citations.

Item Type: Thesis (Masters)
Additional Information: RTIf 005.74 Han e-1 2021
Uncontrolled Keywords: Klasterisasi Peneliti, Kinerja Publikasi, Produktivitas, Topik Artikel Ilmiah, Publikasi, Sitasi
Subjects: Q Science > QA Mathematics > QA278.55 Cluster analysis
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: - Davi Wah
Date Deposited: 14 Jun 2023 03:48
Last Modified: 14 Jun 2023 03:48
URI: http://repository.its.ac.id/id/eprint/98117

Actions (login required)

View Item View Item