Klasifikasi Artikel Berita Berbahasa Indonesia Berbasis Naive Bayes Classifier Menggunakan Confix- Stripping Stemmer

Arifiyanti, Amalia Anjani (2014) Klasifikasi Artikel Berita Berbahasa Indonesia Berbasis Naive Bayes Classifier Menggunakan Confix- Stripping Stemmer. Other thesis, Insititut Teknologi Sepuluh Nopember.

[thumbnail of 5210100106_Undergraduate_Thesis.pdf] Text
5210100106_Undergraduate_Thesis.pdf

Download (2MB)

Abstract

Aliran berita yang dinamis dan mengalami perubahan yang cepat memerlukan pengklasifikasi artikel berita untuk mempermudah proses kategorisasi dokumen berita. Pada saat ini sudah banyak metode untuk melakukan kategorisasi berita, tetapi kebanyakan terbatas pada penggunaan korpus bahasa asing tertentu saja. Korpus berbahasa Indonesia memiliki tantangan tersendiri karena mempunyai susunan imbuhan yang berbeda dibandingkan dengan bahasa asing lainnya. Dalam tugas akhir ini dibangun sebuah aplikasi pengklasifikasi artikel berita berbahasa Indonesia berbasis Naïve Bayes classifier dengan menggunakan confix-stripping stemmer. Sebelum proses klasifikasi dilakukan, praproses terhadap artikel berita dilakukan untuk menghapus stopwords dan memenggal artikel menjadi sejumlah token. Algoritma confix-stripping stemmer kemudian digunakan untuk mecari kata dasar dari setiap token yang dihasilkan. Aplikasi pengklasifikasi artikel berita berbasis Naïve Bayes classifier dibangun dengan menggunakan kata dasar yang diperoleh dari berbagai artikel berita yang mewakili semua kategori berita yang akan dikelola. Aplikasi pengklasifikasi artikel berita yang telah berhasil dibangun dalam Tugas Akhir ini telah diujicobakan terhadap sejumlah sampel artikel berita yang terdiri dari 12 kategori. Hasil pengujian menunjukkan bahwa aplikasi yang dibangun dalam lingkungan sistem operasi Windows mampu menghasilkan pengklasifikasi dengan akurasi, precision, recall dan f-measure berturut-turut sebesar 87.675%, 88.21%, 87.65%, dan 87.69%.
=============================================================================================================================
Dynamic as well as rapid changing news stream needs news article classifier to ease the process of news document classification. Nowadays, there are already many methods for classifying news. Most of them, however, are limited only in the use of corpus for certain foreign languages. Indonesian language corpus has its own challenging section due to its different suffixes compared with other languages. In this final project, an application for classifying news article in Indonesian language based on Naive Bayes classifier using confix- stripping stemmer is developed. Before classying process is performed, a preprocessing step needs to be done to eliminate stopwords and split the article into a number of tokens. The confix-stripping stemmer algorithm is then applied to obtain the term corresponding to each token being produced. The news article classifier developed in this final project was modeled using all terms obtained from several news articles representing all news categories to be accommodated. A news art icle classifier application that has been successfully developed in this final project was tested using a set of news articles consisting of 12 categories. The test results showed that the application, which is developed under the windows operating system, is capable of producing sufficiently good classifier with accuration, precision, recall, and f-measure of 87.675%, 88.21%, 87.65% and 87.69%, respectively.

Item Type: Thesis (Other)
Additional Information: RSSI 005.1 Ari k
Uncontrolled Keywords: artikel berita, confix-stripping stemmer, klasifikasi teks, naïve bayes classifier, stemming bahasa Indonesia, confix-stripping stemmer, Indonesian language stemming, naïve bayes classifier, news articles, text classification
Subjects: Q Science > QA Mathematics > QA76 Computer software
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 57201-(S1) Undergraduate Thesis
Depositing User: Mr. Marsudiyana -
Date Deposited: 20 Nov 2023 07:36
Last Modified: 20 Nov 2023 07:36
URI: http://repository.its.ac.id/id/eprint/105162

Actions (login required)

View Item View Item