Perbaikan Performa Deteksi Informasi Dan Klasifikasi Tingkat Kepentingan Berita Pada Aplikasi Peta Kabar

Arief, Nabil Fikri (2023) Perbaikan Performa Deteksi Informasi Dan Klasifikasi Tingkat Kepentingan Berita Pada Aplikasi Peta Kabar. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111940000086-Undergraduate_Thesis.pdf] Text
05111940000086-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2025.

Download (2MB) | Request a copy

Abstract

Berita merupakan cerita atau keterangan mengenai kejadian atau peristiwa yang hangat. Berita biasanya memiliki unsur berupa apa, siapa, kenapa, kapan, dimana, dan bagaimana atau yang biasa disingkat dengan “5W + 1H”. Banyaknya jumlah berita yang tersedia secara daring mengharuskan masyarakat memilah berita sesuai yang mereka inginkan. Tingkat kepentingan dari suatu berita juga perlu diketahui untuk memudahkan masyarakat mencari informasi yang sesuai dengan kepentingan mereka. Peta Kabar adalah aplikasi yang mengumpulkan berita dari berbagai topik seperti ekonomi, kriminalitas, kecelakaan, olahraga, bencana, dan kesehatan. Berita tersebut diambil berdasarkan waktu terbaru dan dianalisis agar informasinya dapat dimasukkan ke dalam Peta Kabar. Pengumpulan data dilakukan dengan cara scraping halaman dari situs berita daring. Kemudian dilakukan pengolahan data untuk mendapatkan informasi berita berupa what, who, where, dan when (4W). Ekstraksi informasi yang dilakukan Peta Kabar saat ini belum maksimal sehingga pada uji coba dilakukan peningkatan akurasi ekstraksi informasi 4W menggunakan metode Latent Dirichlet Allocation, POS Tagging, dan Rule-based Named Entity Recognition. Proses klasifikasi tingkat kepentingan pada Peta Kabar juga belum maksimal sehingga pada uji coba dilakukan pengujian semua model klasifikasi yang digunakan sebelumnya ditambah dengan Deep Learning untuk mencari model terbaik untuk seluruh topik berita. Hasil dari uji coba pada setiap topik berita menunjukkan bahwa implementasi mendapatkan rata-rata peningkatan akurasi informasi what sebanyak 16,15%, who sebanyak 39,69%, where sebanyak 22,11%, dan when sebanyak 2,6%. Model klasifikasi terbaik untuk semua topik berita adalah Random Forest yang mempunyai akurasi dengan rata-rata 99,75% dan mendapatkan rata-rata peningkatan sebesar 4,34%.
===============================================================================================================================
News is a story or information about a hot event or incidents. News usually contains elements such as what, who, why, when, where, and how, commonly abbreviated as "5W + 1H." The abundance of news available online requires people to filter news according to their preferences. The level of importance of a news item also needs to be known to help people find information that aligns with their interests. Peta Kabar is an application that collects news from various topics such as economy, crime, accidents, sports, disasters, and health. The news is gathered based on the latest time and analyzed to be included in Peta Kabar. Data collection is done by scraping pages from online news sites. Then, data processing is carried out to obtain news information in the form of what, who, where, and when (4W). The information extraction performed by Peta Kabar is currently not optimal, so in the trial, efforts were made to improve the accuracy of 4W information extraction using the methods of Latent Dirichlet Allocation, POS Tagging, and Rule-based Named Entity Recognition. The classification process of the importance level in Peta Kabar is also not yet optimal, so in the trial, testing was conducted on all previously used classification models, combined with Deep Learning, to find the best model for all news topics. The test results for each news topic show that the implementation achieved an average increase in accuracy for what information by 16.15%, who information by 39.69%, where information by 22.11%, and when information by 2.6%. The best classification model for all news topics is Random Forest, which has an average accuracy score of 99.75% and an average increase in accuracy by 4.34%.

Item Type: Thesis (Other)
Uncontrolled Keywords: berita, kepentingan, klasifikasi, peta kabar, classification, importance, news, peta kabar
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Nabil Fikri Arief
Date Deposited: 05 Aug 2023 14:24
Last Modified: 05 Aug 2023 14:24
URI: http://repository.its.ac.id/id/eprint/101283

Actions (login required)

View Item View Item