Klasifikasi Popularitas Berita Online Menggunakan CNN - Factorization Machine

Iswenda, Brilliant Ayang (2025) Klasifikasi Popularitas Berita Online Menggunakan CNN - Factorization Machine. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6003231027-Master_Thesis.pdf] Text
6003231027-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2027.

Download (2MB) | Request a copy

Abstract

Perkembangan berita online telah menjadikannya sebagai sumber informasi utama bagi masyarakat, menggantikan posisi media cetak yang sebelumnya dominan. Dalam persaingan yang semakin ketat, banyak perusahaan media mengandalkan page views untuk mendorong pendapatan iklan, yang menjadikannya salah satu indikator kinerja utama mereka. Meski begitu, media seperti XYZ masih menghadapi tantangan dalam mengoptimalkan strategi konten untuk menarik lebih banyak pembaca. Meskipun telah menetapkan target berbasis page views, banyak artikel yang dipublikasikan gagal menarik audiens yang cukup besar, sehingga kinerja mereka belum maksimal. Hal ini disebabkan oleh kurangnya pemahaman terhadap preferensi pembaca dan kurangnya inovasi dalam penyajian berita. Untuk mengatasi tantangan ini, pemanfaatan machine learning dapat membantu media XYZ dalam mengidentifikasi judul yang tepat, topik populer, hingga waktu yang tepat untuk menerbitkan berita, serta strategi penyampaian konten yang lebih menarik. Dengan memanfaatkan Convolutional Neural Network (CNN) yang mampu mengekstrak sentimen dari judul berita, dan Factorization Machine (FM) yang mengidentifikasi interaksi antar atribut artikel, media dapat menciptakan model klasifikasi popularitas berita yang lebih akurat. Kajian algoritma FM menunjukkan bahwa metode ini dirancang untuk melakukan klasifikasi dengan mengutamakan bobot setiap fitur, serta bobot interaksi antar fitur yang dapat digunakan untuk optimalisasi fitur artikel berita online. Pada model CNN, terdapat indikasi overfitting yang dipengaruhi oleh kurangnya kosakata pada data training yang dapat dioptimalkan dengan menambahkan jumlah data atau kosakata baru pada data training. Model FM berhasil mengklasifikasikan popularitas artikel berita dengan lebih baik dari KNN dan Decision Tree.
==================================================================================================================================
The rise of online news has positioned it as the primary source of information for the public, replacing the once-dominant print media. In an increasingly competitive landscape, many media companies rely on page views to drive advertising revenue, making it one of their key performance indicators. However, media outlets like XYZ still struggle to optimize their content strategies to attract more readers. Despite setting page view-based targets, many of their published articles fail to capture a large enough audience, resulting in suboptimal performance. This challenge stems from a limited understanding of reader preferences and a lack of innovation in news presentation. To address these issues, the use of machine learning can help XYZ identify the right headlines, popular topics, and optimal publishing times, as well as craft more engaging content strategies. By leveraging Convolutional Neural Networks (CNN) to extract sentiment from news headlines and Factorization Machines (FM) to detect interactions between article attributes, media organizations can develop more accurate news popularity classification models. The study on the FM algorithm indicates that this method is designed to perform classification by prioritizing the weight of each feature and the weight of interactions between features, which can be utilized to optimize features in online news articles. In the CNN model, there are indications of overfitting, influenced by the limited vocabulary in the training data, which can be improved by increasing the amount of data or introducing new vocabulary into the training data. The FM model successfully classifies the popularity of news articles more effectively than KNN and Decision Tree.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Convolutional Neural Network, Factorization Machine, Klasifikasi, Popularitas Artikel Berita Online
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
Q Science > QA Mathematics > QA276 Mathematical statistics. Time-series analysis. Failure time data analysis. Survival analysis (Biometry)
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49101-(S2) Master Thesis
Depositing User: Brilliant Ayang Iswenda
Date Deposited: 03 Feb 2025 04:01
Last Modified: 03 Feb 2025 04:01
URI: http://repository.its.ac.id/id/eprint/117908

Actions (login required)

View Item View Item