Ensemble Deep Learning untuk Deteksi Native Advertising pada Berita Elektronik

Darnoto, Brian Rizqi Paradisiaca (2025) Ensemble Deep Learning untuk Deteksi Native Advertising pada Berita Elektronik. Doctoral thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 7025221020__Disertasion.pdf] Text
7025221020__Disertasion.pdf
Restricted to Repository staff only

Download (10MB) | Request a copy

Abstract

Native advertising (native ads) merupakan bentuk konten komersial yang dirancang menyerupai konten editorial, terutama dalam format berita. Popularitasnya terus meningkat karena tampilannya yang menyerupai berita membuatnya tampak kredibel dan menarik perhatian pembaca. Namun, kemiripan ini sering kali menyesatkan karena kurangnya pengungkapan yang jelas bahwa konten tersebut adalah iklan, yang dapat memicu respons negatif seperti penolakan dan penghindaran iklan. Saat ini, deteksi native ads secara otomatis masih menjadi tantangan karena karakteristiknya yang bersifat implisit dan sering kali tidak dapat dibedakan secara langsung dari konten editorial biasa. Penelitian ini mengusulkan arsitektur baru berbasis deep learning bernama SENADA (Stacked Ensemble for Native Advertising Analysis), yang menggabungkan BERT, BiLSTM dengan attention mechanism, dan ensemble learning untuk meningkatkan akurasi dalam mendeteksi native ads pada berita elektronik berbahasa Indonesia. Penelitian ini diawali dengan pengembangan dataset native ads menggunakan Bahasa Indonesia yang dikumpulkan dari enam portal berita elektronik. Proses pelabelan dilakukan secara manual oleh annotator berdasarkan empat karakteristik implisit native ads, yaitu: konten bersentimen positif, menggambarkan perusahaan atau produk, bersumber dari satu sudut pandang, dan bersifat persuasif. Dataset yang dihasilkan kemudian digunakan untuk melatih model SENADA. Arsitektur model terdiri dari encoding awal menggunakan BERT, dilanjutkan dengan pemrosesan urutan menggunakan BiLSTM dan attention mechanism untuk menangkap elemen tekstual penting, dan akhirnya dikombinasikan dengan pendekatan ensemble untuk menghasilkan prediksi akhir. Model SENADA dievaluasi menggunakan confusion matrix dengan metrik akurasi, precision, recall, dan f1-score. Hasil evaluasi menunjukkan bahwa model ini mampu mencapai skor 0.93 pada keempat metrik tersebut, yang menandakan performa yang sangat baik dalam mendeteksi native ads. Dibandingkan dengan model baseline, SENADA menunjukkan peningkatan signifikan dalam menurunkan kesalahan klasifikasi dan meningkatkan keandalan sistem identifikasi native ads secara otomatis pada berita elektronik.

================================================================================================================================
Native advertising (native ads) is a form of commercial content designed to resemble editorial material, particularly in the form of news articles. Its popularity continues to grow, as its news-like appearance lends it credibility and captures readers’ attention. However, this resemblance can be misleading due to the lack of clear disclosure that the content is an advertisement, often triggering negative responses such as ad rejection and avoidance. Automatically detecting native ads remains a challenge, primarily because of their implicit characteristics, which make them difficult to distinguish from regular editorial content. This study proposes a novel deep learning architecture called SENADA (Stacked Ensemble for Native Advertising Analysis), which integrates BERT, BiLSTM with an attention mechanism, and ensemble learning to improve accuracy in detecting native ads in Indonesian-language electronic news. The research begins with the development of a native ads dataset in Bahasa Indonesia, collected from six online news portals. The labeling process is carried out manually by annotators based on four implicit characteristics of native ads: positive sentiment, promotional content about a company or product, single-source perspective, and persuasive language. This annotated dataset is then used to train the SENADA model. The architecture consists of initial encoding using BERT, followed by sequential modeling through BiLSTM and attention to capture key textual elements, and concludes with an ensemble approach to generate the final predictions. SENADA model is evaluated using a confusion matrix, with performance measured by accuracy, precision, recall, and F1-score. The results demonstrate that the model achieves a score of 0.93 across all four metrics, indicating strong performance in detecting native ads. Compared to baseline models, SENADA significantly reduces misclassification rates and enhances the reliability of automated native ad identification in electronic news content.

Item Type: Thesis (Doctoral)
Uncontrolled Keywords: BERT, BiLSTM, Deep learning, Ensemble learning, Native ads
Subjects: Q Science
Q Science > QA Mathematics
Q Science > QA Mathematics > QA336 Artificial Intelligence
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55001-(S3) PhD Thesis (Comp Science)
Depositing User: Brian Rizqi Paradisiaca Darnoto
Date Deposited: 21 Jul 2025 01:54
Last Modified: 21 Jul 2025 01:54
URI: http://repository.its.ac.id/id/eprint/120161

Actions (login required)

View Item View Item