Klasifikasi Berita Berdasarkan Content Berita Online Kota Surabaya Menggunaka Metode Deep Learning Convolutional Neural Networks (CNN)

Khansa, Yusron Ardiyanto (2024) Klasifikasi Berita Berdasarkan Content Berita Online Kota Surabaya Menggunaka Metode Deep Learning Convolutional Neural Networks (CNN). Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5003201007-Undergraduated_Thesis.pdf] Text
5003201007-Undergraduated_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2026.

Download (3MB) | Request a copy

Abstract

Berita adalah informasi terkini yang disajikan secara cepat mengenai fakta atau konsep terbaru yang akurat. Berkembangnya teknologi informasi dan komunikasi telah mengubah pola akses masyarakat terhadap berita, terutama dengan peningkatan signifikan penggunaan internet di Indonesia. Hasil survei Nielsen dan data statistik menunjukkan pergeseran dari media tradisional ke media online dalam mendapatkan informasi terkini. Berita sendiri memiliki peran yang amat penting terhadap kegiatan sosial karena pemberitaan yang terdapat pada media massa akan memudahkan masyarakat untuk mencari kegiatan – kegiatan yang serupa dengan kejadian yang ada pada saat ini. Oleh karena itu untuk memudahkan mengidentifikasi maupun klasifikasi isi berita pada pemberitaan media massa. Salah media informasi yang menerbitkan berita harian mengenai kejadian atau isu Kota Surabaya adalah Tribunnews, untuk membantu proses labelisasi isi berita pada media massa tersebut. Penelitian ini akan mengklasifikasikan berita harian surabaya berdasarkan isi berita dengan menggunakan metode Deep Learning Convolutional Neural Network (CNN). Analisis klasifikasi dilakukan dengan menggunakan 5 model arsitektur CNN yang berbeda dan diambil hasil terbaik. Model terbaik yang didapatkan memiliki arsitektur kombinasi layer yaitu Word Embedding dengan pembobotan Word2Vec, Max Pooling 1D, Dropout 0,09 layer 1 dengan node 8 regularisasi L2 0,02, dan output layer menggunakan fungsi aktivasi softmax dengan kebaikan model data testing accuracy yang baik sebesar 93,96% dan data testing accuracy sebesar 88,77% serta AUC sebesar 99,6%, model yang didapatkan pada penelitian ini dapat menangkap fitur yang membedakan antar label dan model mampu memprediksi label lain, namun labelisasi yang digunakan belum menyeluruh sehingga model belum mampu menggeneralisir label label lainnya dalam melakukan klasifikasi.
========================================================================================================================
News News is up-to-date information presented in a timely manner about the latest accurate facts or concepts. The development of information and communication technology has changed the pattern of public access to news, especially with the significant increase in internet usage in Indonesia. Nielsen survey results and statistical data show a shift from traditional media to online media in getting the latest information. News itself has a very important role in social activities because the news contained in the mass media will make it easier for people to find activities that are similar to current events. Therefore, to facilitate the identification and classification of news content in mass media coverage. One of the information media that publishes daily news about events or issues in Surabaya City is Tribunnews, to help the process of labeling news content in the mass media. This research will classify Surabaya daily news based on news content using the Deep Learning Convolutional Neural Network (CNN) method. Classification analysis was carried out using 5 different CNN architecture models and the best results were taken. The best model obtained has a combination layer architecture, namely Word Embedding with Word2Vec weighting, Max Pooling 1D, dropout 0,09 layer 1 with 8 nodes regularization L2 0,02, and the output layer using the softmax activation function with good model goodness testing data accuracy of 93.96% and data testing accuracy of 88.77% and AUC of 99.6%, the model obtained in this study can capture features that distinguish between labels and the model is able to predict other labels, but the labeling used is not comprehensive so that the model has not been able to generalize other labels in classification news.

Item Type: Thesis (Other)
Uncontrolled Keywords: Convolutional Neural Networks, Isi Berita, Klasifikasi, Word Cloud Classification, Content News, Convolutional Neural Networks, Word Cloud
Subjects: H Social Sciences > HD Industries. Land use. Labor > HD108 Classification (Theory. Method. Relation to other subjects )
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Yusron Ardiyanto Khansa
Date Deposited: 09 Aug 2024 02:49
Last Modified: 09 Aug 2024 02:49
URI: http://repository.its.ac.id/id/eprint/114913

Actions (login required)

View Item View Item