Penggunaan Cluster Importance dan Named Entity Recognition untuk Penentuan Trending Issue Data Twitter dalam Peringkasan Berita Multidokumen

Kresnaprabowo, Reinardus Wandya (2020) Penggunaan Cluster Importance dan Named Entity Recognition untuk Penentuan Trending Issue Data Twitter dalam Peringkasan Berita Multidokumen. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111540000091-Undergraduate_Thesis.pdf]
Preview
Text
05111540000091-Undergraduate_Thesis.pdf

Download (1MB) | Preview

Abstract

Peringkasan berita multidokumen merupakan salah satu bentuk pengaplikasian machine learning yaitu pada sistem temu kembali informasi (information retrieval). Peringkasan berita multidokumen bertujuan untuk membuat sebuah berita yang kaya akan informasi. Maka dilakukan proses peringkasan berita dengan masukan sebuah kumpulan berita dan dengan keluaran sebuah ringkasan berita (peringkasan berita multidokumen) dengan harapan pembaca tidak perlu membaca banyak artikel berita untuk mengetahui informasi penting didalamnya. Proses peringkasan berita multidokumen terdiri dari beberapa fase. Salah satu fase terpenting pada peringkasan berita yang bersifat ekstraktif adalah pembobotan kalimat. Beberapa metode yang digunakan diantaranya posisi kalimat, centroid, dan kemiripan kalimat dengan judul, yang menitikberatkan pada fitur berita itu sendiri. Hal ini menyebabkan peringkasan berita multidokumen menjadi kurang koheren (tidak padu) terutama bila kumpulan berita dalam sebuah topik memiliki isu yang berbeda. Pada tugas akhir ini, penulis mengusulkan penggunaan Named Entity Recognition (NER) dan Cluster Importance (CI) untuk melakukan ekstraksi isu pada kumpulan tweet dengan topik tertentu untuk meningkatkan kualitas hasil ringkasan otomatis. Trending Issue yang telah diekstraksi dengan menggunakan NER dan CI dalam peringkasan berita multidokumen ini berhasil meningkatkan nilai ROUGE dan F1 ringkasan berita hingga 2%.
=================================================================================================================================
Multidocument news summarizaion is one form of application of machine learning in the information retrieval system. Multidocument news summarizaion aims to create a news that is rich in information. The process of summarizing with input a collection of news and output a summary (multidocument news summarizaion) have a goals that readers do not need to read many news articles to find important information in it. The multidocument news summary process consists of several phases. One of the most important phases of summarizing news (extractive method) is sentence weighting. Some of the methods used include sentence position, centroid, and sentence similarity to the title, which emphasizes the news feature itself. This causes the summary of multidocument news becomes less coherent (not coherent), especially if the collection of news on a topic has a different issue. In this thesis, the authors propose the use of Named Entity Recognition (NER) and Cluster Importance (CI) to extract issues on a collection of tweets with certain topics to improve the quality of automatic summary results. Trending Issues that have been extracted using NER and CI in summarizing multi-document news have succeeded in increasing the value of ROUGE and F1 news summary by up to 2%.

Item Type: Thesis (Other)
Additional Information: RSIf 006.312 Kre p-1 2020
Uncontrolled Keywords: Pengenalan Entitas Bernama, Penambangan Teks, Twitter, Peringkasan Berita Multidokumen
Subjects: T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105.546 Computer algorithms
T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK7895.S65 Speech recognition systems
Z Bibliography. Library Science. Information Resources > ZA Information resources > Z699.5 Information storage and retrieval systems
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Reinardus Wandya Kresnaprabowo
Date Deposited: 11 Mar 2025 02:16
Last Modified: 11 Mar 2025 02:16
URI: http://repository.its.ac.id/id/eprint/73840

Actions (login required)

View Item View Item