Ekstraksi Informasi Media Sosial Twitter Mengenai Gangguan Keamanan Menggunakan Pendekatan Ontology-Based Information Extraction (Studi Kasus: PT. Pertamina (Persero))

Christian, Benedict Timotius (2019) Ekstraksi Informasi Media Sosial Twitter Mengenai Gangguan Keamanan Menggunakan Pendekatan Ontology-Based Information Extraction (Studi Kasus: PT. Pertamina (Persero)). Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05211540000055-Undergraduate_Thesis.pdf] Text
05211540000055-Undergraduate_Thesis.pdf - Accepted Version

Download (3MB)

Abstract

Pemberitaan pada masa kini sudah beralih dari media massa konvensional menuju media teknologi informasi seperti media sosial Twitter, di Indonesia jumlah pengguna Twitter mencapai sekitar 49% dari total 130 juta pengguna media sosial di Indonesia. Namun dari pemberitaan yang beredar di media sosial, masih belum pemetaan atau pengolahan data tersebut. Oleh karena itu penelitian ini bertujuan untuk memetakan dan mengolah tweet pemberitaan, khususnya mengenai kasus kejahatan atau gangguan keamanan untuk membuat informasi yang bermanfaat dan membantu memberi masukan kepada PT. Pertamina (Persero). Metodologi yang digunakan dalam penelitian adalah Ontologi untuk ekstraksi informasi pada data yang sudah di crawling berdasarkan kategori yang sudah ditentukan dan Named-Entity Recognition. Metode Named-Entity Recognition digunakan untuk mengkategorikan data per tweet ke dalam kategori seperti aktor, lokasi, keterangan, time.
Hasil yang didapatkan adalah metode Named Entity Recognition dalam pembuatan model dapat menghasilkan ekstraksi informasi yang cukup akurat, serta penggunaan Ontologi mampu mengkategorikan tipe kejahatan/gangguan keamanan. Nilai akurasi yang didapatkan oleh model aktor sebesar 90.65% untuk precision, 90.82% untuk recall, 90.74% untuk f1 score. Nilai akurasi yang didapatkan oleh model lokasi sebesar 99.54% untuk precision, 98.37% untuk recall, 98.95% untuk f1 score. Nilai akurasi yang didapatkan oleh model keterangan sebesar 95.86% untuk precision, 99.75% untuk recall, 97.77% untuk f1 score. Nilai akurasi yang didapatkan oleh model time sebesar 99.99% untuk precision, 100% untuk recall, 100% untuk f1 score.
=================================================================================================================================
The mass media nowadays has been switched from conventional mass media to technology-based media such as Twitter. The number of Twitter users in Indonesia reaches around 49% of the total 130 million social media users in Indonesia. But from the news circulating on social media, it still hasn't mapped or processed the data. Therefore, this study aims to map and process news tweets, especially regarding crime or security disturbances cases to make useful information and help provide input to PT. Pertamina (Persero). The methodology used in research is Ontology for extracting data on crawled data based on predetermined categories and Named-Entity Recognition. The Named-Entity Recognition method is used to categorize data per tweet into categories such as actor, location, causes, time. The Named-Entity Recognition method is used to categorize data per tweet into categories such as actor, location, description, time. The results obtained are that the Named Entity Recognition method in modeling can produce fairly accurate information extraction, and the use of Ontology is able to categorize the types of crime / security disturbances. The value of accuracy obtained by the actor model is 90.65% for precision, 90.82% for recall, 90.74% for score f1. The accuracy value obtained by the location model is 99.54% for precision, 98.37% for recall, 98.95% for score f1. The causes value obtained by the answer model is 95.86% for precision, 99.75% for recall, 97.77% for score f1. The value obtained by the time model is 99.99% for precision, 100% for recall, 100% for score f1.

Item Type: Thesis (Other)
Additional Information: RSSI 006.7 Chr e-1 2019
Uncontrolled Keywords: Semantic Web, Ontology, NER, Twitter, kejahatan, gangguan keamanan
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105.88815 Semantic Web
Divisions: Faculty of Information and Communication Technology > Information Systems > 57201-(S1) Undergraduate Thesis
Depositing User: Benedict Timotius Christian
Date Deposited: 25 May 2023 06:11
Last Modified: 25 May 2023 06:11
URI: http://repository.its.ac.id/id/eprint/64513

Actions (login required)

View Item View Item