Tantri, Ashr Hafiizh (2020) Ekstraksi Informasi Semantik dan Spatiotemporal pada Artikel Online Terkait Bencana di Indonesia. Masters thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
05211750012014-Master_Thesis.pdf Download (3MB) | Preview |
Abstract
Indonesia merupakan salah satu negara yang memiliki resiko tinggi dalam bencana alam. Indonesia masuk dalam kategori resiko tinggi dengan peringkat ke 36 dari 172 negara berdasarkan indeks risiko terhadap bencana. Pada tahun 2017 terdapat 2.372 kejadian bencana di Indonesia, dimana jumlahnya meningkat 2 kali lipat jika dibandingkan kejadian bencana pada 10 tahun sebelumnya sehingga perlu dilakukan tindakan untuk meminimalisir dampak dari kejadian bencana alam. Ada beberapa cara yang bisa digunakan untuk membantu mengurangi dari dampak bencana alam. Salah satu cara yang bisa dilakukan adalah melakukan pemodelan peta bahaya. Dalam pembuatan peta bahaya, ada beberapa pendekatan yang bisa digunakan, salah satunya adalah dengan pendekatan semantik untuk mengekstraksi informasi bencana. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan sistem yang bisa digunakan untuk melakukan ekstraksi informasi spatiotemporal dan semantik terkait bencana alam di Indonesia. Penelitian ini menggunakan metode NLP dalam melakukan proses ekstraksi informasi. Proses ektraksi informasi dilakukan dengan menggunakan aplikasi GATE (General Architecture for Text Engineering). Dalam memproses artikel berbahasa indonesia, perlu dilakukan pengembangan plugin GATE karena struktur informasi bahasa Indonesia berbeda dengan struktur informasi bahasa Inggris yang merupakan bahasa bawaan pada aplikasi GATE. Proses pengembangan plugin dilakukan dengan memanfaatkan ontologi sebagai dasar dari penentuan informasi semantik. selain itu juga dilakukan studi literatur terkait aturan pemerintah yang menjelaskan lebih lanjut mengenai kebutuhan informasi semantik dan spatiotemporal tentang kejadian bencana. performa sistem yang dikembangkan menghasilkan nilai precision sebesar 38% dan nilai recall sebesar 32%. hal ini dikarenakan sistem mengalami beberapa kesulitan dalam melakukan proses inferensi informasi. Proses inferensi dilakukan agar bisa menyusun kalimat utuh berisi informasi semantik, informasi spasial, dan informasi temporal dengan lebih baik. Penyebab precision rate sistem yang mencapai nilai 38% dikarenakan rules yang digunakan dalam proses inferensi untuk memasangkan tiga jenis informasi masih kurang bisa mengakomodasi variasi posisi informasi di kalimat yang berbeda beda.
===============================================================================================================================
Indonesia is one country that has a high risk of natural disasters. Indonesia is in the high-risk category with a ranking of 36 out of 172 countries based on disaster risk index. In 2017 there were 2,372 disaster incidents in Indonesia, where the number has doubled compared to the disaster events in the previous 10 years so actions need to be taken to minimize the impact of natural disasters. Several ways can be used to help reduce the effects of natural disasters. One way that can be done is to do a hazard map modeling. In making hazard maps, several approaches can be used, one of which is the semantic approach to extracting disaster information. Therefore, this study aims to develop a system that can be used to extract spatiotemporal and semantic information related to natural disasters in Indonesia. This study uses the NLP method in conducting the information extraction process. The information extraction process is carried out using the GATE (General Architecture for Text Engineering) application. In processing Indonesian language articles, it is necessary to develop the GATE plugin because the Indonesian information structure is different from the English information structure which is the default language of the GATE application. The plugin development process is done by using ontology as the basis for determining semantic information. Also, a literature study was carried out related to government regulations that further explained the need for semantic and spatiotemporal information about disaster events. system performance developed produces a precision value of 38% and a recall value of 32%. this is because the system experiences some difficulties in carrying out the information inference process. The inference process is carried out to compile whole sentences containing semantic information, spatial information, and temporal information better. The reason for the precision rate of the system which reaches 38% is because the rules used in the inference process to pair the three types of information still cannot accommodate the variation of information positions in different sentences.
Item Type: | Thesis (Masters) |
---|---|
Additional Information: | RTSI 006.7 Tan e-1 |
Uncontrolled Keywords: | indonesia, information extraction, natural disaster, online news article, semantic |
Subjects: | T Technology > T Technology (General) |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 59101-(S2) Master Thesis |
Depositing User: | Ashr Hafiizh Tantri |
Date Deposited: | 12 Mar 2025 04:00 |
Last Modified: | 12 Mar 2025 04:00 |
URI: | http://repository.its.ac.id/id/eprint/74428 |
Actions (login required)
![]() |
View Item |