Praja, Dewangga Prasetya (2018) Rancang Bangun Aplikasi Untuk Mengekstraksi Dan Menyajikan Informasi Event Secara Realtime Dari Media Sosial Dengan Metode Conditional Random Field Menggunakan Kerangka Kerja Flask Python. Undergraduate thesis, Insitut Teknologi Sepuluh Nopember.
Preview |
Text
05211440000038-Undergraduate_Theses.pdf - Accepted Version Download (2MB) | Preview |
Abstract
Melihat tingginya jumlah pengguna internet di dunia, mendorong masyarakat dunia untuk terlibat dalam berbagai jenis media sosial. Beberapa sosial media yang populer digunakan sekarang ini antara lain adalah Instagram, Facebook dan Twitter. Media sosial memberikan pengaruh besar terhadap penyebaran informasi. Hal ini mendorong penyelenggara event untuk bekerja sama dengan media partner dalam mempromosikan kegiatan melalui sosial karena lebih efisien dan ekonomis dibanding melalui media konvensional. Di sisi lain, publikasi merupakan salah satu faktor penting dalam kesuksesan suatu acara khususnya untuk acara yang mengandalkan jumlah pengunjung sebagai sumber utama pendapatan. Semakin banyak tiket yang terjual semakin besar pula pemasukan. Informasi kegiatan dapat lebih optimal jika informasi pokok, seperti waktu, tempat, nama kegiatan, maupun narahubung, dapat diorganisir dengan lebih baik. Salah satu metode dalam mengorganisir informasi dari data tidak terstruktur menjadi data terstruktur adalah menggunakan information extraction atau lebih spesifik pada event extraction. Dengan menggunakan event extraction, informasi seperti nama tempat dapat dikenali dan ditandai. Terutama untuk informasi tempat dapat ditandai pada peta, atau waktu pelaksanaan kegiatan dapat diubah menjadi tanggal dengan format yang standar. Maka dari itu, diperlukan adanya aplikasi yang dapat mengorganisir informasi event yang diberikan oleh media partner. Secara teknis, algoritma yang digunakan dalam penelitian ini adalah menggunakan Conditional Random Field yang didukung menggunakan PoS Tagging dan Named Entity Recognition. Dalam proses pelaksanaan, terdapat lima komponen utama yang dibuat, antara lain komponen Scrapping, Sistem Pelabelan, Model CRF, Sistem Kafka, dan Visualisasi. Serta dilakukan unit testing pada modul yang dianggap krusial. Hasil dari penelitian ini didapatkan kesimpulan bahwa nilai akurasi secara keseluruhan model adalah 94,48%. Namun nilai tersebut didominasi oleh label OTHER yang memiliki jumlah yang jauh dari label yang lain. Walaupun memiliki nilai akurasi yang tinggi, disisi lain nilai recall yang didapat untuk label NAME dan INFO hanya mencapai 49% dan 60%.============ High amount of internet user in the world encourage peoples to involve in every kind of social media. Social medias that recently popular were Instagram, Facebook and Twitter. Social medias give big impacts toward the dissemination of information. These impacts encourage event organizers to collaborate with event media partners in term of promoting their event via social media because this way makes more efficient and lower budget than via conventional media. On the other hand, publication is one of important factor on the success rate of an event, especially for some sort of event that depend on the amount of visitors as source of income. More ticket sold means the more income that would get. Event information would became more optimal if main information – time, place, name of event, nor contact person – could be organized well. Method to organize those informations is by using information extraction for event – Event Extraction. Informations can be recognized and labeled. Especially, the place where the event were held can be located on the map, or the time when the event were held can be formatted as standard format. Therefore, application that could organize event information from social media is needed. Technically, this research is using Conditional Random Field as the main method supported by PoS Tagging and Named Entity Recognition. There are five main components in the implementation – Scrapping, Tagging System, CRF Model, Kafka System, and Visualization. There are unit testing on some important modul in every components. The result of this research can be concluded that the accuracy value is 94,48%. However, this precentage were dominated by OTHER label that has higher amount of data than the other labels. Eventhough the accuracy is high, on the other hand, recall value from the NAME label and INFO label only reach 49% and 60%.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | Information Extraction; Media Sosial; Conditional Random Field; Place Recognition; Time Recognition |
Subjects: | H Social Sciences > HM Sociology > HM742 Online social networks. Q Science > QA Mathematics > QA76 Computer software Q Science > QA Mathematics > QA76.6 Computer programming. Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science) Q Science > QA Mathematics > QA76.9 Computer algorithms. Virtual Reality. Computer simulation. |
Divisions: | Faculty of Information and Communication Technology > Information Systems > 57201-(S1) Undergraduate Thesis |
Depositing User: | Praja Dewangga Prasetya |
Date Deposited: | 20 Jul 2018 02:35 |
Last Modified: | 12 Mar 2021 04:45 |
URI: | http://repository.its.ac.id/id/eprint/52723 |
Actions (login required)
View Item |