Deteksi Keluhan Pengguna Secara Realtime Pada Tweet Berbahasa Indonesia Menggunakan Apache Flink

Bimantoro, Akbar Noto Ponco (2020) Deteksi Keluhan Pengguna Secara Realtime Pada Tweet Berbahasa Indonesia Menggunakan Apache Flink. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111640000028-Undergraduate_Thesis.pdf]
Preview
Text
05111640000028-Undergraduate_Thesis.pdf

Download (2MB) | Preview

Abstract

Perkembangan dan mudahnya akses internet membuat media sosial sangat populer di kalangan masyarakat. Masyarakat cenderung menggunakan media sosial seperti facebook, instagram, twitter, dan media lain sejenis sebagai tempat mengekspresikan opini. Hal ini mengundang perusahaan atau organisasi untuk ikut serta menggunakan sosial media sebagai bentuk memahami konsumen, sehingga membuka peluang akses informasi yang bisa didapatkan. Contohnya, opini publik terhadap organisasi, perusahaan, atau produk. Salah satu analisa yang menarik digunakan pada media sosial Twitter adalah mendeteksi keluhan pengguna seperti ganguan jaringan pada perusahaan penyedia layanan telekomunikasi.
Permasalahan jaringan pada penyedia jaringan seperti layanan telekomunikasi merupakan salah satu masalah yang cukup krusial dan perlu penanganan secepat mungkin sehingga memerlukan pemrosesan data secara realtime agar informasi terkait gangguan didapatkan sedini mungkin. Bila seseorang merasakan gangguan jaringan yang tidak disertai dengan penanganan yang cepat dan baik, maka besar kemungkinan orang tersebut akan beralih ke penyedia jasa lain serupa.
iv
Oleh karena itu, pada tugas akhir ini akan dibuat sebuah aplikasi yang dapat mengklasifikasikan jenis keluhan pengguna untuk mendeteksi gangguan jaringan pada penyedia layanan telekomunikasi melalui media sosial Twitter. Pengembangan aplikasi menggunakan Apache Flink diperlukan model klasifikasi yang toleran terhadap kegagalan (serializable). Hal ini dapat diselesaikan dengan mendeklarasikan model SVM pada sebuah State Class. Selanjutnya, datastream yang telah melalui preprocessing diklasifikasikan dan diverifikasi berdasarkan kejadian serupa pada tempat dan waktu yang berdekatan. Lalu hasil pemrosesan tersebut ditampilkan bersama dengan hasil ekstraksi entitas-entitas seperti Named Entity Recoginition dan ekstraksi lokasi pada sebuah REST API.
Sistem yang dibuat menggunakan Apache Flink versi Standalone pada komputer i7-4720HQ dapat mengklasifikasikan 3 datastream dalam waktu 1 hingga 2,5 detik dengan akurasi 43%. Dari pengujian yang dilakukan, terdapat 70 gangguan yang terdeteksi dari 5580 tweet.

==================================================================================================================

The development of easy internet access has made social media very popular. Society tends to use social media like facebook, instagram, twitter, and other similar media as a plac to express opinions. This invites companies or organizations to participate in using social media to understand their consumers. Thus, opening opportunities to information access that can be obtained like public opinions on organizations, companies, or products. One interesting anaylsis used on Twitter is detecting user complaints such as network disturbances in telecommunications service providers.
Network problems is one of crucial problems that needs to be addressed as soon as possible so that it requires realtime data processing. With realtime data processing, information related to those interference can be obtained as early as possible. If someone feels that the provider doesn’t reponse their network outage properly, then it is likely that the person will move to another provider with similar services.
Therefore, this final project will create an application that can classify types of user complaints to detect network disruptions in telecommunication service provider through social media Twitter.
In developing the system using Apache Flink, a classification model must be failure tolerant (serializable). This
vi
can be achieved by declaring the SVM model in a State Class. Then, a preprocessed datastreams are classified and verified based on similar events with adjacent places and time. The results of the classification are displayed altogether with the results of important entities such as Named Entitiy Recognition and place extraction in a REST API.
The application is created by using Apache Flink Standalone version on a i7-4720HQ computer. The system can classify 3 datastream in 1 to 2.5 seconds with 43% of accuracy. From the experiment conducted, from 5580 tweets there are 70 trouble detected.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Deteksi Keluhan, Realtime, Tweet, Apache Flink, Streaming. Complaint Detection, Realtime, Tweet, Apache Flink.
Subjects: T Technology > T Technology (General) > T58.5 Information technology. IT--Auditing
T Technology > T Technology (General) > T58.6 Management information systems
Divisions: Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: AKBAR NOTO PONCO BIMANTORO
Date Deposited: 04 Aug 2020 08:48
Last Modified: 10 May 2023 14:41
URI: http://repository.its.ac.id/id/eprint/76530

Actions (login required)

View Item View Item