Ekstraksi Kata Kunci Metadata Twitter Berbahasa Indonesia Dengan Pendekatan Grammatical Tagging Untuk Visualisasi Hubungan Antar Fitur Produk

Isanta, Septiyan Andika (2016) Ekstraksi Kata Kunci Metadata Twitter Berbahasa Indonesia Dengan Pendekatan Grammatical Tagging Untuk Visualisasi Hubungan Antar Fitur Produk. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img] Text
5113201037-Master Thesis.pdf
Restricted to Repository staff only

Download (3MB) | Request a copy

Abstract

Informasi dari sosial media terutama twitter banyak mengandung teks yang menjelaskan fitur suatu produk. Seorang pemilik produk dapat mengamati kata kunci populer dalam twitter secara manual untuk mengetahui fitur produk yang perlu diperbaiki. Proses ini memakan waktu lama mengingat jumlah tweet berisi opini suatu produk sangatlah besar. Pengenalan kata kunci dapat dilakukan dengan cara mengekstrak kata yang ada pada suatu tweet dan melakukan perhitungan jumlah kata. Kata dengan jumlah kemunculan terbesar pada umumnya menjadi kata kunci dalam sebuah kumpulan tweet. Akan tetapi jumlah kemunculan kata belum tentu menggambarkan fitur sebuah produk. Pemilik produk membutuhkan informasi terkait kata kunci produk yang sedang populer ataupun produk serupa milik kompetitor serta hubungan semantik antara fitur yang menggambarkan kelebihan produk tersebut. Pada penelitian ini diusulkan suatu metode ekstraksi kata kunci dari metadata twitter dengan pendekatan grammatical tagging. Tahapan dalam metode tersebut yaitu praproses, ekstraksi kata, ekstraksi produk, dan hitung asosiasi serta visualiasi hubungan antara fitur kata-kata produk. Ekstraksi kata bertujuan untuk mendapatkan kandidat kata kunci dari tweet. Tahapan berikutnya adalah ekstraksi produk yang tertulis dalam tweet menggunakan grammatical tagging. Kemudian dilakukan penghitungan asosiasi dengan nilai confidence untuk mencari hubungan antara kata fitur produk yang tertulis dalam tweet produk. Hasil pengujian menggunakan data tweet dari Apple dan Nexus menunjukkan bahwa nilai kemunculan kata lebih berpengaruh dari pada nilai retweet dan nilai favourite. Metode yang diusulkan dapat mengenali kata fitur produk sebuah tweet dengan nilai precision 81.3%, serta dapat mengenali hubungan antara kata fitur produk dengan nilai f-measure 52.5 =============================================================================================== Information from social media, especially twitter, contain lots of text describing the features of a product. A product owner can manually observe popular keywords in twitter to determine the product features that need to be improved. This process takes a long time due to the enormous number of tweets containing opinions related to the product. Keywords recognition for candidates of product features can be performed by extracting existing words in a tweet and counting the words. The word with the greatest number of occurrences, usually are the keywords in a collection of tweets. However, the number of word occurrences does not necessarily reflect the features of a product. The product owner requires information of keywords related to popular products or similar products belonging to competitors and semantic relationships among the features that reflect the advantages of these products. In this study, a method is proposed to extract keywords from twitter metadata through grammatical tagging approach. The steps in this method are preprocessing, word extraction, product extraction, calculating the association and visualizing the relationship among the features of the product's words. The word extraction is intended to obtain the keywords candidate from tweets. The next step is the extraction of the product written in a tweet using the grammatical tagging. Afterward, the calculation of the association is performed with the confidence value to find relationships among the words related to the product features written in product tweet. The test results using tweet data from Apple and Nexus revealed that the value of word occurrences is more significant than the value of retweet and favourite. The proposed method can recognize the word of product features in a tweet with precision value of 81.3%, and can recognize relationships among the words of product features with an fmeasure value of 52.5%.

Item Type: Thesis (Masters)
Additional Information: RTIf 005.74 Isa e
Uncontrolled Keywords: ekstraksi, fitur produk, kata kunci, twitter, graph, grammatical tagging, POS Tagging
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Faculty of Information Technology > Informatics Engineering > (S2) Master Theses
Depositing User: Mr. Tondo Indra Nyata
Date Deposited: 06 Oct 2017 01:49
Last Modified: 21 Nov 2017 06:01
URI: http://repository.its.ac.id/id/eprint/48926

Actions (login required)

View Item View Item