Aplikasi teks mining untuk ekstraksi topik korean pop (KPOP) pada twitter menggunakan naive bayes classifier (NBC) dan gibbs sampling for dirichlet multinomial mixture (GSDMM)

Kristiana, Kristiana (2022) Aplikasi teks mining untuk ekstraksi topik korean pop (KPOP) pada twitter menggunakan naive bayes classifier (NBC) dan gibbs sampling for dirichlet multinomial mixture (GSDMM). Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5003201193-Undergraduate_Thesis.pdf] Text
5003201193-Undergraduate_Thesis.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy

Abstract

Korean wave atau yang biasa dikenal sebagai “hallyu” adalah budaya dari Korea Selatan yang tersebar secara global. Korean wave diperkenalkan pertama kali pada tahun 1990, dan ditayangkan keluar pada tahun 1997 di China. Penayangan tersebut ternyata mendapat respon positif dari masyarakat China. Sejak saat itu pemerintah Korea meluaskan pasar korean wave ke negara Asia lain, termasuk Indonesia. Hingga saat ini, budaya korean wave masih eksis bahkan semakin diminati. Salah satu budaya korean wave yang paling digemari oleh gen Z dan milenial adalah musik korea atau kpop, terutama band musik BTS, Blackpink, dan EXO. Twitter adalah sarana media sosial yang digunakan oleh para fans untuk menuliskan, memberikan opini dan informasi-informasi update mengenai idola mereka. Melalui twitter, para fans bisa dengan mudah mengetahui opini fans yang lain setiap harinya. Oleh karena jumlah fans dan opini yang tersebar di twitter sangat banyak, maka untuk mengetahui opini-opini para fans diperlukan sebuah metode menggunakan analisis sentimen. Selain itu, antusiasme para fans membuat perusahaan lokal Indonesia mulai melirik idol kpop dari Korea tersebut untuk dijadikan brand ambassador untuk memasarkan produk mereka. Berdasarkan permasalahan tersebut peneliti ingin mengekstraksi atribut postingan twitter untuk menemukan topik kpop yang populer yang berkaitan dengan BTS, Blackpink, dan EXO menggunakan topic modeling yaitu Gibss Sampling for Dirichlet Multinomial Mixture (GSDMM). Hasil penelitian menunjukkan bahwa nilai AUC metode NBC setelah dilakukan SMOTE lebih dari 85% pada masing-masing tweet yang berarti bahwa model mampu membedakan antar kategori sentimen diatas 85%, sedangkan coherence score pada topik modeling menggunakan GSDMM menunjukkan hasil yang cukup baik dalam memodelkan topik.
====================================================================================================================================
The Korean wave or commonly known as “hallyu” is a culture from South Korea that spreads globally. The Korean wave was first introduced in 1990, and premiered in 1997 in China. The broadcast apparently received a positive response from the Chinese community. Since then the Korean government has expanded the Korean wave market to other Asian countries, including Indonesia. Until now, the Korean wave culture still exists and is even more in demand. One of the most popular Korean wave cultures by gen Z and millennials is Korean music or kpop, especially BTS, Blackpink, and EXO music bands. Twitter is a social media tool used by fans to write, provide opinion and update information about their idols. Through Twitter, fans can easily find out the opinions of other fans every day. Because the number of fans and opinions spread on Twitter is very large, then to find out the opinions of the fans, a method using sentiment analysis is needed. In addition, the enthusiasm of the fans made local Indonesian companies start to look at the K-Pop idols from Korea to be used as brand ambassadors to market their products. Based on these problems, the researcher wanted to extract the attributes of twitter posts to find popular kpop topics related to BTS, Blackpink, and EXO using a modeling topic, namely Gibss Sampling for Dirichlet Multinomial Mixture (GSDMM). The results show that AUC score in NBC method after SMOTE get more than 85% on each tweet means that the model can distinguish between sentiment category above 85%, while coherence score in GSDMM method show the result which is quite good in modelling the topic.

Item Type: Thesis (Other)
Additional Information: RSSt 519.53 Kri a-1 2022
Uncontrolled Keywords: gen Z, GSDMM, korean wave, KPOP, milenial, NBC, topic modeling, twitter.
Subjects: Q Science > QA Mathematics > QA278.55 Cluster analysis
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Mr. Marsudiyana -
Date Deposited: 24 Apr 2026 06:11
Last Modified: 24 Apr 2026 06:11
URI: http://repository.its.ac.id/id/eprint/132908

Actions (login required)

View Item View Item