Sentiment Analysis Perilaku Pengguna Media Sosial terhadap Ujian Nasional Menggunakan K-Means dan Support Vector Machine (SVM)

Utomo, Chandra Eko Wahyudi (2020) Sentiment Analysis Perilaku Pengguna Media Sosial terhadap Ujian Nasional Menggunakan K-Means dan Support Vector Machine (SVM). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 07111550060006_MasterTesis.pdf]
Preview
Text
07111550060006_MasterTesis.pdf

Download (1MB) | Preview

Abstract

Program Ujian Nasional (UN) sudah berjalan sejak tahun 2002 sebagai pengganti dari EBTANAS. Dalam pelaksanaannya hingga saat ini mengalami pro dan kontra dari masyarakat. Di satu sisi yang lain, fakta di lapangan menunjukkan perkembangan media sosial terutama jejaring sosial berkembang amat pesat di Indonesia. Menurut hasil survei Asosiasi Penyelenggara Jasa Internet Indonesia (APJII) 2014, jumlah pengguna internet di Indonesia adalah sebesar 88,1 juta jiwa dari 252,4 juta jiwa jumlah penduduk Indonesia. Dari jumlah pengguna tersebut, ternyata sebagian besar digunakan untuk mengakses media sosial. Oleh karena itu, riset ini berupaya menemukan opini dukungan pengguna salah satu media sosial yaitu Twitter terhadap Ujian Nasional dengan menggunakan Support Vector Machine. Di dalam ilmu komputer, cara menganalisis suatu opini di media sosial dengan topik tertentu disebut dengan sentiment analysis. Sentiment analysis ini bertujuan untuk mengalisis sentimen publik terhadap ujian nasional berbasis media sosial dengan menggunakan metode Support Vector Machine. Dari hasil crawling data penelitian yang sudah dilakukan, diketahui bahwa data Twitter bersifat unstructured, memiliki variasi tinggi (variety) dan sangat besar (volume). Berdasarkan kondisi tersebut, digunakan teknik clustering menggunakan metode K-Means agar diperoleh kelompok data sebelum dilakukan analisis sentimen. Beragamnya data yang sangat besar (124.612 tweet) dengan tingkat variasi yang tinggi (banyak digunakan emoji dan karakter huruf, tentu saja memerlukan tool analyzer yang sanggup melakukannya. Oleh karena itu, pemrosesan data menggunakan tool analyzer bigdata dan pada penelitian ini menggunakan Spark. Berdasarkan clustering menggunakan K-Means Methods diperoleh elbow pada cluster ke-3 dan hasil klasifikasi menggunakan SVM didapatkan 2 kelompok sentimen, yaitu sentimen positif dan sentimen negatif. Dari hasil penelitian yang sudah dilakukan, diperoleh tingkat akurasi hasil klasifikasi dengan Metode Support Vector Machine (SVM) mencapai 90 % untuk rasio data training dan data testing 60:40, lalu 91 % untuk rasio 70:30 dan 91 % untuk rasio 80:20. Hasil riset ini adalah diperoleh sentimen positif dukungan pengguna media sosial terhadap program Ujian Nasional.
=========================================================================================================================
The National Examination Program (UN) has been running since 2002 as substitution of EBTANAS. In its implementation until now experiencing the pros and cons of the community. On the other hand, the facts on the ground show that the development of social media, especially social networking, is growing very rapidly in Indonesia. According to the 2014 Indonesian Internet Service Providers (APJII) survey, the number of internet users in Indonesia was 88.1 million out of 252.4 million people in Indonesia. Of these users, it turns out that most of them are used to access social media. Therefore, this research seeks to find opinions of user support in one of the social media namely Twitter on the National Examination by using the Support Vector Machine. In computer science, how to analyze an opinion on social media with a particular topic is called sentiment analysis. This sentiment analysis aims to analyze public sentiments towards national exams based on social media using the Support Vector Machine method. From the results of crawling research data that has been done, it is known that Twitter data is unstructured, has a high variation (variety) and very large (volume). Very large variety of data (124,612 tweets) with a high level of variation (widely used emojis and character letters, of course, requires a big data analyzer tool and in this study using Spark. Based on clustering using K-Means Methods obtained elbow in the 3rd cluster and the results of classification using SVM obtained 2 groups of sentiments, namely positive sentiment and negative sentiment. From the results of research that has been done, obtained the accuracy of the classification results with the Support Vector Machine (SVM) method reached 90% for the ratio of training data and testing data 60:40, then 91% for the ratio of 70:30 and 91% for the ratio of 80:20, the results of this research are obtained positive sentiment of social media user support for the National Examination program.

Item Type: Thesis (Masters)
Additional Information: RTE 004.021 8 Uto s-1
Uncontrolled Keywords: sentiment analysis; National exam; social media, clustering, klasifikasi, K-Means, SVM
Subjects: T Technology > TA Engineering (General). Civil engineering (General) > TA174 Computer-aided design.
T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105.546 Computer algorithms
T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105.88815 Semantic Web
Divisions: Faculty of Electrical Technology > Electrical Engineering > 20101-(S2) Master Thesis
Depositing User: Chandra Eko Wahyudi Utomo
Date Deposited: 25 Mar 2025 01:53
Last Modified: 25 Mar 2025 01:53
URI: http://repository.its.ac.id/id/eprint/75006

Actions (login required)

View Item View Item