Klasifikasi Cyber Bullying Pada Media Sosial Twitter Dengan Menggunakan Algoritma Naïve Bayes - Cyber Bullying Classification On Twitter Social Media Using Naïve Bayes Algorithm

Trihapsari, Endah (2016) Klasifikasi Cyber Bullying Pada Media Sosial Twitter Dengan Menggunakan Algoritma Naïve Bayes - Cyber Bullying Classification On Twitter Social Media Using Naïve Bayes Algorithm. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
2214206709-Master thesis.pdf - Published Version

Download (1MB) | Preview

Abstract

Jumlah pengguna Internet di Indonesia selalu meningkat dengan pesat setiap tahunnya, dan pada tahun 2014 mencapai 34,9% dari jumlah populasi penduduk, dengan rata-rata waktu akses 5,5 jam setiap harinya. Peningkatan penggunaan Internet ternyata juga diiringi dengan fakta lainnya, yaitu adanya peningkatan kasus cyberbullying di Indonesia. Sebagian besar kasus cyberbullying terjadi di media sosial, salah satunya adalah melalui Twitter. Pengguna Twitter di Indonesia masuk dalam tiga besar dunia dan penduduk kota Jakarta menenempati urutan pertama di dunia dalam hal jumlah posting yang dikirim melalui Twitter. Melihat data tersebut, potensi terjadinya cyberbullying di Indonesia sangat besar sehingga perlu dilakukan upaya untuk mencegahnya. Upaya pencegahan ini perlu dilakukan karena cyberbullying dapat terjadi lebih cepat, berdampak lebih luas, dan berpotensi menjadi ancaman yang lebih besar jika dibandingkan dengan bully yang dilakukan secara langsung. Langkah awal yang dilakukan adalah melakukan identifikasi kata dan pola kalimat yang paling berpotensi digunakan untuk melakukan cyberbullying, dimana data tersebut nantinya dapat digunakan oleh pengembang perangkat lunak untuk membuat sebuah sistem peringatan dini adanya cyberbullying. Dengan menggunakan Algoritma Naive Bayes diperoleh akurasi terbaik sebesar 87,67% dalam penentuan kategori “bully” atau “bukan bully” Berdasarkan hasil penelitian, diketahui bahwa kata kunci "tolol" merupakan kata dengan bobot paling tinggi yang paling sering digunakan untuk melakukan bully. Selain menggunakan kata-kata kunci bullying, pesan dengan konten bullying terbentuk pula dengan tambahan subyek dalam kalimat tersebut. Subyek dengan bobot paling tinggi adalah kata "lo". Dengan demikian, jika subyek ditambahkan dengan kata-kata kunci bullying, akan membentuk kalimat pesan bully, dirumuskan dengan: “subyek + kata kunci bully”, contohnya "lo" + "tolol". ======================================================================================================================== Number of Internet users in Indonesia is increasing rapidly every year, and in 2014 reached 34.9 % of the total population, with an access time average of 5.5 hours per day. The increase of Internet use was also accompanied by other facts, namely the increase of cyberbullying case in Indonesia. Most of cyberbullying cases occurs in social media, one of which is through Twitter. Twitter users in Indonesia are in the top three of the world and people in Jakarta was ranked first in the world in terms of posting number sent via Twitter. Seeing these data, the potention of cyberbullying in Indonesia is very large, so it is necessary to prevent it. These prevention need to be done because cyberbullying can happen faster, wider impact, and potentially a greater threat than the traditional bullying. The first step is identifying words and sentence patterns most potentially be used for cyberbullying, where the data can be used by software developers to create an early warning system cyberbullying. By using a Naive Bayes algorithm obtained the best accuracy of 87.67 % in the determination of the category of "bully" or "no bully". Based on this research, it is known that the key word "tolol" is a word with the highest weighting that most often used to bully. Besides using bullying key words, message with bullying content also formed with additional subjects in the sentence. Subjects with the highest weighting is the word "lo". Thus, if the subject was added with the bullying key words will be formed bullying sentences, formulated with : "subject + bully key word", for example "lo" + "tolol".

Item Type: Thesis (Masters)
Additional Information: RTE 006.312 Tri k
Uncontrolled Keywords: Cyberbullying, Klasifikasi, Naïve Bayes, Text mining, Classifications, Cyberbullying, Naïve Bayes, Text mining
Subjects: Q Science > QA Mathematics > QA76.9.D343 Data mining
Divisions: Faculty of Industrial Technology > Electrical Engineering
Depositing User: ansi aflacha
Date Deposited: 17 Dec 2019 03:38
Last Modified: 17 Dec 2019 03:38
URI: http://repository.its.ac.id/id/eprint/72392

Actions (login required)

View Item View Item