Pengenalan Emosi pada Teks Berbasis Metode Ensemble Naive Bayes, Max Entropy, dan Knowledge-based Tools

Setiawan, Hari (2018) Pengenalan Emosi pada Teks Berbasis Metode Ensemble Naive Bayes, Max Entropy, dan Knowledge-based Tools. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
05111440000156-Undergraduate_Theses.pdf - Accepted Version

Download (1MB) | Preview

Abstract

Emosi merupakan faktor utama dalam kebiasaan manusia. Cara yang paling sering bagi manusia untuk mengutarakan opini, pemikiran dan berkomunikasi dengan yang lain adalah melalui tulisan. Menganalisis konten web dan pesan teks orang-orang adalah hal yang sangat penting dan menarik. Terdapat banyak hal yang dapat disimpulkan dan dipelajari dari hasil analisis pesan teks manusia, entah itu untuk memperbaiki layanan web yang telah ada, ataupun untuk menambahkan fitur baru yang tepat sasaran untuk pengguna. Dalam proses pengenalan emosi, algoritma Machine Learning seringkali digunakan sebagai pemecahan masalah. Namun, penggunaan satu jenis algoritma saja seringkali tidak cukup baik untuk dapat menyelesaikan permasalahannya. Dalam tugas akhir ini akan dibuat sebuah rancangan sistem yang menggabungkan beberapa jenis algoritma Machine Learning. Tugas akhir ini akan menggunakan metode Ensemble untuk menggabungkan pendekatan statistikal yaitu Naive Bayes dan Max Entropy, serta pendekatan leksikal dengan penggunaan Knowledge-based tools.Dengan penggunaan metode Ensemble diharapkan dapat mengatasi kelemahan-kelemahan yang dimiliki oleh salah satu jenis algoritma.Ensemble merupakan salah satu metode untuk mendapatkan hasil yang lebih optimal dalam memecahkan suatu permasalahan. Metode ensemble diharapkan dapat menutupi kelemahan-kelemahan yang dimiliki oleh suatu algoritma machine learning. Dimana metode ensemble menggunakan lebih dari satu pendekatan atau model classifier dalam memecahkan suatu permasalahan. Tugas akhir ini akan menggunakan dataset publik ISEAR dan AffectiveText pada tahap pembangunan model klasifikasi dan evaluasi. Dari hasil uji coba menggunakan dataset ISEAR didapatkan nilai rata-rata akurasi sebesar 91,40% dan presisi sebesar 79,80%. Kemudian pada hasil uji coba menggunakan dataset AffectiveText didapatkan nilai rata-rata akurasi sebesar 70,14% dan presisi sebesar 68,60%.Pada skenario uji coba terakhir dengan menggabungkan kedua dataset didapatkan nilai rata-rata akurasi sebesar 87,34% dan presisi sebesar 76,35%. Dengan hasil uji coba ini metode ini terbukti dapat meningkatkan akurasi klasifikasi dalam 15 kasus. =======================================================================Emotion is the main factor contributing in human behavior. The most common way for human to express their opinions, thoughts, and communicating each other is by the written text. Analyzing people’s web contents and textual message is very important and interesting. There are so many things that you can get from analyzing them, either to fix the existing service or to make a new accurate feature for user. In the process of emotion recognition, most of the Machine Learning algorithm are the problem solver. However, the use of one type of algorithm only is often not good enough to solve the problem well. In this final thesis there will be created a system that combine several Machine Learning algorithm. This thesis will be using an Ensemble method to combine statistical approach, Naive Bayes and Max Entropy, and knowledge-based approach that using Knowledge-based tools. By using this Ensemble method, it is expected to cover some weakness whose an algorithm has. Whereas an Ensemble method can use more that one approach or classifier model to solve a problem. This thesis will be using a public dataset ISEAR and AffectiveText in model building and evaluation phase. From the testing result using ISEAR dataset, we get an average accuracy number of 91,40% and precision number of 79,80%. While using the AffectiveText dataset, we get an average accuracy number of 70,14% and precision of 68,60%. Finally in the last testing scenario, when we use both of datasets, we get an average accuracy number of 87,34% and precision of 76,35%. With this testing result, we can conclude that this Ensemble method is proved to be increase the classification accuracy in fifteenth case.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Affective Computing, Classifiers ensembles, machine learning, pengenalan emosi, text mining, sentiment analysis
Subjects: Q Science > QA Mathematics > QA336 Artificial Intelligence
Q Science > QA Mathematics > QA76.9.D343 Data mining
Divisions: Faculty of Information and Communication Technology > Informatics > 55201-(S1) Undergraduate Thesis
Depositing User: Hari Setiawan
Date Deposited: 21 Jun 2021 01:53
Last Modified: 21 Jun 2021 01:53
URI: https://repository.its.ac.id/id/eprint/54286

Actions (login required)

View Item View Item