Pengenalan Emosi pada Teks Berbasis Metode Ensemble Naive Bayes, Max Entropy, dan Knowledge-based Tools

Setiawan, Hari (2018) Pengenalan Emosi pada Teks Berbasis Metode Ensemble Naive Bayes, Max Entropy, dan Knowledge-based Tools. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111440000156-Undergraduate_Theses.pdf]
Preview
Text
05111440000156-Undergraduate_Theses.pdf - Accepted Version

Download (1MB) | Preview

Abstract

Emosi merupakan faktor utama dalam kebiasaan manusia.
Cara yang paling sering bagi manusia untuk mengutarakan
opini, pemikiran dan berkomunikasi dengan yang lain adalah
melalui tulisan. Menganalisis konten web dan pesan teks
orang-orang adalah hal yang sangat penting dan menarik.
Terdapat banyak hal yang dapat disimpulkan dan dipelajari dari
hasil analisis pesan teks manusia, entah itu untuk memperbaiki
layanan web yang telah ada, ataupun untuk menambahkan fitur
baru yang tepat sasaran untuk pengguna. Dalam proses
pengenalan emosi, algoritma Machine Learning seringkali
digunakan sebagai pemecahan masalah. Namun, penggunaan
satu jenis algoritma saja seringkali tidak cukup baik untuk dapat
menyelesaikan permasalahannya.
Dalam tugas akhir ini akan dibuat sebuah rancangan sistem
yang menggabungkan beberapa jenis algoritma Machine
Learning. Tugas akhir ini akan menggunakan metode Ensemble
untuk menggabungkan pendekatan statistikal yaitu Naive Bayes
dan Max Entropy, serta pendekatan leksikal dengan penggunaan
Knowledge-based tools.Dengan penggunaan metode Ensemble diharapkan dapat mengatasi kelemahan-kelemahan yang
dimiliki oleh salah satu jenis algoritma.Ensemble merupakan
salah satu metode untuk mendapatkan hasil yang lebih optimal
dalam memecahkan suatu permasalahan. Metode ensemble
diharapkan dapat menutupi kelemahan-kelemahan yang dimiliki
oleh suatu algoritma machine learning. Dimana metode
ensemble menggunakan lebih dari satu pendekatan atau model
classifier dalam memecahkan suatu permasalahan.
Tugas akhir ini akan menggunakan dataset publik ISEAR dan
AffectiveText pada tahap pembangunan model klasifikasi dan
evaluasi. Dari hasil uji coba menggunakan dataset ISEAR
didapatkan nilai rata-rata akurasi sebesar 91,40% dan presisi
sebesar 79,80%. Kemudian pada hasil uji coba menggunakan
dataset AffectiveText didapatkan nilai rata-rata akurasi sebesar
70,14% dan presisi sebesar 68,60%.Pada skenario uji coba
terakhir dengan menggabungkan kedua dataset didapatkan nilai
rata-rata akurasi sebesar 87,34% dan presisi sebesar 76,35%.
Dengan hasil uji coba ini metode ini terbukti dapat
meningkatkan akurasi klasifikasi dalam 15 kasus.
=======================================================================Emotion is the main factor contributing in human behavior.
The most common way for human to express their opinions,
thoughts, and communicating each other is by the written text.
Analyzing people’s web contents and textual message is very
important and interesting. There are so many things that you can
get from analyzing them, either to fix the existing service or to
make a new accurate feature for user. In the process of emotion
recognition, most of the Machine Learning algorithm are the
problem solver. However, the use of one type of algorithm only is
often not good enough to solve the problem well.
In this final thesis there will be created a system that combine
several Machine Learning algorithm. This thesis will be using an
Ensemble method to combine statistical approach, Naive Bayes
and Max Entropy, and knowledge-based approach that using
Knowledge-based tools. By using this Ensemble method, it is
expected to cover some weakness whose an algorithm has.
Whereas an Ensemble method can use more that one approach
or classifier model to solve a problem.
This thesis will be using a public dataset ISEAR and AffectiveText in model building and evaluation phase. From the
testing result using ISEAR dataset, we get an average accuracy
number of 91,40% and precision number of 79,80%. While using
the AffectiveText dataset, we get an average accuracy number of
70,14% and precision of 68,60%. Finally in the last testing
scenario, when we use both of datasets, we get an average
accuracy number of 87,34% and precision of 76,35%. With this
testing result, we can conclude that this Ensemble method is
proved to be increase the classification accuracy in fifteenth
case.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Affective Computing, Classifiers ensembles, machine learning, pengenalan emosi, text mining, sentiment analysis
Subjects: Q Science > QA Mathematics > QA336 Artificial Intelligence
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Divisions: Faculty of Information and Communication Technology > Informatics > 55201-(S1) Undergraduate Thesis
Depositing User: Hari Setiawan
Date Deposited: 21 Jun 2021 01:53
Last Modified: 21 Jun 2021 01:53
URI: http://repository.its.ac.id/id/eprint/54286

Actions (login required)

View Item View Item