Seleksi Fitur Berbasis Metode Filter dan Random Forest untuk Deteksi Muslihat pada Data Audio

Mafazy, Muhammad Meftah (2025) Seleksi Fitur Berbasis Metode Filter dan Random Forest untuk Deteksi Muslihat pada Data Audio. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6025231015-Master_Thesis.pdf] Text
6025231015-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2027.

Download (1MB) | Request a copy

Abstract

Menurut Kamus Besar Bahasa Indonesia (KBBI), "muslihat" adalah siasat atau taktik untuk menjebak seseorang. Dalam hal ini, merupakan sebuah perbuatan atau pernyataan yang menyembunyikan kebenaran terhadap sesuatu informasi yang belum tentu benar. Untuk membedakan adanya tipu muslihat atau tidak, diperlukan sistem yang dapat mendeteksi pernyataan yang menyesatkan itu sendiri. Salah satu alat pendeteksi adalah poligraf yang mengukur berdasarkan fisiologi manusia, seperti denyut nadi dan tekanan darah. Namun, poligraf memiliki masalah karena tidak dapat mengukur berdasarkan psikologi manusia seperti ucapan dan intonasi.
Untuk itu, diperlukan deteksi muslihat berbasis audio yang dapat diukur berdasarkan psikologi manusia. Penelitian ini akan mengekstraksi fitur-fitur audio seperti Mel Frequency Cepstral Coefficient (MFCC), Jitter, Fundamental Frequency (F0), dan Perceptual Linear Prediction (PLP) menggunakan library openSMILE dan Shennong dari bahasa pemrograman python pada dataset privat berbahasa Indonesia sebanyak 420 data audio yang terdiri dari 210 data audio yang dilabeli sebagai data yang berbohong dan 210 data audio yang dilabeli sebagai data yang jujur. Dari hasil ekstraksi yang berupa data numerik berjumlah 6386 fitur, akan dilakukan seleksi fitur menggunakan seleksi fitur berbasis metode filter yang bertujuan untuk menyeleksi fitur-fitur terbaik. Setelah dilakukan seleksi fitur, fitur yang dipilih akan menjadi input untuk pengujian model machine learning seperti Random Forest. Setelah dilakukan pengujian model, dilakukan evaluasi metrik seperti akurasi, presisi, recall, dan f1-score. Hasil dari eksperimen ini menunjukkan jika model deteksi muslihat mengalami peningkatan setelah dilakukan proses seleksi fitur untuk mengurangi fitur-fitur tidak relevan. Penggunaan seleksi fitur berbasis metode filter berhasil menyeleksi fitur sebanyak 319 fitur. Selain itu evaluasi metrik pada deteksi muslihat menggunakan seleksi fitur berbasis metode filter menghasilkan 63,49% untuk akurasi beserta recall, 63,43% untuk presisi, dan 63,45% untuk f1-score.
==============================================================================================================================
According to the Kamus Besar Bahasa Indonesia (KBBI), the term "deception" refers to a cunning plan or scheme to trick or catch someone off guard, often utilizing a deliberate tactic. In this scenario, it is an action or assertion that conceals the truth about information that is not necessarily factual. A system capable of detecting false or misleading statements is essential to determine whether deception is present or not. One detection tool is the polygraph, which measures physiological responses, including heart rate and blood pressure. Polygraphs face the challenge of not being able to measure various aspects of human psychology, particularly speech and intonation. Consequently, audio-based deception detection methods are required which can be evaluated in relation to human psychology. The research aims to extract audio features including the Mel Frequency Cepstral Coefficient (MFCC), Jitter, Fundamental Frequency (F0), and Perceptual Linear Prediction (PLP) via openSMILE and Shennong libraries in Python, utilizing a private Indonesian dataset comprising 420 audio files, with 210 files categorized as lying data and 210 files categorized as honest data. Feature selection will be performed on 6386 extracted features, employing a filter-based approach to select the most relevant features. Following feature selection, the chosen features will serve as input for training various machine learning models including the random forest algorithm. Following model testing, evaluation of metrics including accuracy, precision, recall, and f1-score took place. A feature selection process has led to an improvement in the deception detection model by reducing the number of irrelevant features. Feature selection using the filter method effectively isolated 319 key features. Using the filter method for feature selection in deception detection metric evaluation yielded 63.49% accuracy combined with recall, 63.43% precision, and 63.45% f1-score.

Item Type: Thesis (Masters)
Uncontrolled Keywords: deteksi muslihat, ekstraksi fitur, seleksi fitur, random forest, deception detection, feature extraction, feature selection
Subjects: Q Science > QA Mathematics > QA278.55 Cluster analysis
Q Science > QA Mathematics > QA278.5 Principal components analysis. Factor analysis. Correspondence analysis (Statistics)
Q Science > QA Mathematics > QA336 Artificial Intelligence
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Q Science > QA Mathematics > QA76.9.I58 Recommender systems (Information filtering)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: Muhammad Meftah Mafazy
Date Deposited: 02 Feb 2025 06:52
Last Modified: 02 Feb 2025 06:52
URI: http://repository.its.ac.id/id/eprint/117542

Actions (login required)

View Item View Item