Fusi Citra Scalogram Berbasis Wavelet dan Spectrogram untuk Klasifikasi Genre Musik Menggunakan Metode MusicRecNet

Paramarta, Ilham Maharsa (2023) Fusi Citra Scalogram Berbasis Wavelet dan Spectrogram untuk Klasifikasi Genre Musik Menggunakan Metode MusicRecNet. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06111940000018-Undergraduate_Thesis.pdf] Text
06111940000018-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 September 2025.

Download (22MB) | Request a copy

Abstract

Pada saat ini, industri musik sudah mulai menggunakan kecerdasan buatan dalam sistemnya. Salah satu penerapannya adalah untuk mengklasifikasikan genre musik. Pengklasifikasian genre musik perlu dilakukan karena perbedaan preferensi setiap orang dalam mendengarkan musik. Dengan pengklasifikasian genre, platform streaming musik akan lebih mudah merekomendasikan musik berdasarkan genre yang disukai oleh setiap penggunanya. Namun, tingginya angka perkembangan musik menyebabkan proses klasifikasi genre secara manual memerlukan banyak waktu. Klasifikasi genre musik dapat dilakukan secara otomatis menggunakan deep learning salah satunya dengan CNN (convolutional neural network). Pada penelitian ini, dilakukan fusi citra spectrogram dan scalogram untuk klasifikasi genre musik dengan metode CNN MusicRecNet. Data yang digunakan pada penelitian ini adalah dataset GTZAN yang terdiri dari 10 genre yaitu Blues, Classic, Country, Disco, Hiphop, Jazz, Metal, Pop, Reggae, dan Rock. Data sinyal diekstraksi fitur menjadi citra scalogram dengan transformasi wavelet kontinu (CWT) dan citra STFT spectrogram dengan short-time fourier transform (STFT). Kemudian citra yang didapatkan dipotong menjadi 6 bagian. Setelah itu setiap citra difusikan dengan scalogram sebagai lapisan R, STFT spectrogram sebagai lapisan G, dan lapisan B dibentuk dari jumlahan R dan G dengan pembobotan α. Citra hasil fusi selanjutnya dijadikan input untuk metode MusicRecNet. metode MusicRecNet yang digunakan pada peelitian ini telah dimodifikasi dengan menambahkan batch normalization dan mengubah max pooling menjadi average pooling. Hasil terbaik pada penelitian ini didapatkan menggunakan data dari skenario fusi scalogram dan STFT spectrogram dengan pembobotan α = 0.1. Hasil akurasi validasi yang didapatkan adalah sebesar 92.05%.
====================================================================================================================================
Recently, the music industry has started using artificial intelligence in its system. One of the uses is to classify music genres. Music genre classification is important because of the different preferences of each person in listening to music. By classifying genres, it will be easier for music streaming platforms to recommend music based on the genres that each user likes. However, the high rate of musical development causes the process of manually classifying genres to take a lot of time. Classification of music genres can be done automatically using deep learning, one of which is CNN (convolutional neural network). In this study, a fusion of spectrogram and scalogram images was carried out for classification of music genres using the CNN MusicRecNet method. The data used in this study is the GTZAN dataset which consists of 10 genres namely Blues, Classic, Country, Disco, Hiphop, Jazz, Metal, Pop, Reggae, and Rock. Signal data is extracted from features into scalogram images with continuous wavelet transform (CWT) and STFT spectrogram images with short-time wavelet transform (STFT). Then the image obtained is cropped into 6 parts. After that, each image is fused with a scalogram as the R layer, STFT spectrogram as the G layer, and the B layer is formed from the sum of R and G with a weighting of α. The fusion image is then used as input for the MusicRecNet method. The MusicRecNet method used in this study has been modified by adding batch normalization and changing max pooling to average pooling. The best result in this study were obtained using data from the fusion scalogram and STFT spectrogram scenarios with a weighting of α = 0.1. The validation accuracy results obtained were 92.05%.

Item Type: Thesis (Other)
Uncontrolled Keywords: Fusi, Genre Musik, Klasifikasi, Scalogram, Spectrogram, Classification, Fusion, Music Genre, Scalogram, Spectrogram
Subjects: Q Science > QA Mathematics > QA403.3 Wavelets (Mathematics)
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Q Science > QC Physics > QC20.7.F67 Fourier transformations
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Mathematics > 44201-(S1) Undergraduate Thesis
Depositing User: Ilham Maharsa Paramarta
Date Deposited: 02 Aug 2023 06:55
Last Modified: 02 Aug 2023 06:55
URI: http://repository.its.ac.id/id/eprint/100373

Actions (login required)

View Item View Item