Modifikasi Skala Waktu pada Rekaman Suara Menggunakan Waveform Similarity Overlap and Add (WSOLA)

Saputri, Nanda (2018) Modifikasi Skala Waktu pada Rekaman Suara Menggunakan Waveform Similarity Overlap and Add (WSOLA). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of Buku.pdf]
Preview
Text
Buku.pdf - Accepted Version

Download (2MB) | Preview

Abstract

Setiap manusia memiliki kemampuan berbeda beda dalam mendengarkan dan melafalkan ucapan.Orang menglafalkan ucapan dengan cepat atau lambat. Begitu juga kemampuan mendengar ada yang dapat mendengar dengan normal dan ada yang pendengarannya menurun yang disebabkan oleh faktor keturunan, usia, penyakit dan sebagainya. Agar suara yang cepat dan bising tersebut dapat terdengar jelas, pada umumnya pendengar menggunakan cara konvensional untuk mengatasi permasalahan tersebut dengan menggunakan aplikasi atau tape recorder untuk memperlambat rekaman suara.
Pada penelitian ini dilakukan proses time stretching, yaitu pergeseran kerapatan waktu sinyal suara tanpa mengubah frekuensi dasar menggunakan metode WSOLA. Menghitung panjang maksimal waktu yang dapat digeser dengan frekuensi tetap dan suara masih terdengar dengan baik dan membandingkan dari metode WSOLA dan PSOLA tersebut yang mana bisa menghasilkan suara yang lebih baik. Diharapkan penelitian ini dapat membantu pendengaran kita untuk mendengar suara lebih baik atau jelas walaupun kecepatan suaranya dirubah.
Dari hasil penelitian menunjukkan bahwa tidak memberi nilai toleransi pada metode WSOLA mengakibatkan frekuensi maksimum suara menjadi berbeda dengan suara asli. Dari pengujian pergeseran kerapatan waktu sinyal suara saron lima slendro menggunakan WSOLA dapat dilakukan modifikasi skala waktu sinyal suara saron dan suara manusia dengan tetap mempertahankan frekuensi aslinya dengan error rata-rata suara saron 0.847% dan suara manusia 5,094%.
===============================================================================================================
Every people has a different ability to listen and pronounce speech. People recite speech quickly or slowly. Likewise, there is a listening ability that can hear normally and there is a decreased hearing caused by heredity, age, disease and so forth. So that the fast and noisy sound can be heard clearly, listeners generally use conventional methods to overcome these problems by using an application or tape recorder to slow down the sound recording.
In this research, the time stretching process is used, which is the time noise signal density shift without changing the basic frequency using WSOLA method. Calculating the maximum length of time that can be shifted with a fixed frequency and sound still sounds well and compares with the WSOLA and PSOLA methods which can produce better sound. It is hoped that this research can help our hearing to hear sounds better or clearer even though the speed of the voice is changed.
The results of the study showed that not giving the tolerance value on the WSOLA method resulted in the maximum frequency of sound being different from the original sound. From testing the time density shift of the saron five slendro sound signal using WSOLA can be modified the time scale of the saron sound signal and human voice while maintaining the original frequency with an average error of saron 0.847% and 5.094% human voice.

Item Type: Thesis (Masters)
Additional Information: RTE 621.382 2 Sap m-1 3100018078825
Uncontrolled Keywords: Time stretching, WSOLA, Time Scale Modification
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
T Technology > T Technology (General) > T58.5 Information technology. IT--Auditing
Divisions: Faculty of Industrial Technology > Electrical Engineering > 20101-(S2) Master Thesis
Depositing User: Nanda Saputri
Date Deposited: 18 Nov 2020 05:24
Last Modified: 07 Dec 2020 04:18
URI: http://repository.its.ac.id/id/eprint/55432

Actions (login required)

View Item View Item