Aplikasi Pengenalan Ucapan Huruf Hijaiyah Berbasis Android untuk Refreshable Braille Display Menggunakan Mel-Frequency Cepstrum Coefficients dan Neural Network

Amalia, Nida (2017) Aplikasi Pengenalan Ucapan Huruf Hijaiyah Berbasis Android untuk Refreshable Braille Display Menggunakan Mel-Frequency Cepstrum Coefficients dan Neural Network. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5113100100-Undergraduate_Theses.pdf]
Preview
Text
5113100100-Undergraduate_Theses.pdf - Published Version

Download (6MB) | Preview

Abstract

Pada tahun 2010 sebanyak 3.05% atau lebih dari 7.2 juta jiwa penduduk Indonesia mengalami kesulitan melihat. Dari tingginya angka tersebut, maka perlu adanya perhatian khusus terkait kebutuhan mereka, termasuk kebutuhan rohani. Sebagai negara dengan mayoritas penduduk beragama Islam, Al-Qur’an menjadi salah satu kebutuhan yang penting. Sayangnya, sarana untuk belajar Al-Qur’an braille masih sangat minim sehingga banyak penyandang kesulitan melihat yang masih belum bisa membaca Al-Qur’an.
Pada tugas akhir ini akan diusulkan media pembelajaran Al-Qur’an yang dapat digunakan penyandang kesulitan melihat. Media pembelajaran tersebut berupa aplikasi pengenalan suara berbasis Android yang diintegrasikan dengan refreshable braille display sebagai media untuk menampilkan pola braille dari Huruf Hijaiyah. Aplikasi yang akan dibangun memiliki fitur utama pengenalan suara untuk Huruf Hijaiyah dengan menggunakan teknik ekstraksi fitur Mel-Frequency Cepstrum Coefficients (MFCC). Sebelumnya, akan dilakukan preprocessing terlebih dahulu menggunakan Voice Activity Detection (VAD) untuk membedakan segmen suara informasi dengan segmen suara non-informasi. Langkah pertama dalam proses MFCC adalah pre-emphasis filter dimana proses ini akan memperbaiki sinyal dari noise. Selanjutnya dilakukan tahap frame blocking dan windowing untuk membagi sinyal menjadi beberapa frame dan mengurangi diskontinuitas sinyal yang hasilnya diproses menggunakan Fast Fourier Transform (FFT) sehingga didapatkan sinyal dalam frekuensi domain. Ukuran energi dari setiap frekuensi band dihitung pada proses Filterbank. Langkah terakhir adalah Discrete Cosine Transform (DCT) yang menghasilkan Mel Cepstrum. Pola yang dihasilkan dari MFCC dilatih menggunakan algoritma Neural Network Back-Propogation yang akan mengklasifikan suara yang diucapkan.
Uji coba yang dilakukan terhadap 290 data suara yang terdiri dari 145 suara laki-laki dan 145 suara perempuan. Hasil uji coba menunjukkan bahwa metode ini dapat memberikan hasil klasifikasi yang akurat dengan akurasi adalah 97.93% untuk data laki-laki, 93.10% untuk data perempuan, dan 90.34% untuk uji coba menggunakan keseluruhan data. ========================================================================================================================
In 2010, there are 3.05% or more than 7.2 million blind people in Indonesia. From this high numbers, we have to give special attention for their needs, including spiritual needs. As a country with a majority Muslim population, Qur'an becomes one of the most important needs. Unfortunately, the lack of media to learn braille Qur'an makes many blind people still can not read it.
This final project will propose media to learn Qur'an that can be used by blind people. The media is an Android-based speech recognition application that is integrated with refreshable braille display as a media for displaying braille patterns of Hijaiyah Letters. The main feature of the application is speech recognition for Hijaiyah Letters by using Mel-Frequency Cepstrum Coefficients (MFCC) for feature extraction. Preprocessing will be done first by using Voice Activity Detection (VAD) to distinguish the information and non-information voice segment. The first step in the MFCC process is the pre-emphasis filter that will improve the signal from noise. Next, frame blocking and windowing stage that will divide the signal into multiple frames and reduce the signal discontinuity. Then, the result is processed using Fast Fourier Transform (FFT) to obtain signal in frequency domain. The energy size of each frequency band is calculated on the Filterbank process. The final step is the Discrete Cosine Transform (DCT) that produces Mel Cepstrum. Patterns generated from MFCC are trained using the Neural Network Back-Propogation algorithm that will classify spoken sounds.
Testing that is held to 290 audio data which contain of 145 man audio data and 145 woman audio data. The result of the test shows that this method can give accurate result with accuracy 97.93% for man audio data, 93.10% for woman audio data, and 90.34 for testing with all data.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Pengenalan Ucapan, Mel-Frequency Cepstrum Coefficients, Back Propagation Neural Network, Hijaiyah, Android, Refreshable Braille
Subjects: Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
T Technology > T Technology (General)
Divisions: Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Nida Amalia
Date Deposited: 13 Sep 2017 04:43
Last Modified: 06 Mar 2019 02:15
URI: http://repository.its.ac.id/id/eprint/43695

Actions (login required)

View Item View Item