Pemodelan Viseme dinamis 3D untuk Bahasa Indonesia

Fadillah, Nurul (2015) Pemodelan Viseme dinamis 3D untuk Bahasa Indonesia. Masters thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
2213205005-Dissertasion.pdf

Download (7MB) | Preview

Abstract

Interaksi Manusia-Komputer yang natural memerlukan integrasi audio dan visual berbicara yang realistik untuk persepsi dan tampilan, sistem ekspresi yang multimdoal membuat komunikasi yang user-friendly antara manusia dan komputer. Hal ini mencakup beberapa hal, seperti : pengolahan suara , wajah manusia 3D, dan lain-lain. Pemodelan 3D adalah objek atau benda yang di desain sebaik mungkin sehingga objek tersebut terlihat hidup. Pemodelannya berupa wajah manusia, Wajah merupakan penutur menyam- paikan berbagai jenis informasi, baik mengenai penutur maupun apa yang dikatakan. Viseme adalah visual fonem yaitu bentuk bibir ketika mengu- capkan suatu fonem atau bunyi bahasa. Penelitian mengenai viseme ini telah banyak dilakukan, misalnya untuk bahasa English, Swedish, Spanish, Persian, dan lain-lain. Sayangnya, penelitian viseme bahasa Indonesia belum banyak dilakukan. Untuk menghasilkan animasi berbicara yang realistik, diper- lukan viseme yang merepresentasikan fonem tertentu dengan memperhitungkan fonem yang mengikutinya. Viseme seperti ini disebut dengan viseme dinamis. Animasi berbicara dengan menggunakan viseme dinamis dapat menghasilkan animasi berbicara yang lebih natural dan masuk akal dibandingkan menggu- nakan viseme statis . Penelitian ini bertujuan untuk pemodelan viseme dinamis 3D untuk Bahasa Indonesia yang prosesnya hanya fokus pada gerakan mulutnya saja dari model tersebut. Metode yang diusulkan dalam penelitian ini terdiri dari pembuatan model viseme dinamis 3D bahasa Indonesia dengan pendekatan data-driven , Segmentasi, Normalisasi,clustering menggunakan Algoritma K-mean.Dari hasil cluster k- mean didapatkan hasil cluster yang baik dengan K=20 dari 22 cluster berdasarkan hasil penelitian cluster yang dilakukan, hasil cluster yang baik ini berdasarkan dari matrik kalkulasi untuk SSE dan rasio untuk BCV dan WCV . Penelitian ini diharapkan dapat menghasilkan animasi berbicara Bahasa Indonesia yang lebih natural. Salah satu bidang yang akan dikembangkan dalam penelitian adalah penerapan viseme dinamis pada animasi berbicara . Hasil penelitian ini juga diharapkan dapat memberikan kontribusi pada perkembangan berbagai bidang, misalnya produksi �lm animasi, game, interaksi manusia dan komputer serta pada ligustik Bahasa Indonesia. ============================================================================================================== Natural Human-Computer Interface requires integration of realistic audio and visual information for perception and display, Multimodal expression system makes the communication easy and friendly between human and computer. It covers several areas, such as speech processing , 3D human face, etc. 3D modeling is the object or objects that are designed the best possible so that the object seen alive. The face of a speaker conveys many kinds of infor- mation about both the speaker and the content of what is being said. Viseme is visual phonemes that form lip when to say something phonemes or sounds of language. Viseme associated with a particular language. Therefore, each language has a structure di�erent viseme classes. Research on this viseme have been conducted, for example, for English, Swedish, Spanish, persian, etc. Unfortunately, Indonesian viseme research has not been done. To generate realistic speech animation, necessary of viseme represent a particular phoneme with to account phoneme that follow which is called the dynamic viseme. Lip Animation by using the dynamic viseme is more natural and realistic be compared using static viseme. This study aims to 3D viseme dynamic modelling for Indonesian that the process is only focused on her mouth movements of the model. The method proposed in this study consisted of 3D viseme dynamic modeling Indonesian with data - driven approach, segmen- tation, normalization, clustering using C-mean algorithm. the results of cluster k-mean cluster obtained good results with K = 20 of 22 clusters based on the results of research conducted cluster, cluster good results is based on matrix calculations for SSE and ratios for BCV and WCV.Dari C-mean cluster results obtained cluster good results with K = 20 of 22 clusters based on the results of research conducted cluster, cluster good results is based on matrix calculations for SSE and ratios for BCV and WCV. The results of this study are expected to contribute to the development of various �elds, such as the production of animated �lms, games, and interaction human and computer as well as the linguistic Indonesian.

Item Type: Thesis (Masters)
Additional Information: RTE 006.696 Fad p
Uncontrolled Keywords: 3D; fonem; viseme; Viseme Dinamis
Subjects: T Technology > TR Photography > TR897.7 Computer animation
Divisions: Faculty of Electrical Technology > Electrical Engineering > 20101-(S2) Master Thesis
Depositing User: - Taufiq Rahmanu
Date Deposited: 27 Jun 2019 02:46
Last Modified: 27 Jun 2019 02:46
URI: https://repository.its.ac.id/id/eprint/63302

Actions (login required)

View Item View Item