Pemodelan Viseme dinamis 3D untuk Bahasa Indonesia

Fadillah, Nurul (2015) Pemodelan Viseme dinamis 3D untuk Bahasa Indonesia. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 2213205005-Dissertasion.pdf]

Preview

Text
2213205005-Dissertasion.pdf
Download (7MB) | Preview

Abstract

Interaksi Manusia-Komputer yang natural memerlukan integrasi audio dan
visual berbicara yang realistik untuk persepsi dan tampilan, sistem ekspresi
yang multimdoal membuat komunikasi yang user-friendly antara manusia
dan komputer. Hal ini mencakup beberapa hal, seperti : pengolahan suara
, wajah manusia 3D, dan lain-lain. Pemodelan 3D adalah objek atau
benda yang di desain sebaik mungkin sehingga objek tersebut terlihat hidup.
Pemodelannya berupa wajah manusia, Wajah merupakan penutur menyam-
paikan berbagai jenis informasi, baik mengenai penutur maupun apa yang
dikatakan. Viseme adalah visual fonem yaitu bentuk bibir ketika mengu-
capkan suatu fonem atau bunyi bahasa. Penelitian mengenai viseme ini
telah banyak dilakukan, misalnya untuk bahasa English, Swedish, Spanish,
Persian, dan lain-lain. Sayangnya, penelitian viseme bahasa Indonesia belum
banyak dilakukan. Untuk menghasilkan animasi berbicara yang realistik, diper-
lukan viseme yang merepresentasikan fonem tertentu dengan memperhitungkan
fonem yang mengikutinya. Viseme seperti ini disebut dengan viseme dinamis.
Animasi berbicara dengan menggunakan viseme dinamis dapat menghasilkan
animasi berbicara yang lebih natural dan masuk akal dibandingkan menggu-
nakan viseme statis . Penelitian ini bertujuan untuk pemodelan viseme
dinamis 3D untuk Bahasa Indonesia yang prosesnya hanya fokus pada gerakan
mulutnya saja dari model tersebut. Metode yang diusulkan dalam penelitian
ini terdiri dari pembuatan model viseme dinamis 3D bahasa Indonesia dengan
pendekatan data-driven , Segmentasi, Normalisasi,clustering menggunakan
Algoritma K-mean.Dari hasil cluster k- mean didapatkan hasil cluster yang
baik dengan K=20 dari 22 cluster berdasarkan hasil penelitian cluster yang
dilakukan, hasil cluster yang baik ini berdasarkan dari matrik kalkulasi untuk
SSE dan rasio untuk BCV dan WCV . Penelitian ini diharapkan dapat
menghasilkan animasi berbicara Bahasa Indonesia yang lebih natural. Salah
satu bidang yang akan dikembangkan dalam penelitian adalah penerapan viseme
dinamis pada animasi berbicara . Hasil penelitian ini juga diharapkan dapat
memberikan kontribusi pada perkembangan berbagai bidang, misalnya produksi
�lm animasi, game, interaksi manusia dan komputer serta pada ligustik Bahasa
Indonesia.

==============================================================================================================

Natural Human-Computer Interface requires integration of realistic audio
and visual information for perception and display, Multimodal expression
system makes the communication easy and friendly between human and
computer. It covers several areas, such as speech processing , 3D human face,
etc. 3D modeling is the object or objects that are designed the best possible so
that the object seen alive. The face of a speaker conveys many kinds of infor-
mation about both the speaker and the content of what is being said. Viseme
is visual phonemes that form lip when to say something phonemes or sounds
of language. Viseme associated with a particular language. Therefore, each
language has a structure di�erent viseme classes. Research on this viseme
have been conducted, for example, for English, Swedish, Spanish, persian,
etc. Unfortunately, Indonesian viseme research has not been done. To
generate realistic speech animation, necessary of viseme represent a particular
phoneme with to account phoneme that follow which is called the dynamic
viseme. Lip Animation by using the dynamic viseme is more natural and
realistic be compared using static viseme. This study aims to 3D viseme
dynamic modelling for Indonesian that the process is only focused on her mouth
movements of the model. The method proposed in this study consisted of 3D
viseme dynamic modeling Indonesian with data - driven approach, segmen-
tation, normalization, clustering using C-mean algorithm. the results of cluster
k-mean cluster obtained good results with K = 20 of 22 clusters based on the
results of research conducted cluster, cluster good results is based on matrix
calculations for SSE and ratios for BCV and WCV.Dari C-mean cluster results
obtained cluster good results with K = 20 of 22 clusters based on the results of
research conducted cluster, cluster good results is based on matrix calculations
for SSE and ratios for BCV and WCV. The results of this study are expected
to contribute to the development of various �elds, such as the production of
animated �lms, games, and interaction human and computer as well as the
linguistic Indonesian.

Item Type:	Thesis (Masters)
Additional Information:	RTE 006.696 Fad p
Uncontrolled Keywords:	3D; fonem; viseme; Viseme Dinamis
Subjects:	T Technology > TR Photography > TR897.7 Computer animation
Divisions:	Faculty of Electrical Technology > Electrical Engineering > 20101-(S2) Master Thesis
Depositing User:	- Taufiq Rahmanu
Date Deposited:	27 Jun 2019 02:46
Last Modified:	27 Jun 2019 02:46
URI:	http://repository.its.ac.id/id/eprint/63302

Actions (login required)

View Item