Rancang Bangun API Part of Speech Tagger untuk Bahasa Indonesia Menggunakan Hidden Markov Model

Hasan, Sa`ad Ahyat (2016) Rancang Bangun API Part of Speech Tagger untuk Bahasa Indonesia Menggunakan Hidden Markov Model. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5108100146-Undergraduate-Theses.pdf]
Preview
Text
5108100146-Undergraduate-Theses.pdf - Published Version

Download (1MB) | Preview

Abstract

Bahasa merupakan salah satu instrumen utama dalam interaksi
dan komunikasi antara manusia. Meskipun bahasa pada dasarnya bahasa
bertujuan untuk memudahkan, tidak bisa dipungkiri kalau perbedaan
bahasa merupakan salah satu kendala dalam komunikasi. Hal inilah yang
kemudian mendasari munculnya pemikiran untuk membuat perangkat
komputer yang tidak hanya sebagai alat, tapi sebagai sebuah entitas hidup
yang mampu berpikir dan berkomunikasi selayaknya manusia. Dan di
sinilah penelitian Natural Language Processing bermula.
Ketika pertama kali dikembangkan, komputer tidak dirancang
untuk bisa berpikir dan mampu berkomunikasi dengan manusia. Namun
seiring dengan perkembangan zaman, muncullah gagasan untuk membuat
komputer bisa memahami bahasa manusia. Karena dengan memahami
bahasa manusia, maka komputer akan bekerja dengan lebih efektif dan
efisien. Instruksi yang sebelumnya hanya dengan menggunakan bahasa
mesin, kini bisa diinstruksikan dengan menggunakan bahasa manusia.
Membuat komputer mampu memahami bahasa manusia bukanlah
hal yang sederhana. Pemrosesan bahasa alami merupakan sebuah proses
berkelanjutan dari banyak fase. Dan Part of speech tagging merupakan
salah satu proses awal dalam serangkaian proses yang ada dalam
pemrosesan bahasa alami.
Meskipun penelitian di bidang pemrosesan bahasa alami sudah
berlangsung sejak lama, sampai saat ini masih belum banyak ditemukan
sistem pemrosesan bahasa alami untuk bahasa Indonesia yang
komperhensif. Salah satu penyebabnya adalah karena tidak adanya modulmodul
yang bisa digunakan secara efektif dan efisien untuk
mengembangkan sistem pemrosesan bahasa alami untuk bahasa Indonesia.
Sehingga semua orang yang ingin melakukan penilitian di bidang
pemrosesan bahasa alami harus membuat modul-modul yang digunakan
dalam pemrosesan bahasa alami secara mandiri.
Guna meningkatkan efisiensi dan efektivitas dalam penelitian di
bidang pemrosesan bahasa alami, perlu dikembangkan modul part of
speech tagger yang bisa digunakan secara mudah. Sehingga pihak-pihak
yang ingin melakukan penelitian di bidang pemrosesan bahasa alami tidak
perlu membuat membuat modulnya secara mandiri.Untuk membuat modul
part of speech tagging, diperlukan teknik pemodelan dan perhitungan
secara probabilistik untuk menentukan jenis kata dari masing-masing
kalimat. Hidden Markov Model merupakan salah satu teknik pemodelan
dan perhitungan statistik probabalistik dengan tingkat akurasi yang tinggi.

=================================================================

Language is one of the main instruments in the interaction
and communication between people. Although the language is
basically aiming to facilitate language, can not be denied that
differences in language is one of the obstacles in communication.
This is what underlies the emergence of the idea of making computer
devices that are not only as a tool, but as a living entity that is
capable of thinking and communicating properly human. And this is
where the research in Natural Language Processing began.
When first developed, computers are not designed to be able
to think and be able to communicate with humans. But along with the
times, there was the idea to make a computer can understand human
language. Because by understanding human language, then the
computer will work more effectively and efficiently. Instruction that
previously only by using machine language, can now be instructed
by human language.
Make computer to understand human language is not a
simple thing. Natural language processing is an ongoing process of
many phases. And part of speech tagging is one of the early process
in a series of processes that exist in natural language processing.
Although research in the field of natural language processing has
been going on for a long time, until now still not commonly found a
comprehensive natural language processing system for Indonesian language. One reason is the absence of modules that can be used
effectively and efficiently to develop a natural language processing
system for Indonesian. So that everyone who wants to do research in
the field of natural language processing must create modules that
are used in natural language processing independently.
In order to improve efficiency and effectiveness in research
in the field of natural language processing, need to be developed
part of speech tagger module that can be used easily. So that those
who want to do research in the field of natural language processing
does not need to make make the module by themselves. To make part
of speech tagging module, modeling engineering and calculation
probabilistic is necessary to determine what kind of part of speech of
each sentences. Hidden Markov Model is one modeling techniques
and statistical calculations probabalistik with a high degree of accuracy.

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 004.019 Has r
Uncontrolled Keywords: Algoritma Hidden Markov Model, Part of Speech, Tagging, Pemrosesan bahasa alami, Hidden Markov Model, Part of Speech, Tagging, Natural Language Processing
Subjects: Q Science > QA Mathematics > QA76.9 Computer algorithms. Virtual Reality. Computer simulation.
Divisions: Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Anis Wulandari
Date Deposited: 02 Oct 2017 07:50
Last Modified: 02 Oct 2017 07:50
URI: http://repository.its.ac.id/id/eprint/48894

Actions (login required)

View Item View Item