Rancang Bangun API Part of Speech Tagger untuk Bahasa Indonesia Menggunakan Hidden Markov Model

Hasan, Sa`ad Ahyat (2016) Rancang Bangun API Part of Speech Tagger untuk Bahasa Indonesia Menggunakan Hidden Markov Model. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[img]
Preview
Text
5108100146-Undergraduate-Theses.pdf - Published Version

Download (1MB) | Preview

Abstract

Bahasa merupakan salah satu instrumen utama dalam interaksi dan komunikasi antara manusia. Meskipun bahasa pada dasarnya bahasa bertujuan untuk memudahkan, tidak bisa dipungkiri kalau perbedaan bahasa merupakan salah satu kendala dalam komunikasi. Hal inilah yang kemudian mendasari munculnya pemikiran untuk membuat perangkat komputer yang tidak hanya sebagai alat, tapi sebagai sebuah entitas hidup yang mampu berpikir dan berkomunikasi selayaknya manusia. Dan di sinilah penelitian Natural Language Processing bermula. Ketika pertama kali dikembangkan, komputer tidak dirancang untuk bisa berpikir dan mampu berkomunikasi dengan manusia. Namun seiring dengan perkembangan zaman, muncullah gagasan untuk membuat komputer bisa memahami bahasa manusia. Karena dengan memahami bahasa manusia, maka komputer akan bekerja dengan lebih efektif dan efisien. Instruksi yang sebelumnya hanya dengan menggunakan bahasa mesin, kini bisa diinstruksikan dengan menggunakan bahasa manusia. Membuat komputer mampu memahami bahasa manusia bukanlah hal yang sederhana. Pemrosesan bahasa alami merupakan sebuah proses berkelanjutan dari banyak fase. Dan Part of speech tagging merupakan salah satu proses awal dalam serangkaian proses yang ada dalam pemrosesan bahasa alami. Meskipun penelitian di bidang pemrosesan bahasa alami sudah berlangsung sejak lama, sampai saat ini masih belum banyak ditemukan sistem pemrosesan bahasa alami untuk bahasa Indonesia yang komperhensif. Salah satu penyebabnya adalah karena tidak adanya modulmodul yang bisa digunakan secara efektif dan efisien untuk mengembangkan sistem pemrosesan bahasa alami untuk bahasa Indonesia. Sehingga semua orang yang ingin melakukan penilitian di bidang pemrosesan bahasa alami harus membuat modul-modul yang digunakan dalam pemrosesan bahasa alami secara mandiri. Guna meningkatkan efisiensi dan efektivitas dalam penelitian di bidang pemrosesan bahasa alami, perlu dikembangkan modul part of speech tagger yang bisa digunakan secara mudah. Sehingga pihak-pihak yang ingin melakukan penelitian di bidang pemrosesan bahasa alami tidak perlu membuat membuat modulnya secara mandiri.Untuk membuat modul part of speech tagging, diperlukan teknik pemodelan dan perhitungan secara probabilistik untuk menentukan jenis kata dari masing-masing kalimat. Hidden Markov Model merupakan salah satu teknik pemodelan dan perhitungan statistik probabalistik dengan tingkat akurasi yang tinggi. ================================================================= Language is one of the main instruments in the interaction and communication between people. Although the language is basically aiming to facilitate language, can not be denied that differences in language is one of the obstacles in communication. This is what underlies the emergence of the idea of making computer devices that are not only as a tool, but as a living entity that is capable of thinking and communicating properly human. And this is where the research in Natural Language Processing began. When first developed, computers are not designed to be able to think and be able to communicate with humans. But along with the times, there was the idea to make a computer can understand human language. Because by understanding human language, then the computer will work more effectively and efficiently. Instruction that previously only by using machine language, can now be instructed by human language. Make computer to understand human language is not a simple thing. Natural language processing is an ongoing process of many phases. And part of speech tagging is one of the early process in a series of processes that exist in natural language processing. Although research in the field of natural language processing has been going on for a long time, until now still not commonly found a comprehensive natural language processing system for Indonesian language. One reason is the absence of modules that can be used effectively and efficiently to develop a natural language processing system for Indonesian. So that everyone who wants to do research in the field of natural language processing must create modules that are used in natural language processing independently. In order to improve efficiency and effectiveness in research in the field of natural language processing, need to be developed part of speech tagger module that can be used easily. So that those who want to do research in the field of natural language processing does not need to make make the module by themselves. To make part of speech tagging module, modeling engineering and calculation probabilistic is necessary to determine what kind of part of speech of each sentences. Hidden Markov Model is one modeling techniques and statistical calculations probabalistik with a high degree of accuracy.

Item Type: Thesis (Undergraduate)
Additional Information: RSIf 004.019 Has r
Uncontrolled Keywords: Algoritma Hidden Markov Model, Part of Speech, Tagging, Pemrosesan bahasa alami, Hidden Markov Model, Part of Speech, Tagging, Natural Language Processing
Subjects: Q Science > QA Mathematics > QA76.9 Computer algorithms. Virtual Reality. Computer simulation.
Divisions: Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Mrs Anis Wulandari
Date Deposited: 02 Oct 2017 07:50
Last Modified: 02 Oct 2017 07:50
URI: http://repository.its.ac.id/id/eprint/48894

Actions (login required)

View Item View Item