Implementasi Tesaurus Hirarkis Secara Dinamis Pada Data Berita Berbahasa Indonesia Menggunakan Informasi Cooccurrence

Al Anshory, Miftahuddin (2016) Implementasi Tesaurus Hirarkis Secara Dinamis Pada Data Berita Berbahasa Indonesia Menggunakan Informasi Cooccurrence. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5112100026-Undergraduate_Thesis.pdf]

Text
5112100026-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only
Download (2MB) | Request a copy

Abstract

Tesaurus dibangun secara dinamis merupakan salah satu penyelesaian dari masalah beban kerja yang dilakukan secara manual untuk menambah atau mengubah informasi kata. Tesaurus hirarkis bertujuan untuk menentukan kata yang memiliki arti umum (hiponim) dan kata yang memiliki arti khusus (hipernim). Tesaurus berbahasa Indonesia seperti kamus Kateglo, masih memiliki kekurangan untuk menampilkan nilai kedekatan yang dimiliki oleh masing-masing kata terhadap kata lain, sedangkan tesaurus yang dibangun diharapkan dapat menampilkan nilai kedekatan tersebut. Tesaurus dibangun dengan cara melakukan ekstraksi kata dari artikel berita berbahasa Indonesia. Kemudian hasil ekstraksi kata tersebut dibentuk menjadi sebuah informasi cooccurrence dari masing-masing kata. Hasil dari informasi cooccurrence digunakan untuk membentuk vektor kata yang digunakan dalam penghitungan jarak antar kata menggunakan cosine similarity sebelum dilakukannya proses clustering menggunakan hierarchical clustering. Setelah terbentuk cluster
=======================================================================================================
Thesaurus built dynamically is one of the ways to solve a problem about workload for built it manually for adding or changing word information. While hierarchical intends to define common words (hyponym) and specific words (hypernym). Indonesian Thesaurus such as Kateglo still had deficiency to show similarity value between each words, whereas thesaurus we built is expected to show the value of similarity. Thesaurus is built by extracting words from Indonesian language news articles. Then the result from extraction process formed into a co-occurrence information of each word. Then, the results of the co-occurrence information used to form a vector of words that used in the calculation of distances between words using the cosine similarity before the clustering process using hierarchical clustering. Once formed cluster, do the calculation with the Kullback-Leiber divergence between words contained in the same cluster.

Item Type:	Thesis (Undergraduate)
Additional Information:	RSIf 005.74 Ala i
Uncontrolled Keywords:	s, Informasi Co-occurrence, Hirarkis, Dinamis, Hierarchical Clustering, Kullback-Leiber divergence
Subjects:	Z Bibliography. Library Science. Information Resources > ZA Information resources > Z699.5 Information storage and retrieval systems
Divisions:	Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User:	Yeni Anita Gonti
Date Deposited:	15 Apr 2020 18:33
Last Modified:	03 Sep 2025 04:11
URI:	http://repository.its.ac.id/id/eprint/75762

Actions (login required)

View Item