Al Anshory, Miftahuddin (2016) Implementasi Tesaurus Hirarkis Secara Dinamis Pada Data Berita Berbahasa Indonesia Menggunakan Informasi Cooccurrence. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
5112100026-Undergraduate_Thesis.pdf - Accepted Version Download (2MB) | Preview |
Abstract
Tesaurus dibangun secara dinamis merupakan salah satu penyelesaian dari masalah beban kerja yang dilakukan secara manual untuk menambah atau mengubah informasi kata. Tesaurus hirarkis bertujuan untuk menentukan kata yang memiliki arti umum (hiponim) dan kata yang memiliki arti khusus (hipernim). Tesaurus berbahasa Indonesia seperti kamus Kateglo, masih memiliki kekurangan untuk menampilkan nilai kedekatan yang dimiliki oleh masing-masing kata terhadap kata lain, sedangkan tesaurus yang dibangun diharapkan dapat menampilkan nilai kedekatan tersebut. Tesaurus dibangun dengan cara melakukan ekstraksi kata dari artikel berita berbahasa Indonesia. Kemudian hasil ekstraksi kata tersebut dibentuk menjadi sebuah informasi cooccurrence dari masing-masing kata. Hasil dari informasi cooccurrence digunakan untuk membentuk vektor kata yang digunakan dalam penghitungan jarak antar kata menggunakan cosine similarity sebelum dilakukannya proses clustering menggunakan hierarchical clustering. Setelah terbentuk cluster
=======================================================================================================
Thesaurus built dynamically is one of the ways to solve a problem about workload for built it manually for adding or changing word information. While hierarchical intends to define common words (hyponym) and specific words (hypernym). Indonesian Thesaurus such as Kateglo still had deficiency to show similarity value between each words, whereas thesaurus we built is expected to show the value of similarity. Thesaurus is built by extracting words from Indonesian language news articles. Then the result from extraction process formed into a co-occurrence information of each word. Then, the results of the co-occurrence information used to form a vector of words that used in the calculation of distances between words using the cosine similarity before the clustering process using hierarchical clustering. Once formed cluster, do the calculation with the Kullback-Leiber divergence between words contained in the same cluster.
Item Type: | Thesis (Undergraduate) |
---|---|
Additional Information: | RSIf 005.74 Ala i |
Uncontrolled Keywords: | s, Informasi Co-occurrence, Hirarkis, Dinamis, Hierarchical Clustering, Kullback-Leiber divergence |
Subjects: | Z Bibliography. Library Science. Information Resources > ZA Information resources > Z699.5 Information storage and retrieval systems |
Divisions: | Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis |
Depositing User: | Yeni Anita Gonti |
Date Deposited: | 15 Apr 2020 18:33 |
Last Modified: | 15 Apr 2020 18:33 |
URI: | http://repository.its.ac.id/id/eprint/75762 |
Actions (login required)
View Item |