Pembobotan Term Berbasis Kepadatan Ruang Kategori dan Kitab untuk Perangkingan Dokumen Terjemahan Hadis

Ni'mah, Ana Tsalitsatun (2020) Pembobotan Term Berbasis Kepadatan Ruang Kategori dan Kitab untuk Perangkingan Dokumen Terjemahan Hadis. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of Thesis]
Preview
Text (Thesis)
05111850010004-Master_Thesis.pdf
Available under License Creative Commons Attribution.

Download (3MB) | Preview

Abstract

Kitab hadis memiliki karakteristik yang berbeda dibandingkan dokumen konvensional pada umumnya. Setiap kitab memiliki beberapa kategori yang dibentuk oleh pengarang kitab tersebut dengan karakteristik masing-masing. Kumpulan hadis yang memiliki kategori sama dengan pengarang berbeda dapat memiliki kata kunci yang berbeda. Penggunaan metode pembobotan term berbasis kategori yang ada saat ini kurang relevan jika diterapkan pada kitab hadis. Hal ini dikarenakan metode tersebut hanya mempertimbangkan kepadatan term dalam setiap kategori dan tidak memperhatikan kata kunci pada masing-masing kitab, sehingga dibutuhkanlah pembobotan term baru yang mampu mempertimbangkan kepadatan term dalam setiap kategori dan memperhatikan term kunci pada masing-masing kitab.
Penelitian ini mengusulkan metode pembobotan term berbasis kepadatan ruang kategori dan kitab untuk perangkingan dokumen terjemahan hadis. Metode yang diusulkan adalah Inverse Hadith Space Density Frequency (IHSδF). IHSδF merupakan metode pembobotan term yang memperhatikan kata kunci pada masing-masing kitab dengan melakukan perhitungan kepadatan term pada masing-masing kitab. IHSδF digabungkan dengan TF-IDF-ICSδF untuk mendapatkan pembobotan term yang mampu mempertimbangkan kepadatan term dalam setiap kategori dan memperhatikan kata kunci pada masing-masing kitab. Metode ini diterapkan ke dalam pembobotan term pada dokumen dari dataset hadis kitab 9 imam yaitu Bukhari, Muslim, Abu Daud, Darimi, Nasa’i, Tirmidzi, Ahmad, Malik, dan Ibnu Majah. Perangkingan dilakukan dengan menggunakan perhitungan cosine similarity sebagai perhitungan jarak query masukan dengan dataset hadis.
Hasil uji coba menunjukkan bahwa metode yang diusulkan dapat diterapkan ke dalam dataset hadis dan mampu mempertimbangkan densitas (kepadatan) term dalam setiap kategori dan memperhatikan kata kunci pada masing-masing kitab. Rata-rata f-score tertinggi didapatkan dari uji coba short query dengan retrieve 10 teratas adalah sebesar 73%.
===============================================================================================
The book of hadith has different characteristics compared to conventional documents in general. Each book has several categories formed by the authors of the book with their respective characteristics. A collection of hadiths that have the same category as different authors can have different keywords. The current use of category-based weighting methods is less relevant if applied to the hadith. This is because the method only considers the word density in each category and does not pay attention to the keywords in each book. So we need a new word weighting that is able to consider the density of words in each category and pay attention to the keywords in each book.
This study proposes a method of weighting words based on the density of categories and books for ranking the hadith translation documents. The proposed method is Inverse Hadith Space Density Frequency (IHSδF). IHSδF is a method of weighting words that pay attention to the keywords in each book by calculating the word density in each book. IHSδF is combined with TF-IDF-ICSδF to get a weighting of words that is able to consider the density of words in each category and pay attention to the keywords in each book. This method is applied to the weighting of words in documents from the 9 hadith dataset, namely Bukhari, Muslim, Abu Daud, Darimi, Nasa'i, Tirmidzi, Ahmad, Malik, and Ibn Majah. Ranking is done using cosine similarity calculation as the calculation of the input query distance with the hadith dataset.
The trial results show that the proposed method can be applied to the hadith dataset and is able to consider the word density in each category and pay attention to the keywords in each book. The highest average f-score obtained from the short query trial with the top 10 retrieve is 73%.

Item Type: Thesis (Masters)
Additional Information: Ana Tsalitsatun Ni’mah merupakan anak ketiga dari empat bersaudara dari pasangan Moh. Sholichin dengan Ismiati. Penulis merupakan seorang istri dari Alfian Qomaruddin dan seorang ibu dari Muhammad Harits Al Fatih dan Dwinda Hasna Az Zakiyah. Penulis menempuh pendidikan di TK Dharma Wanita Kusuma Mulia Bakalan Grogol Kediri (1994-1996), Madrasah Ibtidaiyah Miftahul Huda Bakalan Grogol Kediri (1996-2002), SMP Negeri 1 Grogol Kediri (2002-2005), SMA Negeri 1 Grogol Kediri (2005-2008), Program Studi Pendidikan Matematika, Fakultas Teknik, Universitas Nusantara PGRI Kediri (2008-2009), dan Program Studi S1 Teknik Informatika, Fakultas Teknik, Universitas Trunojoyo Madura (2009-2013). Saat menempuh skripsi (Tugas Akhir S1), penulis mengambil minat information retrieval dan mengangkat topik mengenai pengembangan stemming, yang mengantarkan penulis pada kegemaran terhadap bidang ilmu komputer dan melanjutkan studi di Pascasarjana Teknik Informatika ITS. Penulis memiliki ketertarikan dalam penelitian pada bidang Information Retrieval. Penulis dapat dihubungi via email di anatsalits@gmail.com
Uncontrolled Keywords: Inverse Class Space Density Frequency, Inverse Hadith Space Density Frequency, Pembobotan Term, Perangkingan Dokumen, Terjemahan Hadis, Document Ranking, Hadith Translation, Inverse Class Space Density Frequency, Inverse Hadith Space Density Frequency, Term Weighting
Subjects: Z Bibliography. Library Science. Information Resources > ZA Information resources > Z699.5 Information storage and retrieval systems
Divisions: Faculty of Information Technology > Informatics Engineering > 55101-(S2) Master Thesis
Depositing User: Ana Tsalitsatun Ni'mah
Date Deposited: 11 Aug 2020 05:31
Last Modified: 26 May 2023 15:03
URI: http://repository.its.ac.id/id/eprint/77493

Actions (login required)

View Item View Item