Susetyo, Irfan Rifqi (2021) Prediksi Keterhubungan Antar Produk Makanan Menggunakan Graph Embedding Dengan Algoritma Random Forest. Undergraduate thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
ADDI_FINALDRAFT_TATESIS_05211740000064_IRFAN RIFQI SUSETYO.pdf - Accepted Version Download (1MB) | Preview |
Abstract
Pada tahun 2020, agama Islam tercatat sebagai agama terbesar kedua di dunia dengan jumlah populasi sebanyak 1,9 miliar orang. Di Indonesia sendiri, populasi muslim diperkirakan berjumlah hingga 263 juta orang atau 87,2% dari total penduduk Indonesia. Dengan semakin banyaknya jumlah muslim yang ada, maka kebutuhan akan produk dan makanan halal yang merupakan salah satu ajaran dari agama Islam akan semakin banyak dibutuhkan. Dengan banyaknya organisasi penyeretfikasi halal yang ada, maka sumber informasi terkait daftar produk makanan menjadi terpisah-pisah dan tidak terintegrasi dengan baik. Dampaknya adalah sulit untuk mencari makanan yang sudah tersertifikasi halal, khususnya ketika mengunjungi negara baru yang minim akan produk makanan dengan sertifikasi halal. Meskipun sudah terdapat penelitian terkait integrasi data makanan halal, masih terdapat tantangan yaitu terkait dengan tingkat redundancy data yang tinggi. Selain itu, belum tersedianya informasi mengenai hubungan antar produk makanan. Salah satu cara yang dapat dilakukan untuk mengatasi tantangan tersebut adalah dengan melakukan link prediction. Link prediction merupakan prediksi adanya keterhubungan antara dua entitas atau node pada sebuah jaringan. Di dalam tugas akhir ini akan dilakukan link prediction dengan menggunakan data produk makanan yang diperoleh dari LODHalal, KlikIndomaret, dan HalalMUI. Data tersebut kemudian diubah ke bentuk vektor dengan menggunakan algoritma graph embedding yaitu Node2Vec dan RDF2Vec. Hasil dari graph embedding tersebut akan menjadi fitur untuk link prediction yang menggunakan Algoritma Random Forest. Diperoleh model link prediction Random Forest yang menggunakan vektor embedding Node2Vec memiliki performa yang lebih baik dengan nilai f1-score 82.7% dan accuracy 83.4%, sedangkan model link Prediction Random Forest yang menggunakan vektor embedding RDF2Vec memiliki performa yang sedikit lebih kecil dengan nilai f1-score 79.7% dan accuracy 80%. Didapatkan juga model link prediction Random Forest dengan data produk makanan halal mendapatkatkan performa yang lebih baik dibandingkan model dengan algoritma Gaussian Naïve Bayes, Logistic Regression, dan Gradient Boosting Classifier.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | linked open data, link prediction, graph embedding, random forest, node2vec, rdf2vec |
Subjects: | T Technology > T Technology (General) > T385 Visualization--Technique T Technology > T Technology (General) > T57.5 Data Processing T Technology > T Technology (General) > T58.62 Decision support systems |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 57201-(S1) Undergraduate Thesis |
Depositing User: | Irfan Rifqi Susetyo |
Date Deposited: | 13 Aug 2021 09:25 |
Last Modified: | 20 May 2024 05:41 |
URI: | http://repository.its.ac.id/id/eprint/86331 |
Actions (login required)
View Item |