Klasifikasi Resiko Penyakit Hipertensi Menggunakan Algoritma Ada-Boost Dengan Menerapkan Seleksi Fitur Relief-F Dan Oversampling Technique Pada Dataset Klinis Tidak Seimbang

Karima, Cahya (2023) Klasifikasi Resiko Penyakit Hipertensi Menggunakan Algoritma Ada-Boost Dengan Menerapkan Seleksi Fitur Relief-F Dan Oversampling Technique Pada Dataset Klinis Tidak Seimbang. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05211950010014-Master_Thesis.pdf] Text
05211950010014-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2025.

Download (2MB) | Request a copy

Abstract

Tekanan darah tinggi, nama lain dari hipertensi, adalah suatu kondisi di mana tekanan di dalam pembuluh darah terus meningkat. Salah satu bidang studi yang paling menarik adalah data mining, yang sedang dikembangkan untuk meningkatkan penerimaannya dalam organisasi, khususnya di bidang kesehatan [5]. Saat ini, metode AdaBoost adalah pendekatan klasifikasi fitur penting dalam pembelajaran mesin. AdaBoost memberikan bobot pada sampel selama fase pelatihan yang meningkat saat tingkat kesalahan meningkat dan berkurang saat tingkat kesalahan menurun. Proses klasifikasi risiko hipertensi dengan menggunakan dataset Indeks Keluarga Sehat dengan diperoleh 8 atribut. Memerlukan dua partisi, 70% data pelatihan dan 30% data pengujian. Klasifikasi biner diterapkan "Normal" dan "Hipertensi". Fitur terpenting dari 8 atribut tersebut dipilih berdasarkan nilai ranking algoritma pemilihan fitur ReliefF, dengan 5 atribut peringkat terbaik. Pemilihan fitur ReliefF dapat membedakan antara kelas dan mengidentifikasi fitur yang paling relevan dengan nilai melebihi ambang batas yang ditentukan. Hasil Confusion Matrix yang tinggi juga menunjukkan bahwa algoritma AdaBoost yang diterapkan pada penelitian ini memiliki kinerja yang baik. Hal ini juga didukung dengan pre-processing data yang diolah secara hati-hati agar tidak mempengaruhi hasil akhir klasifikasi. Langkah pre-processing awal adalah pembersihan data, penanganan missing value, normalisasi data, pemilihan fitur menggunakan ReliefF, penanganan dataset yang tidak seimbang menggunakan teknik oversampling, proses klasifikasi dengan algoritma AdaBoost, uji dan skor serta Confusion Matrix.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Preprocessing; ReliefF; AdaBoost; Hipertensi; Dataset Klinis Tidak Seimbang, Missing Value, Teknik Oversampling
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Information System > 59101-(S2) Master Thesis
Depositing User: Cahya Karima
Date Deposited: 04 Aug 2023 06:59
Last Modified: 04 Aug 2023 06:59
URI: http://repository.its.ac.id/id/eprint/103054

Actions (login required)

View Item View Item