Prediksi Kelangsungan Hidup Pasien Kanker Berdasarkan Data tidak Seimbang Haberman Cancer Menggunakan Metode Generative Adversarial Network dan Machine Learning

Rahmatullah, Mohammad Luthfi (2025) Prediksi Kelangsungan Hidup Pasien Kanker Berdasarkan Data tidak Seimbang Haberman Cancer Menggunakan Metode Generative Adversarial Network dan Machine Learning. Project Report. [s.n.], [s.l.]. (Unpublished)

[thumbnail of 05111740000038-Project_Report.pdf] Text
05111740000038-Project_Report.pdf - Accepted Version
Restricted to Repository staff only

Download (1MB) | Request a copy

Abstract

Ketidakseimbangan data merupakan masalah yang sering dihadapi ketika melakukan pelatihan model machine leaning. Hal ini terjadi ketika distribusi antar kelas dalam sebuah dataset jumlahnya berbeda cukup jauh. Dampaknya adalah rendahnya akurasi model dalam prediksi kelas minoritas, yang biasanya adalah kelas yang penting contohnya adalah pada diagnosis medis, deteksi penipuan dan kemanan siber. Beberapa metode sudah dikembangkan sebagai solusi untuk mengatasi ketidakseimbangan data. Meskipun demikian, metode-metode tersebut masih memiliki kekurangan. Oversampling berisiko menambah noise atau menghasilkan data sintetis yang kurang sesuai dengan keadaan, sedangkan undersampling berpotensi menghilangkan informasi penting dari kelas mayoritas. Cost-sensitive learning memerlukan penyesuaian penyesuaian bobot yang tepat, dan metode deep learning memerlukan daya komputasi dan jumlah data yang besar. Sebagai tanggapan untuk masalah seperti itu, augmentasi data berbasis generative adversarial network (GAN) mulai dijelajahi. GAN memiliki kemampuan untuk menghasilkan data sintetis yang cukup realistis sehingga dapat menciptakan sampel data kelas minoritas yang menyerupai data asli. Data sintetis ini akan digabungkan dengan data asli dan digunakan untuk melatih model machine learning. Akan digunakan beberapa model machine learning tradisional. Hasil penelitian didapatkan dapat menaikkan metrik evaluasi kurang lebih lima persen.

Item Type: Monograph (Project Report)
Uncontrolled Keywords: ketidakseimbangan data, augmentasi data, GAN
Subjects: T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Information and Communication Technology > Informatics > 55201-(S1) Undergraduate Thesis
Depositing User: Mohammad Luthfi Rahmatullah
Date Deposited: 05 Aug 2025 06:17
Last Modified: 05 Aug 2025 06:17
URI: http://repository.its.ac.id/id/eprint/127192

Actions (login required)

View Item View Item