Setyawan, Dimas Prihady (2025) Penerapan Generative Adversarial Networks Dalam Generasi Data Sintetis Sel Darah Putih Kasus Leukemia Limfoblastik Akut Dan Evaluasi Kinerja Model Klasifikasi. Other thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
5025211184-Undergraduate_Thesis.pdf - Accepted Version Restricted to Repository staff only Download (11MB) | Request a copy |
Abstract
Keterbatasan data citra medis, khususnya pada kasus Leukemia Limfoblastik Akut (LLA), menjadi tantangan dalam pengembangan model kecerdasan buatan untuk diagnosis yang akurat. Penelitian ini mengusulkan solusi melalui implementasi StyleGAN2-ADA untuk generasi data sintetis sel darah putih dan evaluasi dampaknya pada model klasifikasi Convolutional Neural Network (CNN). Model generatif StyleGAN2-ADA dilatih dengan mengoptimalkan hyperparameter Gamma dan Freezed menggunakan kerangka kerja Optuna yang memanfaatkan TPESampler untuk pencarian simultan, serta mengimplementasikan Adaptive Discriminator Augmentation (ADA) untuk menstabilkan pelatihan pada kondisi data terbatas. Evaluasi kuantitatif menunjukkan penurunan pada Fréchet Inception Distance (FID) rata-rata dari baseline yang bernilai 145,66 menjadi 84,85 dengan ADA, dan lebih lanjut menjadi 65,16 pada konfigurasi hyperparameter tuning. Nilai FID terendah dicapai 58,68 untuk L1, 65,03 untuk L2, dan 71,78 untuk L3, menunjukkan kualitas yang baik pada citra sintetis yang dihasilkan. Secara kualitatif, hasil Visual Turing Test (VTT) menunjukkan realisme yang meyakinkan, ahli patologi mencapai specificity rata-rata 54,67%, sementara mahasiswa/mahasiswi kedokteran mencatat specificity rata-rata 40,27%, mengindikasikan kesulitan yang cukup jelas dalam membedakan gambar asli dari sintetis. Seluruh dataset klasifikasi, termasuk data latih, validasi, dan uji, diterapkan peningkatan kontras menggunakan metode EFF Contrast Enhancement untuk mengoptimalkan karakteristik visual citra. Pengujian model klasifikasi CNN pada skenario dataset yang diperkaya data sintetis menunjukkan peningkatan performa yang bertahap. Akurasi keseluruhan meningkat dari 86% pada data asli menjadi 87% pada data asli dengan sintetis yang diseimbangkan dengan L1, dan mencapai 90% pada skenario data asli dengan data sintetis yang diperbanyak 1.000 per kelas. Peningkatan yang teramati pada recall dan precision di kelas-kelas L1 dan L2, serta kinerja recall dan precision kelas L3 yang tetap konsisten tertinggi, dengan F1-Score rata-rata mencapai 89,72% pada skenario optimal.
===================================================================================================================================
The scarcity of medical image data, particularly in Acute Lymphoblastic Leukemia (ALL) cases, poses a challenge in developing accurate artificial intelligence models for diagnosis. This research proposes a solution through the implementation of StyleGAN2-ADA for white blood cell synthetic data generation and the evaluation of its impact on a Convolutional Neural Network (CNN) classification model. The generative StyleGAN2-ADA model was trained by optimizing Gamma and Freezed hyperparameters using the Optuna framework, which utilizes TPESampler for simultaneous search, and by implementing Adaptive Discriminator Augmentation (ADA) to stabilize training under limited data conditions. Quantitative evaluation revealed a reduction in the average Fréchet Inception Distance (FID) from the baseline, which was 145,66, to 84,85 with ADA, and further to 65,16 in the optimal hyperparameter tuning configuration. The lowest FID values were achieved 58,68 for L1, 65,03 for L2, and 71,78 for L3, demonstrating the quality of the generated synthetic images. Qualitatively, Visual Turing Test (VTT) results showed convincing realism; pathologists achieved an average specificity of 54,67%, while medical students recorded an average specificity of 40,27%, indicating considerable difficulty in distinguishing real from synthetic images. The entire classification dataset, including training, validation, and test data, underwent contrast enhancement using the EFF Contrast Enhancement method to optimize the images' visual characteristics. Testing of the CNN classification model on synthetic data-enriched scenarios showed progressive performance improvement. Overall accuracy increased from 86% in the original data to 87% in the original data with synthetic data and reached 90% in the original data with synthetic data ratio 1.000 scenario. Improvements observed in recall and precision in L1 and L2 classes, as well as consistently high recall and precision performance for L3 class, with an average F1-Score reaching 89,72% in the optimal scenario, prove that the addition of synthetic data effectively addresses original data limitations and class imbalance, substantially enhancing the classification model's ability to support ALL diagnosis.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | Leukemia Limfoblastik Akut, Sel Darah Putih, Citra Medis, Generative Adversarial Networks, Data Sintetis, Model Klasifikasi, Evaluasi Kinerja |
Subjects: | Q Science > QA Mathematics > QA336 Artificial Intelligence R Medicine > RB Pathology |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis |
Depositing User: | Dimas Prihady Setyawan |
Date Deposited: | 23 Jul 2025 06:27 |
Last Modified: | 23 Jul 2025 06:27 |
URI: | http://repository.its.ac.id/id/eprint/120786 |
Actions (login required)
![]() |
View Item |