Klasifikasi Penyakit Kronis Berbasis Multimodal Deep Learning Pada Data Sampel BPJS Kesehatan

Ardana, I Gusti Ngurah Ervan Juli (2025) Klasifikasi Penyakit Kronis Berbasis Multimodal Deep Learning Pada Data Sampel BPJS Kesehatan. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5025211205-Undergraduate_Thesis.pdf] Text
5025211205-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (13MB) | Request a copy

Abstract

Penyakit Kronis merupakan suatu penyakit tidak menular yang berlangsung dalam jangka waktu yang lama dan membutuhkan pemantauan jangka panjang untuk mencegah komplikasi serius. Oleh karena itu, deteksi dini terhadap berbagai penyakit kronis menjadi penting dalam upaya untuk mitigasi risiko serta meningkatkan kualitas hidup pasien. Dalam mendukung upaya tersebut, berbagai pendekatan machine learning dan deep learning telah dikembangkan oleh berbagai penelitian menggunakan data rekam medis untuk prediksi penyakit kronis. Namun, sebagian besar penelitian ini berfokus pada data yang terstruktur tanpa mempertimbangkan informasi dalam teks yang tidak terstruktur, begitu juga sebaliknya. Pada tugas akhir ini, diajukan tiga pendekatan modalitas meliputi structured feature, unstructured feature dan kombinasi keduanya dalam bentuk multimodal feature untuk melakukan klasifikasi beberapa penyakit kronis (diabetes mellitus, renal failure, hypertension dan congestive heart failure). Pendekatan ini mengintegrasikan data administratif oleh Badan Penyelenggara Jaminan Sosial Kesehatan (BPJS Kesehatan) sejak tahun 2015 hingga 2020, berupa teks riwayat diagnosis yang tidak terstruktur dengan informasi medis terstruktur yang diperoleh dari data demografis serta jaringan penyakit pasien. Untuk mengevaluasi performa dari masing-masing modalitas tersebut, digunakan beberapa arsitektur deep learning arsitektur meliputi FNN, CNN, LSTM, Bi-LSTM, GRU, BERT, dan BioClinicalBERT yang dibandingkan menggunakan berbagai matriks evaluasi. Beberapa matriks evaluasi yang digunakan antara lain accuracy, precision, recall, F1-score dan AUC-ROC. Di antara metrik tersebut, F1-score digunakan sebagai metrik utama karena mampu memberikan keseimbangan pada precision dan recall, terutama pada data yang tidak seimbang.Berdasarkan evaluasi menggunakan metrik utama atau F1-score, model terbaik untuk masing-masing penyakit adalah sebagai berikut. Pada kasus Renal Failure, Bi-LSTM dengan skenario unstructured memberikan hasil terbaik dengan F1-score sebesar 0,8359. Pada Diabetes Mellitus, Bi-LSTM dengan skenario multimodal menghasilkan F1-score tertinggi sebesar 0,7459. Sementara itu, pada penyakit Hypertension, BioClinicalBERT dalam skenario multimodal menunjukkan performa terbaik dengan F1-score sebesar 0,7675. Terakhir, pada Congestive Heart Failure, model BERT dengan skenario multimodal menjadi yang paling optimal dengan F1-score sebesar 0,6893. Penelitian ini menunjukkan bahwa kombinasi modalitas dan target penyakit yang digunakan berperan penting dalam performa suatu algoritma dalam melakukan klasifikasi untuk masing-masing penyakit.
=====================================================================================================================================
Chronic Disease is a non-communicable disease that lasts for a long period of time and requires long-term monitoring to prevent serious complications. Therefore, early detection of various chronic diseases is important in efforts to mitigate risks and improve the quality of life of patients. In support of these efforts, various machine learning and deep learning approaches have been developed by various studies using medical record data for the prediction of chronic diseases. However, most of these studies focused on structured data without considering the information in the unstructured text, and vice versa In this final project, three modality approaches were proposed including structured feature, unstructured feature and a combination of both in the form of multimodal feature to classify several chronic diseases (diabetes mellitus, renal failure, hypertension and congestive heart failure). This approach integrates administrative data by the Health Social Security Administration Agency (BPJS Kesehatan) from 2015 to 2020, in the form of unstructured diagnosis history text with structured medical information obtained from demographic data and patient disease networks. To evaluate the performance of each of these modalities, several deep learning architectures including FNN, CNN, LSTM, Bi-LSTM, GRU, BERT, and BioClinicalBERT were used which were compared using various evaluation matrices. Some of the evaluation matrices used include accuracy, precision, recall, F1-score and AUC-ROC. Among these metrics, F1-score is used as the main metric because it is able to provide a balance on precision and recall, especially on unbalanced data. Based on the evaluation using the main metric or F1-score, the best model for each disease is as follows. In the case of Renal Failure, Bi-LSTM with an unstructured scenario gives the best results with an F1-score of 0.8359. In Diabetes Mellitus, Bi-LSTM with a multimodal scenario produces the highest F1-score of 0.7459. Meanwhile, in Hypertension, BioClinicalBERT in the multimodal scenario showed the best performance with an F1-score of 0.7675. Finally, in Congestive Heart Failure, the BERT model with a multimodal scenario was the most optimal with an F1-score of 0.6893. This study shows that the combination of modalities and disease targets used plays an important role in the performance of an algorithm in classifying each disease.

Item Type: Thesis (Other)
Uncontrolled Keywords: BPJS Kesehatan, Deep Learning, Jaringan Komorbiditas, Multimodal, Penyakit Kronis, BPJS Kesehatan, Chronic Disease, Comorbidity Network, Deep Learning, Multimodal.
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: I Gusti Ngurah Ervan Juli Ardana
Date Deposited: 29 Jul 2025 01:58
Last Modified: 29 Jul 2025 02:07
URI: http://repository.its.ac.id/id/eprint/122389

Actions (login required)

View Item View Item