Prediksi Penyakit Kronis Menggunakan Jejaring Komorbiditas pada Data BPJS Kesehatan

Alfaza, Ridzki Raihan (2024) Prediksi Penyakit Kronis Menggunakan Jejaring Komorbiditas pada Data BPJS Kesehatan. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5025201178-Undergraduate_Thesis.pdf] Text
5025201178-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2026.

Download (4MB) | Request a copy

Abstract

Penyakit kronis atau penyakit tidak menular (PTM) adalah penyakit jangka panjang yang dapat dialami oleh seseorang akibat keturunan, lingkungan, atau pola hidup. Penyakit kronis merupakan sumber kematian tertinggi secara global karena penyakit seperti penyakit kardiovaskular, penyakit pernapasan, kanker, dan diabetes. Penanganan dan pengobatan penyakit kronis merupakan sebuah tantangan yang berdampak keras bagi yang terpapar baik segi kehidupan maupun segi keuangan. Terdapat beberapa penelitian yang menggunakan jaringan komorbiditas, yaitu jaringan yang mewakili transisi diagnosis yang mendahului sebuah penyakit, untuk analisis dan prediksi penyakit kronis yang menjadi inspirasi pengerjaan tugas akhir ini. Pada tugas akhir ini, model berbasis machine learning akan dibuat untuk prediksi penyakit diabetes mellitus, penyakit ginjal kronis, dan penyakit paru kronis menggunakan data sampel dari Badan Penyelenggara Jaminan Sosial Kesehatan (BPJS Kesehatan) tahun 2015 sampai 2020 yang terdiri atas data Fasilitas Kesehatan Rujukan Tingkat Lanjut (FKRTL) dan data kepesertaan. Fitur diagnosis pada data FKRTL yang berbentuk kode International Classification of Diseases, 10th Revision (ICD-10) di-labelling sesuai dengan kelompok penyakit yang terdapat pada Elixhauser Comorbidity Index (ECI). Riwayat diagnosis yang dialami pasien pada data sampel BPJS Kesehatan diolah menjadi bentuk jejaring penyakit pasien yang mewakili riwayat penyakit pasien dalam bentuk node berupa diagnosis dan edge berupa transisi antar diagnosis. Jaringan penyakit pasien yang dihasilkan diagregasi untuk membentuk sebuah jejaring komorbiditas penyakit kronsi yang akan diprediksi. Jejaring penyakit pasien dapat dibandingkan dengan jejaring komorbiditas untuk mendapat fitur kecocokan jejaring komorbiditas yang akan dipakai pada pembentukan model. Selain itu, jejaring penyakit pasien juga dilakukan ekstraksi fitur graf yang menghasilkan sentralitas penyakit berupa skor degree centrality, eigenvector centrality, closeness centrality, clustering coefficient, dan pagerank dari diagnosis yang dialami oleh pasien. Model prediksi memakai beberapa metode machine learning yaitu Logistic Regression, Naive Bayes, K Nearest Neighbors, Binary Decision Tree, Random Forest, XGBoost, dan AdaBoost. Parameter dari model yang di-train didapatkan menggunakan hyperparameter tuning. Model prediksi dievaluasi menggunakan metrik penilaian accuracy, precision, recall, f1 score, dan Area Under the Recieving Operating Characteristic Curve (AUROC). Beberapa variabel juga dipakai sebagai skenario ujicoba untuk menentukan pengaruh metode hasil ujicoba. Model terbaik dalam prediksi penyakit diabetes mellitus berupa model Random Forest dengan skor testing AUROC 0.8663, ginjal kronis didapatkan hasil terbaik pada model AdaBoost dengan skor AUROC senilai 0.9021, sedangkan chronic pulmonary disease memiliki model terbaik pada Decision Tree Classifier dengan AUROC senilai 0.6806
===================================================================================================================================
Chronic diseases or non-communicable diseases (NCDs) are long-term diseases that can be experienced by someone due to heredity, environment, or lifestyle. Chronic diseases are the highest cause of death globally due to diseases such as cardiovascular disease, respiratory disease, cancer, and diabetes. Handling and treating chronic diseases is a challenge that has a severe impact on those exposed to both life and financial aspects. There are several studies that use comorbidity networks, namely networks that represent the transition of diagnoses that precede a disease, for the analysis and prediction of chronic diseases that inspired this final project. In this final project, a machine learning-based model will be created to predict diabetes mellitus, chronic kidney disease, and chronic lung disease using sample data from the Health Social Security Administering Agency (BPJS Kesehatan) from 2015 to 2020 consisting of Advanced Referral Health Facility (FKRTL) data and membership data. The diagnostic features in the FKRTL data in the form of the International Classification of Diseases, 10th Revision (ICD-10) code are labeled according to the disease groups contained in the Elixhauser Comorbidity Index (ECI). The history of patient diagnosis in BPJS Kesehatan sample data is processed into a patient disease network that represents the patient's disease history in the form of nodes in the form of diagnoses and edges in the form of transitions between diagnoses. The resulting patient disease network is aggregated to form a chronic disease comorbidity network that will be predicted. The patient disease network can be compared with the comorbidity network to obtain the comorbidity network match feature that will be used in model formation. In addition, the patient disease network is also subjected to graph feature extraction that produces disease centrality in the form of degree centrality scores, eigenvector centrality, closeness centrality, clustering coefficient, and pagerank from the diagnosis experienced by the patient. The prediction model uses several machine learning methods, namely Logistic Regression, Naive Bayes, K Nearest Neighbors, Binary Decision Tree, Random Forest, XGBoost, and AdaBoost. The parameters of the trained model are obtained using hyperparameter tuning. The prediction model is evaluated using the accuracy, precision, recall, f1 score, and Area Under the Receiving Operating Characteristic Curve (AUROC) assessment metrics. Several variables are also used as trial scenarios to determine the effect of the trial result method. The best model in predicting diabetes mellitus is the Random Forest model with an AUROC testing score of 0.8663, chronic kidney disease has the best results in the AdaBoost model with an AUROC score of 0.9021, while chronic pulmonary disease has the best model in the Decision Tree Classifier with an AUROC score of 0.6806

Item Type: Thesis (Other)
Uncontrolled Keywords: Disease Prediction, Machine Learning, Comorbidity Graph, BPJS Kesehatan
Subjects: R Medicine > R Medicine (General)
T Technology > T Technology (General)
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Ridzki Raihan Alfaza
Date Deposited: 01 Aug 2024 05:46
Last Modified: 17 Sep 2024 03:37
URI: http://repository.its.ac.id/id/eprint/111816

Actions (login required)

View Item View Item