Prediksi Penyakit Kronis Menggunakan Jejaring Komorbiditas pada Data BPJS Kesehatan

Alfaza, Ridzki Raihan (2024) Prediksi Penyakit Kronis Menggunakan Jejaring Komorbiditas pada Data BPJS Kesehatan. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5025201178-Undergraduate_Thesis.pdf] Text
5025201178-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (4MB) | Request a copy

Abstract

Penyakit kronis atau penyakit tidak menular (PTM) adalah penyakit jangka panjang yang
dapat dialami oleh seseorang akibat keturunan, lingkungan, atau pola hidup. Penyakit kronis
merupakan sumber kematian tertinggi secara global karena penyakit seperti penyakit
kardiovaskular, penyakit pernapasan, kanker, dan diabetes. Penanganan dan pengobatan
penyakit kronis merupakan sebuah tantangan yang berdampak keras bagi yang terpapar baik
segi kehidupan maupun segi keuangan. Terdapat beberapa penelitian yang menggunakan
jaringan komorbiditas, yaitu jaringan yang mewakili transisi diagnosis yang mendahului sebuah
penyakit, untuk analisis dan prediksi penyakit kronis yang menjadi inspirasi pengerjaan tugas
akhir ini.
Pada tugas akhir ini, model berbasis machine learning akan dibuat untuk prediksi penyakit
diabetes mellitus, penyakit ginjal kronis, dan penyakit paru kronis menggunakan data sampel
dari Badan Penyelenggara Jaminan Sosial Kesehatan (BPJS Kesehatan) tahun 2015 sampai
2020 yang terdiri atas data Fasilitas Kesehatan Rujukan Tingkat Lanjut (FKRTL) dan data
kepesertaan. Fitur diagnosis pada data FKRTL yang berbentuk kode International
Classification of Diseases, 10th Revision (ICD-10) di-labelling sesuai dengan kelompok
penyakit yang terdapat pada Elixhauser Comorbidity Index (ECI). Riwayat diagnosis yang
dialami pasien pada data sampel BPJS Kesehatan diolah menjadi bentuk jejaring penyakit
pasien yang mewakili riwayat penyakit pasien dalam bentuk node berupa diagnosis dan edge
berupa transisi antar diagnosis. Jaringan penyakit pasien yang dihasilkan diagregasi untuk
membentuk sebuah jejaring komorbiditas penyakit kronsi yang akan diprediksi. Jejaring
penyakit pasien dapat dibandingkan dengan jejaring komorbiditas untuk mendapat fitur
kecocokan jejaring komorbiditas yang akan dipakai pada pembentukan model. Selain itu,
jejaring penyakit pasien juga dilakukan ekstraksi fitur graf yang menghasilkan sentralitas
penyakit berupa skor degree centrality, eigenvector centrality, closeness centrality, clustering
coefficient, dan pagerank dari diagnosis yang dialami oleh pasien.
Model prediksi memakai beberapa metode machine learning yaitu Logistic Regression,
Naive Bayes, K Nearest Neighbors, Binary Decision Tree, Random Forest, XGBoost, dan
AdaBoost. Parameter dari model yang di-train didapatkan menggunakan hyperparameter
tuning. Model prediksi dievaluasi menggunakan metrik penilaian accuracy, precision, recall,
f1 score, dan Area Under the Recieving Operating Characteristic Curve (AUROC). Beberapa
variabel juga dipakai sebagai skenario ujicoba untuk menentukan pengaruh metode
pembentukan jejaring komorbiditas, oversampling, dan pengaruh dari fitur jejaring pasien pada
hasil ujicoba. Model terbaik dalam prediksi penyakit diabetes mellitus berupa model Random
Forest dengan skor testing AUROC 0.8663, ginjal kronis didapatkan hasil terbaik pada model
AdaBoost dengan skor AUROC senilai 0.9021, sedangkan chronic pulmonary disease memiliki
model terbaik pada Decision Tree Classifier dengan AUROC senilai 0.6806.
==============================================================================
Chronic diseases or non-communable diseases (NCDs) are long-term illnesses that a
person could experience due to heredity, environment, and lifestyle. Chronic diseases are the
leading cause of death globally with diseases such as cardiovascular disease, chronic respiratory
disease, cancer, and diabetes. Handling and treatment of chronic diseases prove to be a
challenge that affects victims harshly, be it in their daily lives or economically. There are several
studies that use comorbidity networks, which are networks that represent the transisions of
illnesses which precede a disease, for chronic disease analysis and prediction, which inspired
this final project.
In this final project, a machine learning based model will be made to predict diabetes
mellitus, chronic kidney disease, and chronic pulmonary disease with data from Badan
Penyelenggara Jaminan Sosial Kesehatan (BPJS of Healthcare) from the year 2015 to 2020
which consists of data for Fasilitas Kesehatan Rujukan Tingkat Lanjut (FKRTL) and patient
data. Patient diagnosis from the FKRTL data that are written following the International
Classification of Diseases, 10th Revision (ICD-10) code is then labelled into their disease
groups according to the Elixhauser Comorbidity Index (ECI). The diagnosis history
experienced by patients in the BPJS Kesehatan sample data is processed into a patient disease
network that represents the patient's disease history in the form of nodes in the form of
diagnoses and edges in the form of transitions between diagnoses. The resulting patient disease
network is aggregated to form a chronic disease comorbidity network for the disease that will
be predicted. The patient's disease network can be compared with the comorbidity network to
obtain the matching features of the comorbidity network that will be used in model building. In
addition, the patient's disease network also has graph features extracted in that symbolizes
disease centrality in the form of degree centrality score, eigenvector centrality, closeness
centrality, clustering coefficient, and pagerank of the diagnosis experienced by the patient.
The prediction model uses several machine learning methods, namely Logistic
Regression, Naive Bayes, K Nearest Neighbors, Binary Decision Tree, Random Forest,
XGBoost, and AdaBoost. The parameters of the trained model are obtained using
hyperparameter tuning. The prediction models were evaluated using accuracy, precision, recall,
f1 score, and Area Under the Recieving Operating Characteristic Curve (AUROC) scoring
metrics. Several variables were also used as test scenarios to determine the influence of the
method used to build the comorbidity network, oversampling, and the influence of patient
network features on the test results. The best model in predicting diabetes mellitus is the
Random Forest with a testing AUROC score of 0.8663, chronic kidney disease has the best
results with AdaBoost with an AUROC score of 0.9021, while chronic pulmonary disease has
the best model using Decision Tree Classifier with an AUROC score of 0.6806.

Item Type: Thesis (Other)
Uncontrolled Keywords: Disease Prediction, Machine Learning, Comorbidity Graph, BPJS Kesehatan
Subjects: R Medicine > R Medicine (General)
T Technology > T Technology (General)
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Information Technology > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Ridzki Raihan Alfaza
Date Deposited: 01 Aug 2024 05:46
Last Modified: 01 Aug 2024 05:46
URI: http://repository.its.ac.id/id/eprint/111816

Actions (login required)

View Item View Item