Klasifikasi Risiko Penyakit Kronis pada Data BPJS dengan Analisis Jejaring Pasien

Wiguna, Putu Ravindra (2024) Klasifikasi Risiko Penyakit Kronis pada Data BPJS dengan Analisis Jejaring Pasien. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5025201237-Undergraduate_Thesis.pdf] Text
5025201237-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (3MB) | Request a copy

Abstract

Penyakit kronis merupakan salah satu penyebab utama kematian di Indonesia. Penyakit kronis ini dapat disebabkan oleh beberapa faktor risiko seperti genetik, fisiologis, lingkungan, dan gaya hidup. Klasifikasi risiko penyakit kronis dapat dilakukan dengan menggunakan data rekam medis pasien milik BPJS. Data rekam medis ini berisikan data seperti riwayat penyakit pasien. Pasien yang memiliki kesamaan riwayat penyakit, dapat dikatakan memiliki suatu hubungan laten seperti kesamaan gaya hidup atau faktor risiko lainnya. Hubungan laten antar pasien ini bisa menjadi informasi penting untuk melakukan klasifikasi risiko penyakit kronis. Salah satu pendekatan untuk mendapatkan informasi laten ini adalah dengan membentuk jejaring pasien berdasarkan kesamaan riwayat penyakit pasien. Penelitian ini mengeksplorasi penggunaan analisis jejaring pasien yang dibentuk dari data BPJS untuk mengembangkan model klasifikasi risiko penyakit kronis. Penyakit paru kronis (chronic pulmonary disease) dipilih sebagai penyakit kronis yang akan diprediksi pada penelitian ini.
Tahapan dalam penelitian ini mencakup persiapan data BPJS, pembentukan jejaring pasien, ekstraksi fitur pasien dan fitur graf, pembuatan model klasifikasi risiko penyakit kronis, serta evaluasi dan analisis hasil uji coba. Persiapan data BPJS dilakukan dengan pembersihan data, seleksi data kunjungan, seleksi pasien, dan pembentukan tabel komorbiditas pasien. Dilanjutkan dengan pembentukan jejaring pasien, dimulai dari pemilihan pasien sebagai node jejaring pasien, lalu membentuk graf antar pasien dan komorbiditas, iwaya node pasien akan terhubung ke node komorbiditas, jika pasien memiliki iwayat penyakit yang masuk ke dalam komorbiditas tersebut. Dari graf pasien-komorbiditas ini, dilakukan proyeksi graf ke sisi pasien, untuk membentuk jejaring pasien. Node pada jejaring pasien merepresentasikan pasien dan edge antar pasien akan terbentuk jika kedua pasien memiliki kesamaan komorbiditas. Pembobotan edge pada jejaring pasien dapat dilakukan berdasarkan beberapa metode pembobotan seperti Simple Weighting, Jaccard Index, Overlap Weighting, dan tanpa bobot (unweighted). Ekstraksi fitur graf dapat dilakukan pada jejaring pasien yang dibentuk. Selain itu, juga dilakukan ekstraksi fitur pasien seperti umur dan jenis kelamin. Selanjutnya dilakukan pelatihan model klasifikasi risiko penyakit kronis dilakukan menggunakan model Naïve Bayes, Logistic Regression, SVM, Decision Tree, Random Forest, KNN, XGBoost, dan LightGBM.
Skenario uji coba yang dilakukan meliputi, perbandingan metode pembobotan edge dalam pembentukan jejaring pasien, perbandingan nilai threshold penghapusan edge jejaring pasien, perbandingan penggunaan fitur pasien dan fitur graf secara terpisah, dan hyperparameter tuning untuk tiga model dengan nilai Sensitivity tertinggi. Berdasarkan hasil pengujian, model klasifikasi risiko penyakit paru kronis terbaik adalah LightGBM, dengan sensitivity sebesar 1,0 dan specificity sebesar 0,453. Hasil didapat menggunakan metode pembobotan Overlap Weighting dan threshold penghapusan edge sebesar 25%, dan hanya menggunakan fitur graf.

=================================================================================================
Chronic diseases are one of the leading causes of death in Indonesia. Chronic diseases can be caused by several risk factors such as genetic, physiological, environmental, and lifestyle. Chronic disease risk prediction can be done using patient’s medical record from BPJS. This medical record contains data such as the patient’s medical history. Patients who have a similar disease history can be said to have a latent relationship such as a similar lifestyle or other risk factors. This latent relationship between patients can be important information for chronic disease risk classification. One approach to obtain this latent information is to form a patient network based on similarity of their disease history. This study explores the use of patient network analysis formed from BPJS data to develop a chronic disease risk classification model. Chronic pulmonary disease is chosen as the chronic disease to be predicted in this study.
The methodology involved several stages that include BPJS data preparation, patient network formation, patient and network feature extraction, chronic disease risk classification model development, and evaluation and analysis of experimental results. BPJS data preparation is performed by data cleaning, selection of visitation data, patient selection, and formation of patient comorbidity table. The next step is the formation of patient network, by selecting patients as node in graph, followed by the formation of graphs between patients and comorbidities, where patient nodes will be connected to comorbidity nodes, if the patient has a history of diseases that are included in the comorbidity. From this patient-comorbidities graph, a projection of the graph onto the patient's side is performed to form the patient network. The nodes in this graph represent patients and edges between patients will be formed if they share a common disease. The edge weights are calculated based on weighting methods such as simple weighting, Jaccard index, overlap weighting, and unweighted. Graph feature extraction can be performed from the patient network to train the model. In addition, patient features such as age and gender are also extracted. The chronic disease risk classification is performed using Naïve Bayes, Logistic Regression, Support Vector Machine, Decision Tree, Random Forest, K-Nearest Neighbor, XGBoost, and LightGBM.
The experimental scenarios conducted include comparison of edge weighting methods to form patient network, comparison of edge removal threshold values in patient network, comparison of using patient features and graph features separately, and hyperparameter tuning for three models with highest sensitivity value. Based on the test results, the best chronic pulmonary disease risk classification model was obtained using LightGBM model. This model has sensitivity value of 1 and specificity of 0,453. This result was obtained by using Overlap Weighting method, with and edge removal threshold of 25%, using only graph features.

Item Type: Thesis (Other)
Uncontrolled Keywords: Penyakit Kronis, Data BPJS, Analisis Jejaring Pasien, Klasifikasi Risiko Penyakit Kronis. Chronic Disease, BPJS Data, Patient Network Analysis, Chronic Disease Risk Classification.
Subjects: R Medicine > R Medicine (General)
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Putu Ravindra Wiguna
Date Deposited: 01 Aug 2024 05:52
Last Modified: 01 Aug 2024 05:52
URI: http://repository.its.ac.id/id/eprint/111743

Actions (login required)

View Item View Item