Analisis dan Prediksi Biaya Penanganan Penyakit Pasien Terdaftar BPJS Menggunakan Machine Learning

Dharmawan, Dewangga (2024) Analisis dan Prediksi Biaya Penanganan Penyakit Pasien Terdaftar BPJS Menggunakan Machine Learning. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111940000029-Undergraduate_Thesis.pdf] Text
05111940000029-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2026.

Download (2MB) | Request a copy

Abstract

BPJS Kesehatan bertanggung jawab untuk memberikan bantuan dana bagi seluruh penduduk Indonesia. Tetapi, persebaran sumber daya medis di Indonesia merupakan salah satu yang terendah dibandingkan dengan negara Asia Tenggara lainnya. Sumber daya medis juga menipis selama masa pandemi COVID-19. Salah satu cara untuk mengatasi permasalahan tersebut adalah mengalokasikan sumber daya medis, terutama waktu, bagi staf medis agar dapat menyeimbangkan keperluan dari masing-masing kunjungan pasien. Selain itu, pasien yang akan mengunjungi fasilitas kesehatan ingin mengetahui biaya yang akan mereka bayar untuk mendapatkan layanan kesehatan tersebut agar mereka dapat memiliki kepercayaan terhadap fasilitas kesehatan yang mereka kunjungi dan tidak memiliki permasalahan finansial yang ada dalam pembayaran pelayanan tersebut. Berdasarkan permasalahan tersebut, tugas akhir ini mengusulkan untuk memprediksi lama dan biaya kunjungan fasilitas kesehatan menggunakan regresi yang berguna bagi staf medis, pasien, dan pihak manapun yang memerlukan prediksi tersebut. Data yang digunakan adalah data dari BPJS dari 2015 sampai 2020 yang terdiri dari dataset peserta BPJS, dataset kunjungan FKRTL, dan dataset kunjungan FKTP non-kapitasi. Data dari BPJS dilakukan persiapan data dan pre-processing agar mendapatkan data yang lebih bersih. Data tersebut lalu dilakukan modeling dengan beberapa algoritma, yaitu Ensemble Learning (Random Forest, Gradient Boosting, XGBoost, LightGBM, dan CatBoost), regresi linear, SVR, dan Decision Tree. Masing-masing model dibandingkan untuk mencari model yang terbaik berdasarkan metrik R2, RMSE, dengan nRMSE sebagai pelengkap, dan MAPE. Dalam proses modeling, terdapat beberapa uji coba untuk meningkatkan nilai-nilai metrik dari masing-masing model yang terdiri dari normalisasi, seleksi fitur, clustering, dan tuning hyperparameter. Setelah proses uji coba, masing-masing model dipilih berdasarkan nilai-nilai metrik sebelumnya untuk menemukan model terbaik untuk memprediksi biaya dan lama kunjungan fasilitas kesehatan. Berdasarkan hasil uji coba, terdapat dua hasil yang berbeda diantara dua dataset kunjungan yang berbeda. Algoritma CatBoost menjadi algoritma yang terbaik untuk memprediksi biaya dan lama kunjungan FKRTL dengan nilai rata-rata R2 sebesar 85,93%, nilai rata-rata RMSE dan nRMSE sebesar 1,1768 dan 8,2%, dan nilai rata-rata MAPE sebesar 13,43%. Tetapi, algoritma Random Forest memiliki nilai rata-rata MAPE yang lebih rendah dengan nilai 12,79%. Dalam dataset kunjungan FKTP non-kapitasi, hanya biaya kunjungan yang diprediksi karena lama kunjungan hanya memiliki satu nilai saja, yaitu satu hari. Algoritma LightGBM menjadi algoritma terbaik untuk memprediksi biaya kunjungan FKTP non-kapitasi dengan nilai R2 sebesar 80,23% dan nilai RMSE dan nRMSE sebesar 0,6504 dan 11,02%. Tetapi, dalam proses uji coba terhadap dataset kunjungan FKTP non-kapitasi, nilai MAPE cenderung lebih besar daripada uji coba dataset kunjungan FKRTL, dengan nilai MAPE terkecil terletak pada model Decision Tree dengan nilai 69,16%. Secara keseluruhan, metode Ensemble Learning memiliki nilai metrik yang lebih tinggi. Dengan demikian, metode yang diusulkan dapat memprediksi biaya dan lama waktu kunjungan dengan performa yang cukup baik dan diharapkan bahwa tugas akhir ini dapat membantu pasien untuk mendapatkan ekspektasi biaya dan lama kunjungan ke fasilitas kesehatan dan staf untuk menentukan sumber daya medis yang digunakan.
=================================================================================================================================
Health BPJS is responsible for giving financial aid to the whole population of Indonesia. However, the spread of medical resources in Indonesia is one of the least spread compared to the rest of Southeast Asia. Medical resources become thinner during the COVID-19 pandemic. One of the ways to deal with said problem is to allocate medical resources, especially time, for the medical staff to balance the resources. Other than that, patients who visit a health facility want to know the projected price to get the health service so that they would put their trust onto the health facility they visit and not to have financial issues during the payment of the service. Based on said problem, this final project proposes to predict the price and the length of health facility services using regression that is useful for medical staff, patients, and anyone who needs it. The data that is used is the data from BPJS from 2015 to 2020 which consists of BPJS members, FKRTL visits, and non-capitation FKTP visits. The BPJS data is to be prepared and pre-processed to get clearer data. Said data is then modeled with several algorithms, that is Ensemble Learning (Random Forest, Gradient Boosting, XGBoost, LightGBM, and CatBoost), linear regression, SVR, and Decision Tree. Each model is compared to find the best model based on R2, RMSE, with nRMSE as the complement, and MAPE metrics. During the modeling process, there are several tests to increase the metric score from each model that consists of normalization, feature selection, clustering, and hyperparameter tuning. After the testing process, each model is choosed based on the metric scores before to find the best model to predict the price and the length of health facility services. Based on the testing, there are two different results between the two visits' data. CatBoost algorithm is the best algorithm to predict the price and length of FKRTL visits with an average score of R2 is 85,93%, average score of RMSE and nRMSE are 1,1768 and 8,2%, and average score of MAPE is 13,43%. However, Random Forest has the lower average MAPE score of 12,79%. On the non-capitation FKTP dataset, only the price is to be predicted because there is only one day on the length of the visit. LightGBM is the best algorithm to predict the price of non-capitation FKTP visits with the R2 score of 80,23% and RMSE and nRMSE scores of 0,6504 and 11,02%. However, during the testing process on the non-capitation FKTP visits dataset, the MAPE score has a rather higher score than the FKRTL visits, with the lowest MAPE score on the Decision Tree model with a score of 69,16%. As a whole, the Ensemble Learning method has a higher score. With that said, the method that is proposed could predict the price and the length of visits with better performance and hoped that this final project could help the patient to get the price and the length of health facility visits expectation and medical staff to manage the medical resources that is to be used.

Item Type: Thesis (Other)
Uncontrolled Keywords: BPJS Kesehatan, Prediksi Biaya, Prediksi Waktu Pelayanan, Regresi, Machine Learning, Health BPJS, Regression, Cost Prediction, Service Time Prediction
Subjects: T Technology > T Technology (General) > T174 Technological forecasting
T Technology > T Technology (General) > T57.5 Data Processing
T Technology > T Technology (General) > T57.8 Nonlinear programming. Support vector machine. Wavelets. Hidden Markov models.
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Dewangga Dharmawan
Date Deposited: 09 Feb 2024 17:52
Last Modified: 09 Feb 2024 17:52
URI: http://repository.its.ac.id/id/eprint/106620

Actions (login required)

View Item View Item