Teknik Imputasi yang Tepat untuk Missing Value pada Data Penyakit Jantung Koroner

Lastari, Dewi Ayu (2024) Teknik Imputasi yang Tepat untuk Missing Value pada Data Penyakit Jantung Koroner. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5003201004-Undergraduate_Thesis.pdf] Text
5003201004-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 October 2026.

Download (5MB) | Request a copy

Abstract

Penyakit jantung koroner (PJK) menjadi penyebab kematian utama di dunia termasuk Indonesia dengan prevalensi yang terus meningkat setiap tahun. Penelitian ini bertujuan untuk mengidentifikasi faktor risiko yang berpengaruh terhadap kejadian PJK di RSUD Haji Provinsi Jawa Timur Tahun 2023 menggunakan pendekatan regresi logistik biner. Penelitian ini juga menyoroti pentingnya penanganan missing data menggunakan metode single imputation yaitu dengan mean, median dan K-Nearest Neighbor (KNN) serta multiple imputation menggunakan Multivariate Imputation by Chained Equations (MICE). Hasil analisis menunjukkan bahwa KNN dan MICE baik digunakan untuk mengimputasi data yang hilang karena tidak banyak mengubah distribusi dari data. Hasil analisis regresi logistik biner menunjukkan bahwa imputasi median menghasilkan model logit dengan BIC terkecil dibandingkan dengan hasil regresi logistik dengan metode imputasi lainnya. Variabel yang berpengaruh signifikan terhadap PJK adalah Jenis Kelamin, Indeks Massa Tubuh (IMT), Diastolik, dan Blood Urea Nitrogen (BUN). Dengan demikian, variabel-variabel tersebut harus dicermati sehingga dapat menurunkan risiko terjadinya PJK.
========================================================================================================================
Coronary heart disease (CHD) is a leading cause of death worldwide, including in Indonesia, with an increasing prevalence each year. This study aims to identify risk factors influencing the occurrence of CHD at RSUD Haji Province of East Java in 2023 using a binary logistic regression approach. The research also highlights the importance of handling missing data using single imputation methods such as mean, median, and K-Nearest Neighbor (KNN), as well as multiple imputation using Multivariate Imputation by Chained Equations (MICE). The analysis results indicate that KNN and MICE are effective for imputing missing data because they do not significantly alter the data distribution. The binary logistic regression analysis shows that median imputation produces the logit model with the smallest BIC compared to other imputation methods. The variables that significantly influence CHD are Gender, Body Mass Index (BMI), Diastolic Blood Pressure, and Blood Urea Nitrogen (BUN). Therefore, these variables should be closely monitored to reduce the risk of CHD.

Item Type: Thesis (Other)
Uncontrolled Keywords: Faktor Risiko, Imputasi, Jantung Koroner, Logistik Biner, Missing Data, Risk Factor, Imputation, Heart Disease, Binary Logistic, Missing Data.
Subjects: H Social Sciences > HA Statistics > HA31.3 Regression. Correlation
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Dewi Ayu Lastari
Date Deposited: 08 Aug 2024 13:26
Last Modified: 08 Aug 2024 13:26
URI: http://repository.its.ac.id/id/eprint/114736

Actions (login required)

View Item View Item