Pemodelan Multivariate Adaptive Regression Splines Random Forest Respon Biner untuk Klasifikasi Berat Badan Lahir Bayi

Satuhu, Rahmannuaji (2025) Pemodelan Multivariate Adaptive Regression Splines Random Forest Respon Biner untuk Klasifikasi Berat Badan Lahir Bayi. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5003211125-Undergraduate_Thesis.pdf] Text
5003211125-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (2MB) | Request a copy

Abstract

Kelahiran bayi dengan berat badan lahir rendah (BBLR) merupakan tantangan signifikan dalam kesehatan masyarakat, terutama di negara berkembang seperti Indonesia. Kondisi ini tidak hanya meningkatkan risiko kematian dan penyakit pada bayi baru lahir, tetapi juga berpotensi menyebabkan penyakit tidak menular di kemudian hari. Penelitian ini bertujuan untuk mengidentifikasi faktor-faktor risiko BBLR dan mengaplikasikan model klasifikasi yang akurat menggunakan metode statistik dan machine learning, seperti Multivariate Adaptive Regression Splines (MARS) Random Forest. Dengan memanfaatkan data rekam medis dari Rumah Sakit XYZ di Tulungagung, penelitian ini berfokus pada peningkatan akurasi klasifikasi risiko kesehatan maternal dan neonatal dengan variabel seperti usia ibu, jumlah kehamilan, usia kehamilan, jenis persalinan, jarak kehamilan, jenis kelamin bayi, tingkat pendidikan ibu, dan jumlah kunjungan pemeriksaan kehamilan. Melalui pendekatan berbasis data, penelitian ini berupaya untuk mengatasi tantangan dalam deteksi dan penanganan kasus berisiko tinggi, serta meningkatkan keselamatan dan kesehatan ibu serta bayi. Berdasarkan hasil analisis, ditemukan adanya ketidakseimbangan kelas dalam data yang dapat memengaruhi akurasi model klasifikasi. Pendekatan Synthethic Minority Over-sampling Technique (SMOTE) menjadi salah satu cara untuk mengatasi permasalahan ketidakseimbangan tersebut. Model terbaik yang didapatkan yaitu MARS-RF setelah dilakukan SMOTE dengan nilai Accuracy sebesar 87% dan G-mean sebesar 86%. Nilai ini menunjukkan performa model yang baik dalam mengklasifikasikan masing-masing kelas secara seimbang. Dengan variabel yang berpengaruh dalam klasifikasi kejadian BBLR adalah Usia Kehamilan (X3), Jenis Persalinan (X4), dan Usia Ibu (X1) yang termasuk dalam variabel utama. Selain itu, terdapat variabel pendukung yaitu Jumlah Kehamilan (X2), Jumlah Kunjungan (X8), Kelamin Bayi (X6), dan Jarak Kehamilan (X5). Variabel-variabel tersebut perlu mendapatkan perhatian lebih, khususnya faktor-faktor utama, agar penanganan kasus BBLR dapat dilakukan secara lebih optimal.
========================================================================================================================================
The birth of low birth weight (LBW) babies is a significant challenge in public health, especially in developing countries such as Indonesia. This condition not only increases the risk of death and disease in newborns but also has the potential to cause non-communicable diseases later in life. This study aims to identify risk factors for LBW and apply an accurate classification model using statistical and machine learning methods, such as Multivariate Adaptive Regression Splines (MARS) Random Forest. Utilising medical record data from XYZ Hospital in Tulungagung, this research focuses on improving the accuracy of maternal and neonatal health risk classification with variables such as maternal age, number of pregnancies, gestational age, type of delivery, birth spacing, infant sex, maternal education level, and number of antenatal check-up visits. Through a data-driven approach, this research seeks to address the challenges of high-risk case detection and treatment, and improve maternal and infant safety and health. Based on the analysis results, it was found that there is a class imbalance in the data that can affect the accuracy of the classification model. The Synthethic Minority Over-sampling Technique (SMOTE) approach is one way to overcome the imbalance problem. The best model obtained is MARS-RF after SMOTE with an Accuracy value of 87% and G-mean of 86%. This value shows good model performance in classifying each class equally. With variables that influence the classification of LBW incidence are Pregnancy Age (X3), Type of Delivery (X4), and Mother's Age (X1) which are included in the main variables. In addition, there are supporting variables, namely Number of Pregnancies (X2), Number of Visits (X8), Baby's Gender (X6), and Pregnancy Distance (X5). These variables need more attention, especially the main factors, so that the handling of LBW cases can be done more optimally.

Item Type: Thesis (Other)
Uncontrolled Keywords: Berat Badan Lahir Rendah, MARS, Random Forest, Klasifikasi, Low Birth Weight, MARS, Random Forest, Classification
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49201-(S1) Undergraduate Thesis
Depositing User: Rahmannuaji Satuhu
Date Deposited: 01 Aug 2025 08:45
Last Modified: 01 Aug 2025 08:45
URI: http://repository.its.ac.id/id/eprint/126114

Actions (login required)

View Item View Item