Yulvida, Donata (2025) Optimasi Model Adaptive Boosting untuk Prediksi Kanker Payudara dengan Menggunakan Teknik Reduksi Fitur Principal Component Analysis dan Random Oversampling. Masters thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
6025231042-Master_Thesis.pdf - Accepted Version Restricted to Repository staff only until 1 April 2027. Download (3MB) | Request a copy |
Abstract
Kanker payudara merupakan salah satu jenis kanker paling mum di kalangan wanita dan menjadi penyebab utama kematian terkait kanker, meskipun telah terjadi kemajuan signifikan dalam diagnosis dini. Faktor risiko utama kanker payudara meliputi obesitas, kurangnya aktivitas fisik, konsumsi alkohol, penggunaan terapi hormon saat menopause, paparan radiasi, dan riwayat keluarga. Deteksi dini kanker payudara memiliki signifikansi yang besar dalam bidang medis. Meskipun demikian, penggunaan machine learning untuk meramalkan penyakit ini masih menghadapi berbagai tantangan. Terdapat ketidakseimbangan kelas dalam dataset, yang dapat mengganggu kinerja model secara signifikan. Selain itu, kurangnya analisis fitur yang mendalam pada dataset yang digunakan juga menjadi tantangan tersendiri dalam meningkatkan akurasi prediksi. Oleh karena itu, diperlukan pengembangan metode yang lebih efektif dan cermat untuk memastikan hasil prediksi kanker payudara yang optimal. Penelitian ini menggunakan dataset kanker payudara dengan 569 data dan 32 atribut, termasuk satu atribut sebagai kelas. Model klasifikasi Adaptive Boosting dikembangkan untuk memprediksi kanker payudara dengan mempertimbangkan fitur-fitur relevan melalui teknik Principal Component Analysis (PCA) dan optimasi parameter menggunakan GridSearchCV. Penelitian ini juga mengevaluasi kinerja teknik Random Oversampling (ROS) untuk mengatasi ketidakseimbangan kelas dalam dataset. Hasil penelitian menunjukkan bahwa Optimasi model AdaBoost, dengan reduksi dimensi melalui PCA dan penyeimbangan data menggunakan ROS, berhasil mencapai akurasi tertinggi sebesar 98,24% dalam mengidentifikasi dan mengklasifikasikan kasus kanker payudara. Penelitian ini membuktikan bahwa penerapan metode tersebut mendukung deteksi dini kanker payudara dan memberikan kontribusi signifikan dalam pengambilan keputusan klinis.
===================================================================================================================================
Breast cancer is one of the most common types of cancer among women and a leading cause of cancer-related mortality, despite significant advances in early diagnosis. Major risk factors for breast cancer include obesity, physical inactivity, alcohol consumption, hormone therapy during menopause, radiation exposure, and family history. Early detection of breast cancer holds substantial importance in the medical field. However, applying machine learning to predict this disease still faces various challenges. One key issue is the class imbalance in datasets, which can significantly affect model performance. Additionally, the lack of in-depth feature analysis in the utilized datasets presents another challenge in improving prediction accuracy. Therefore, the development of more effective and precise methods is necessary to ensure optimal breast cancer prediction results. This study utilizes a breast cancer dataset comprising 569 instances and 32 attributes, including one attribute representing the class label. An Adaptive Boosting classification model was developed to predict breast cancer, focusing on relevant features through Principal Component Analysis (PCA) and parameter optimization using GridSearchCV. The study also evaluates the performance of the Random oversampling technique to address the class imbalance issue in the dataset. The research findings indicate that the optimization of the AdaBoost model, with dimensionality reduction through PCA and data balancing using ROS, achieved the highest accuracy of 98.24% in identifying and classifying breast cancer cases. This study demonstrates that the application of these methods supports early detection of breast cancer and provides significant contributions to clinical decision-making.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | Adaptive Boosting, GridSearchCV, Kanker payudara, Machine learning , Principal Component Analysis, Random Oversampling, Adaptive Boosting, GridSearchCV, Breast Cancer, Machine learning, Principal Component Analysis, Random Oversampling |
Subjects: | T Technology > T Technology (General) > T57.5 Data Processing |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55101-(S2) Master Thesis |
Depositing User: | Donata Yulvida |
Date Deposited: | 06 Feb 2025 07:02 |
Last Modified: | 06 Feb 2025 07:02 |
URI: | http://repository.its.ac.id/id/eprint/118419 |
Actions (login required)
![]() |
View Item |