Prediksi Diagnosa Kanker Serviks Berdasarkan Informasi Demografi, Kebiasaan, dan Rekam Medis Menggunakan Algoritma Support Vector Machine

Aminah, Siti Hawa (2018) Prediksi Diagnosa Kanker Serviks Berdasarkan Informasi Demografi, Kebiasaan, dan Rekam Medis Menggunakan Algoritma Support Vector Machine. Undergraduate thesis, Institut Teknologi Sepuluh Nopemer.

[thumbnail of 05211240000054-Non_Degree.pdf]
Preview
Text
05211240000054-Non_Degree.pdf - Accepted Version

Download (1MB) | Preview

Abstract

Penyakit kanker serviks merupakan salah satu penyakit yang dianggap sebagai penyakit paling mematikan di seluruh dunia. Menurut International Agency for Research on Cancer 2012, kanker serviks menempati peringkat ketiga pada penyakit yang sering diderita oleh wanita di seluruh dunia, dan menempati peringkat kedua di Indonesia. Menurut para ahli kanker, kanker serviks adalah salah satu jenis kanker yang paling dapat dicegah dan paling dapat disembuhkan dari semua kasus kanker. Salah satu kegiatan deteksi dini kanker serviks yang paling umum di Indonesia adalah menggunakan metode pap smear. Namun tersedianya data histori rekam medis pasien tidak disertai dengan proses ekstraksi data menjadi sebuah informasi yang dapat berguna untuk keputusan klinis.
Konsep klasifikasi merupakan bagian dari teknik data mining yang memiliki pekerjaan utama melakukan analis prediksi. Telah terdapat banyak penelitian untuk melakukan prediksi dan klasifikasi pada kasus medis, dan menghasilkan klasifikasi dengan tingkat akurasi yang cukup tinggi, dengan nilai akurasi > 80 %. Sehingga diperlukan lebih banyak penelitian untuk mendapatkan suatu model yang mampu mengklasifikasikan dengan tingkat kesalahan minimal dan model yang dihasilkan dapat digunakan untuk melakukan prediksi data berikutnya.
Penelitian ini menggunakan metode Cross Validation agar proses training lebih akurat dan menghasilkan prediksi yang lebih baik. Percobaan prediksi dilakukan dengan SVM kernel linear dan RBF. Atribut yang digunakan berjumlah 27 atribut, dengan 1 atribut target yaitu hasil tes biopsy pasien. Data yang digunakan berjumlah 668 data dan 200 data yang telah dilakukan resample data.
Hasil dari penelitian ini merupakan hasil prediksi yang dilakukan pada dataset dari pasien ‘Hospital Universitario de Caracas’ di Caracas, Venezuela, dengan menggunakan algoritma Support Vector Machine. Hasil prediksi terbaik didapatkan dengan 200 data yang telah dilakukan resample dan menggunakan SVM kernel RBF parameter C > 1, dan γ > 10. Percobaan tersebut menghasilkan nilai akurasi sebesar 92 %, precision 75 %, recall 71 %, dan f-measure 72.77 %.
========================================================================================================
Cervical cancer is one of the most chronic disease in the world. According to the Internationl Agency for Research on Cancer 2012, cervical cancer ranks third in disease that is often afflicted by women in the world, and ranks second in Indonesia. According to cancer experts, cervical cancer is one of the most preventable and most curable cancers of all cancer cases. One of the most common cervical cancer detection activities in Indonesia is the Pap Smear method. However, the availability of patient medical record history data is not accompanied by data extraction process to an information that can be useful for clinical decisions.
The concept of classification is part of the data mining technique that have the main work of doing predictive analysis. There have been many studies to make predictions and classifications in medical cases and produce a classification result with high accuracy rate, with an accuracy > 80 %. So it needs more research to get a model that is able to classify with minimal error rate and the model can be used to predict in the next data.
This research use Cross Validation method to make the training process more accurate and get better prediction result. The prediction experiments were done with SVM linear and RBF kernel. Use 27 attributes with 1 target attribute that is the result of patient’s biopsy test. Total data that used on this research is 668 data and 200 resampled data.
The result of this research are the result of prediction performed on the dataset of patient ‘Hospital Universitario de Caracas’ in Caracas, Venezuela, using Support VectorMachine algorithm. The best prediction results were obtained with 200 resampled data and using SVM RBF kernel with parameters C > 1 and γ > 10. The experiments resulted in an accuracy of 92 %, precision 75 %, recall 71 % and f-measure 72.77%.

Item Type: Thesis (Undergraduate)
Additional Information: RSSI 006.31 Nur p-1 3100018075986
Uncontrolled Keywords: Data Mining, Kanker Serviks, Penyakit, Prediksi, Support Vector Machine
Subjects: Q Science > QR Microbiology > QR 201.T84 Tumors. Cancer
T Technology > T Technology (General) > T57.5 Data Processing
T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK5105.546 Computer algorithms
Divisions: Faculty of Information and Communication Technology > Informatics > 55201-(S1) Undergraduate Thesis
Depositing User: Aminah Siti Hawa
Date Deposited: 01 Feb 2019 07:32
Last Modified: 16 Nov 2020 04:24
URI: http://repository.its.ac.id/id/eprint/53799

Actions (login required)

View Item View Item