Segmentasi Teks Pada Data Konsultasi Kesehatan Berdasarkan Faktor Fungsi Wawancara Medis

Suirta, I Kadek Ricky (2023) Segmentasi Teks Pada Data Konsultasi Kesehatan Berdasarkan Faktor Fungsi Wawancara Medis. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111840000146-Undergraduate_Thesis.pdf] Text
05111840000146-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 September 2025.

Download (2MB) | Request a copy

Abstract

Konsultasi kesehatan online semakin banyak digunakan terlebih selama masa pandemi COVID19. Proses tanya jawab yang menjadi bagian dari interview dokter dan pasien sebelum dilakukan diagnosis penyakit dimungkinkan tidak terjadi timbal balik pada media online tersebut. Masyarakat pada umumnya akan menuliskan lebih dari satu pertanyaan kepada dokter terkait satu kategori penyakit secara luas pada aplikasi alodokter. Redaksi kalimat pada teks tersebut sering tidak terstruktur dan bercampur antara pertanyaan serta pernyataan. Banyaknya jumlah penanya dengan pertanyaan yang mungkin masih memiliki kemiripan membuat data konsultasi kesehatan terlihat tidak tertata dengan rapi. Pada Tugas Akhir ini akan dilakukan tahapan menggunakan pendekatan Segmentasi Teks yang dapat membantu pengguna atau pengunjung media konsultasi kesehatan online tersebut dalam mencari data pertanyaan terdahulu. Selanjutnya akan dilakukan beberapa perbandingan metode klasifikasi seperti k-Nearest Neighbor (k-NN), Support Vector Machine (SVM), dan Random Forest terhadap hasil pelabelan dari Segmentasi Teks. Dan selanjutnya melakukan perubahan nilai hyperparameter tuning pada setiap metode klasifikasi. Dari sistem yang sudah dibuat, didapatkan bahwa metode klasifikasi Random Forest secara default memiliki performa yang lebih baik, yaitu dengan accuracy 81%. Setelah melakukan Hyperparameter Tuning metode klasifikasi Random Forest masih memiliki accuracy yang lebih baik, yaitu diangka 83%. Dari hasil ini didapatkan bahwa Hyperparameter Tuning berperan penting dalam mengoptimalkan accuracy
=====================================================================================================================================
Online health consultations are increasingly being used, especially during the COVID19 pandemic. The question and answer process which is part of the doctor and patient interview before a disease diagnosis is made, it is possible that there will be no reciprocity in the online media. The general public will generally write more than one question to a doctor regarding one broad category of disease in the alodoctor application. Sentences in the text are often unstructured and mixed up between questions and statements. The large number of questioners with questions that may still have similarities makes the health consultation data look unorganized. In this Final Project, the steps will be carried out using the Text Segmentation approach which can help users or visitors to the online health consultation media in finding previous question data. Next, several comparisons of classification methods such as k-Nearest Neighbor (k-NN), Support Vector Machine (SVM), and Random Forest will be carried out against the labeling results from Text Segmentation. And then make changes to the hyperparameter tuning values for each classification method. From the system that has been created, it is found that the Random Forest classification method by default has better performance, with an accuracy of 81%. After doing Hyperparameter Tuning, the Random Forest classification method still has better accuracy, which is 83%. From these results it is found that Hyperparameter Tuning plays an important role in optimizing accuracy.

Item Type: Thesis (Other)
Uncontrolled Keywords: Klasifikasi , Konsultasi Kesehatan, Segmentasi Teks; Classification, Health Consulting, Text Segmentation
Subjects: Q Science > Q Science (General) > Q325.5 Machine learning. Support vector machines.
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: I Kadek Ricky Suirta
Date Deposited: 03 Aug 2023 14:39
Last Modified: 29 Aug 2023 07:33
URI: http://repository.its.ac.id/id/eprint/103476

Actions (login required)

View Item View Item