Graf Semantic Relatedness untuk Segmentasi Teks Komunikasi yang Berpusat pada Pasien dalam Data Tanya-Jawab

Zhafiirah, Selomita (2024) Graf Semantic Relatedness untuk Segmentasi Teks Komunikasi yang Berpusat pada Pasien dalam Data Tanya-Jawab. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 5025201120-Undergraduate_Thesis.pdf] Text
5025201120-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only

Download (8MB) | Request a copy

Abstract

Integrasi teknologi dalam perawatan kesehatan telah memunculkan platform Online Health Consultation (OHC), seperti alodokter.com di Indonesia, yang menawarkan pasien kesempatan untuk konsultasi kesehatan secara asinkron di mana komunikasi dengan dokter terjadi secara daring melalui media berbasis teks. Platform ini menghadapi tantangan terkait data diskusi yang tidak terstruktur dan kurangnya koherensi dalam jawaban dokter. Seringkali, dokter tidak memberikan informasi yang cukup, diagnosis, atau membangun hubungan dengan pasien, yang menyebabkan komunikasi yang kurang efektif dan proses perawatan yang suboptimal. Ketidakpuasan dengan layanan OHC ini mengharuskan dokter memiliki kompetensi komunikasi yang efektif. Ada enam model fungsi Best Practice Patient-Centered Communication yang harus diterapkan oleh dokter dalam konsultasi medis. Penerapan aspek-aspek komunikasi ini sangat penting dalam OHC sebagai standar evaluasi untuk komunikasi yang efektif. Oleh karena itu, diperlukan metode untuk membagi teks dalam jawaban dokter berdasarkan koherensi dan aspek-aspek komunikasi ini. Untuk mengatasi masalah ini, penelitian ini mengusulkan algoritma Semantic Relatedness Graph untuk mengelompokkan jawaban dokter kepada pasien menggunakan ukuran kesamaan, termasuk kesamaan kosinus dan kesamaan Jaccard. Selain itu, Latent Dirichlet Allocation (LDA) diterapkan sebagai metode perbandingan untuk segmentasi teks.
Langkah-langkah yang terlibat dalam penelitian ini meliputi praproses teks, pseudo-labeling, klasifikasi, segmentasi Semantic Relatedness Graph, dan segmentasi Latent Dirichlet Allocation (LDA). Praproses teks melibatkan pemisahan teks menjadi kalimat individu, stemming, dan stopwords removal. Pseudo-labeling dilakukan dan diikuti dengan klasifikasi menggunakan model Support Vector Classification (SVC) dan Logistic Regression. Konstruksi Semantic Relatedness Graph melibatkan perhitungan ukuran kesamaan antara pasangan kalimat untuk membagi teks. Metode ini akan dibandingkan dengan LDA untuk segmentasi teks.
Hasilnya menunjukkan bahwa Logistic Regression mengungguli SVC untuk pseudo-labeling jawaban dokter, mencapai akurasi 0,902 dibandingkan dengan 0,885 untuk SVC. Untuk segmentasi Semantic Relatedness Graph, Kesamaan Kosinus terbukti lebih baik dibandingkan Kesamaan Jaccard, dengan hasil optimal pada ambang T = 0,5 dan ukuran segmen minimum n = 2. Semantic Relatedness Graph memiliki skor Kappa rata-rata 0,057 yang menunjukkan keandalan yang sedikit terhadap klaster yang dilabeli. Selain itu, segmentasi LDA memiliki skor Cohen's Kappa rata-rata 0,088, yang menunjukkan keandalan yang lebih baik dibandingkan dengan Semantic Relatedness Graph. Metode segmentasi teks ini dalam aspek komunikasi dokter-pasien dapat membantu mengevaluasi jawaban dokter dalam layanan OHC, meningkatkan proses perawatan kesehatan pasien dan meningkatkan kepuasan pasien dengan layanan OHC.

===============================================================================

The integration of technology in healthcare has led to the emergence of Online Health Consultation (OHC) platforms, such as alodokter.com in Indonesia, offering patients the opportunity for asynchronous health consultations where communication with doctors occurs online through text based media. These platforms face challenges related to unstructured discourse data and a lack of coherence in doctor’s answers. Often, doctors do not provide sufficient information, diagnoses, or build relationships with patients, leading to less effective communication and suboptimal treatment processes. This dissatisfaction with OHC services necessitates that doctors possess effective communication competence. There are six-function models of Best Practice Patient-Centered Communication should be implemented by doctors in medical consultations. The application of these communication aspects is crucial in OHC as an evaluation standard for effective communication. Therefore, a method is needed to segment text in doctors’ answers based on coherence and these communication aspects. To address these issues, this research proposes a Semantic Relatedness Algorithm to cluster doctors' answers to patients using similarity measures, including cosine similarity and Jaccard similarity. Additionally, Latent Dirichlet Allocation (LDA) is implemented as a comparison method for text segmentation.
The steps involved in this research include text preprocess, pseudo-labeling, classification, Semantic Relatedness Graph segmentation, and Latent Dirichlet Allocation (LDA) segmentation. Text preprocess involves splitting text into individual sentences, stemming, lemmatization, and stop-word removal. Pseudo-labeling is performed and followed by classification using Support Vector Classification (SVC) and Linear Regression models. Semantic Relatedness Graph construction involves calculating similarity measures between pairs of sentences to segment the text. Finally, this method is compared with LDA for text segmentation.
The results indicate that Logistic Regression outperforms SVC for pseudo-labeling doctors’ answers, achieving an accuracy of 0.902 versus 0.885 for SVC. For Semantic Relatedness Graph segmentation, Cosine Similarity proves more than Jaccard Similarity, with optimal results at a threshold of T = 0.5 and a minimum segment size of n = 2. Semantic Relatedness Graph had a mean Kappa score 0.057 it is slightly reliable towards the labelled clusters. Additionally, the LDA segmentation had a mean Cohen's Kappa score of 0.088, suggesting better reliability compared to the Semantic Relatedness Graph. This text segmentation method in the aspect of doctor-patient communication can help evaluate doctor’s answers to communicate in OHC services, improving the patient's healthcare process and increasing patient satisfaction with OHC services.

Item Type: Thesis (Other)
Uncontrolled Keywords: Klasifikasi, Online Health Consultation (OHC), Patient-Centered Communication, Segmentasi Teks , Semantic Relatedness Graph, Classification, Online Health Consultation, Patient-Centered Communication, Semantic Relatedness Graph, Text Segmentation
Subjects: T Technology > T Technology (General)
T Technology > T Technology (General) > T385 Visualization--Technique
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Selomita Zhafiirah
Date Deposited: 01 Aug 2024 03:15
Last Modified: 01 Aug 2024 03:15
URI: http://repository.its.ac.id/id/eprint/111467

Actions (login required)

View Item View Item