SeFeA-Trace: Semantic Software Traceability using Property Listing Task to Support Software Evolution

Ahmadiyah, Adhatus Solichah (2025) SeFeA-Trace: Semantic Software Traceability using Property Listing Task to Support Software Evolution. Doctoral thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 7025211016-Dissertation.pdf] Text
7025211016-Dissertation.pdf - Accepted Version
Restricted to Repository staff only

Download (9MB) | Request a copy

Abstract

Ketertelusuran perangkat lunak telah menjadi bidang penelitian penting dalam rekayasa perangkat lunak, yang didukung oleh kebutuhan untuk memastikan kualitas perangkat lunak melalui koneksi eksplisit antar artefak pengembangan. Metode ketertelusuran tradisional, termasuk teknik pengambilan informasi, sering kali menghadapi tantangan akurasi karena ketergantungannya pada kesamaan tekstual, yang mengakibatkan ketidakcocokan pasangan tautan jejak. Meskipun pendekatan pembelajaran terawasi menawarkan akurasi yang lebih baik, ketergantungannya pada kumpulan data besar yang berlabel seringkali membatasi kepraktisannya dalam skenario dunia nyata. Sebaliknya, metode pembelajaran tanpa pengawasan, terutama yang menggabungkan fitur semantik, menghadirkan solusi yang menjanjikan dengan mengatasi kendala ketersediaan data dan meningkatkan akurasi tautan jejak. Penelitian ini memperkenalkan SeFeA-Trace, sebuah pendekatan inovatif untuk ketertelusuran perangkat lunak yang mengintegrasikan informasi semantik, sintaksis, dan fisik untuk meningkatkan akurasi tautan jejak. Inti dari model ini adalah mengadaptasi Property Listing Task (PLT), yang awalnya diterapkan dalam Analisis Fitur Semantik dalam penelitian kognitif, untuk mengidentifikasi informasi semantik, struktural, dan fisik dari artefak pengembangan perangkat lunak, khususnya pernyataan persyaratan dan pengkodean. Aplikasi PLT yang baru ini memungkinkan pembuatan tautan jejak yang akurat dan dapat diterapkan pada proyek lintas domain serta mendukung evolusi perangkat lunak. Kontribusi lain dari studi ini adalah terciptanya dataset Monthes, sebuah dataset ketertelusuran ringkas yang mencerminkan perkembangan perangkat lunak modern. Pendekatan SeFeA-Trace dievaluasi secara ketat menggunakan empat dataset: Coffee Maker, MIHC, Monthes, dan MIM. Pendekatan yang diusulkan juga diuji pada proyek MITHES yang telah dikembangkan untuk menunjukkan kemampuannya dalam mendukung evolusi perangkat lunak. Presisi, recall, dan F-measure digunakan untuk mengevaluasi kinerja tautan jejak dari dataset pengujian. Hasil pembuatan tautan jejak menunjukkan bahwa SeFeA-Trace dapat menghasilkan presisi berkisar antara 0,63 hingga 0,88, recall berkisar antara 0,83 hingga 0,89, dan F1-Score berkisar antara 0,68 hingga 0,85, serta F2-Score berkisar antara 0,77 hingga 0,84. Hasil pada kumpulan data MITHES yang berkembang menunjukkan bahwa pendekatan yang diusulkan dapat digunakan untuk mengidentifikasi kasus penambahan, modifikasi, dan penghapusan dalam artefak di seluruh versi
===================================================================================================================================
Software traceability has been a pivotal area of research in software engineering, underpinned by the need to ensure software quality through explicit connections between development artifacts. Traditional traceability methods, including information retrieval techniques, frequently encounter accuracy challenges due to their reliance on textual similarity, resulting in mismatched trace link pairs. While supervised learning approaches offer improved accuracy, their dependency on large, labeled datasets often limits their practicality in real-world scenarios. In contrast, unsupervised learning methods, particularly those incorporating semantic features, present a promising solution by addressing data availability constraints and improving trace link accuracy. This research introduces the SeFeA-Trace, an innovative approach to software traceability that integrates semantic, syntactic, and physical information to enhance trace link accuracy. Central to this model is adapting the Property Listing Task (PLT), originally applied in Semantic Feature Analysis within cognitive research, to identify semantic, structural, and physical information from software development artifacts, specifically requirements statement and coding. This novel application of PLT enables accurate trace links generation applicable to cross-domain projects and supports software evolution. Other contribution of this study is the creation of the Monthes dataset, a compact traceability dataset that reflects modern software development. The SeFeA-Trace approach was rigorously evaluated using four datasets: Coffee Maker, MIHC, Monthes, and MIM. The proposed approach was also tested on evolved MITHES project to show its ability to support software evolution. Precision, recall, and F-measure were used to evaluate the performance of trace links from testing datasets. Trace links generation results show that the SeFeA-Trace could produce precision ranging from 0.63 to 0.88, recall ranging from 0.83 to 0.89, and F1-Score from 0.68 to 0.85, and F2-Score from 0.77 to 0.84. Results on evolved MITHES dataset show that the proposed approach could be used to identify addition, modification, and deletion cases in the artifacts across versions.

Item Type: Thesis (Doctoral)
Uncontrolled Keywords: links, property listing task, requirements, software evolution, software traceability, source code, traceability model.
Subjects: Q Science > QA Mathematics > QA76.758 Software engineering
Q Science > QA Mathematics > QA76.76.S64 Software maintenance.
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55001-(S3) PhD Thesis (Comp Science)
Depositing User: Adhatus Solichah Ahmadiyah
Date Deposited: 30 Jul 2025 00:51
Last Modified: 31 Jul 2025 10:28
URI: http://repository.its.ac.id/id/eprint/123321

Actions (login required)

View Item View Item