Graph-Based Online Conformance Checking Menggunakan Multi-Perspektif Untuk Deteksi Anomali Pada Proses Bisnis

Waspada, Indra (2023) Graph-Based Online Conformance Checking Menggunakan Multi-Perspektif Untuk Deteksi Anomali Pada Proses Bisnis. Doctoral thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111960010001-Dissertation.pdf] Text
05111960010001-Dissertation.pdf - Accepted Version
Restricted to Repository staff only until 1 September 2025.

Download (19MB) | Request a copy

Abstract

Pada awal perkembangannya process mining berorientasi pada penggalian data event log dalam lingkungan offline. Demikian pula teknik Conformance Checking hanya dapat bekerja di lingkungan offline. Dengan begitu, meskipun teknik Conformance Checking dapat mendeteksi anomali dengan tepat dan akurat namun hanya dapat mendeteksinya setelah kejadian tersebut berakhir sehingga pada banyak kasus sudah sangat terlambat. Sedangkan saat ini dibutuhkan metode process mining secara realtime untuk mendapatkan hasil yang relevan. Permasalahan ini menjadi dasar berkembangnya penelitian online Conformance Checking . State-of-the-art dari online Conformance Checking adalah Prefix-Alignment (PA). Teknik ini memiliki beberapa kelemahan antara lain: memerlukan komputasi yang tinggi dan kompleks, me-maintain semua case aktif dalam memori, dan hanya menggunakan perspektif tunggal. PA membutuhkah informasi terminasi case untuk melepas administrasi case dari memori, namun event-stream yang datang di masa depan tidak dapat dipastikan. Dengan begitu, pada dasarnya PA terpaksa tetap mempertahankan administrasi case dalam memori yang berdampak melebihi kemampuan kapasitasnya. Penelitian ini mengusulkan graph-based token replay (GO-TR) yang mengadaptasikan teknik token-based replay (TBR). Pada dasarnya TBR menggunakan komputasi replay sederhana sehingga dapat dieksekusi dengan cepat. GO-TR me-maintain case dalam representasi replay image (RI) di basis data graf, yaitu Neo4J, sehingga tidak membebani memori terkait administrasi replay tiap case. Dengan RI maka GO-TR juga tidak membutuhkan informasi terminasi case karena semua case dapat dipandang aktif. Selain itu, basis data graf yang digunakan mendukung beberapa fitur penting antara lain penyimpanan data graf secara native, penelusuran node dengan kompleksitas waktu konstan, dan dukungan eskalasi secara horizontal. Penelitian ini juga mengembangkan GO-TR dengan multiperspektif yaitu perspektif control-flow, resources/organisasi, dan data/fungsi. Online conformance checking membutuhkan dua jenis masukan yaitu model proses referensi dan event stream. Penemuan model proses dari histori event log organisasi membantu analis proses bisnis untuk memvalidasi model proses referensi yang digunakan. Oleh karena itu penelitian ini juga mengembangkan metode Graph-based Process Discovery Plus Plus (GPD++) yang mendukung penemuan model proses berbasis cypher. GPD++ mengenali pola struktur kompleks dengan memanfaatkan representasi graf dari model trace dan model directly follows graph (DFG). Pada awal perkembangannya process mining berorientasi pada penggalian data event log dalam lingkungan offline. Demikian pula teknik Conformance Checking hanya dapat bekerja di lingkungan offline. Dengan begitu, meskipun teknik Conformance Checking dapat mendeteksi anomali dengan tepat dan akurat namun hanya dapat mendeteksinya setelah kejadian tersebut berakhir sehingga pada banyak kasus sudah sangat terlambat. Sedangkan saat ini dibutuhkan metode process mining secara realtime untuk mendapatkan hasil yang relevan. Permasalahan ini menjadi dasar berkembangnya penelitian online Conformance Checking . State-of-the-art dari online Conformance Checking adalah Prefix-Alignment (PA). Teknik ini memiliki beberapa kelemahan antara lain: memerlukan komputasi yang tinggi dan kompleks, me-maintain semua case aktif dalam memori, dan hanya menggunakan perspektif tunggal. PA membutuhkah informasi terminasi case untuk melepas administrasi case dari memori, namun event-stream yang datang di masa depan tidak dapat dipastikan. Dengan begitu, pada dasarnya PA terpaksa tetap mempertahankan administrasi case dalam memori yang berdampak melebihi kemampuan kapasitasnya. Penelitian ini mengusulkan graph-based token replay (GO-TR) yang mengadaptasikan teknik token-based replay (TBR). Pada dasarnya TBR menggunakan komputasi replay sederhana sehingga dapat dieksekusi dengan cepat. GO-TR me-maintain case dalam representasi replay image (RI) di basis data graf, yaitu Neo4J, sehingga tidak membebani memori terkait administrasi replay tiap case. Dengan RI maka GO-TR juga tidak membutuhkan informasi terminasi case karena semua case dapat dipandang aktif. Selain itu, basis data graf yang digunakan mendukung beberapa fitur penting antara lain penyimpanan data graf secara native, penelusuran node dengan kompleksitas waktu konstan, dan dukungan eskalasi secara horizontal. Penelitian ini juga mengembangkan GO-TR dengan multiperspektif yaitu perspektif control-flow, resources/organisasi, dan data/fungsi. Online conformance checking membutuhkan dua jenis masukan yaitu model proses referensi dan event stream. Penemuan model proses dari histori event log organisasi membantu analis proses bisnis untuk memvalidasi model proses referensi yang digunakan. Oleh karena itu penelitian ini juga mengembangkan metode Graph-based Process Discovery Plus Plus (GPD++) yang mendukung penemuan model proses berbasis cypher. GPD++ mengenali pola struktur kompleks dengan memanfaatkan representasi graf dari model trace dan model directly follows graph (DFG). Kontribusi keilmuan yang diusulkan dalam penelitian ini antara lain: (1) mengusulkan perbaikan metode penemuan model proses bisnis berbasis graf, (2) mengadaptasikan Token-based replay pada basis data graf yang dapat menerima data event stream untuk online Conformance Checking, (3) mengusulkan analisis multi-perspektif berbasis graf untuk deteksi anomali yang lebih komprehensif. Hasil percobaan dalam penemuan model proses menunjukkan bahwa GPD++ dapat membangun model proses dari event log dengan kualitas fitness dan precision lebih baik dibanding metode state of the art. Hasil percobaan online conformance checking menunjukkan GO-TR berhasil mengadaptasi TBR sekaligus mengatasi masalah Token salah tempat pada TBR konvensional. GO-TR mengungguli PA dalam tiga hal: (1) menghasilkan throughput replay yang lebih tinggi, (2) tidak terkendala batasan memori, dan (3) dapat mendeteksi anomali secara komprehensif melalui multiperspektif
===================================================================================================================================
At the beginning of its development, process mining was oriented towards extracting event log data in an offline environment. Likewise, the Conformance Checking technique can only work in an offline environment. That way, even though the Conformance Checking technique can detect anomalies precisely and accurately, it can only detect them after the incident has ended, so it is too late in many cases. Meanwhile, a process mining method is needed to get relevant results in real-time. This problem is the basis for developing conformance Checking online research. The state-of-the-art of online conformance checking is Prefix-Alignment (PA). This technique has several drawbacks: it requires high and complex computations, maintains all active cases in memory, and only uses a single perspective. PA needs case termination information to release case administration from memory, but future event streams are uncertain. That way, PA is basically forced to maintain case administration in memory, impacting beyond its capacity. This study proposes graph-based token replay (GO-TR), which adapts the token-based replay (TBR) technique. TBR uses simple replay computation so it can be executed quickly. GO-TR maintains cases in the representation of replay images (RI) in the graph database, namely Neo4J, so it does not burden memory related to replay administration for each case. With RI, GO-TR does not need termination case information because all cases can be considered active. In addition, the graph database supports several essential features, including graph data storage natively, node tracking with constant time complexity, and horizontal escalation support. This research also develops GO-TR with multiple perspectives: control flow, resources/organization, and data/function perspectives. Online conformance checking requires two input types: the reference process model and the event stream. Discovery of the process model from an organization's event log history helps business process analysts validate the used reference process model. Therefore this research also develops the Graph-based Process Discovery Plus Plus (GPD++) method, which supports the discovery of cypher-based process models. GPD++ recognizes complex structural patterns by utilizing the graph representation of the trace model and the directly follows graph (DFG) model. The scientific contributions proposed in this study include: (1) proposing an improvement in the method for finding graph-based business process models, (2) adapting Token-based replay to a graph database that can accept event stream data for online Conformance Checking, (3) proposing graph-based multi-perspective analysis for more comprehensive anomaly detection. The experimental results in finding process models show that GPD++ can build process models from event logs with better fitness and precision than state-of-the-art methods. The online conformance checking experiment results show that GO-TR has succeeded in adapting the TBR and overcoming the Token misplaced problem on conventional TBR. GO-TR outperforms PA in three respects: (1) it produces higher replay throughput, (2) memory limitations do not constrain it, and (3) it can comprehensively detect anomalies through multi perspectives

Item Type: Thesis (Doctoral)
Uncontrolled Keywords: process mining, process discovery, online Conformance Checking, graph database, multi-perspektif process mining, process discovery, online Conformance Checking, graph database, multi-perspektive
Subjects: H Social Sciences > HD Industries. Land use. Labor > HD58.87 Reengineering (Management) Business process
Q Science > QA Mathematics > QA76 Computer software
Q Science > QA Mathematics > QA76.76.A65 Application software. Enterprise application integration (Computer systems)
Q Science > QA Mathematics > QA76.9 Computer algorithms. Virtual Reality. Computer simulation.
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55001-(S3) PhD Thesis (Comp Science)
Depositing User: Indra Waspada
Date Deposited: 07 Aug 2023 07:24
Last Modified: 07 Aug 2023 07:24
URI: http://repository.its.ac.id/id/eprint/104144

Actions (login required)

View Item View Item