Hermawan, Daniel (2026) Analisis Perbandingan Kinerja Deteksi Dan Pengenalan Dokumen Scan Menggunakan Model OCR Open-Source. Other thesis, Institut Teknologi Sepuluh Nopember.
This is the latest version of this item.
|
Text
5025201087-Undergraduate_Thesis.pdf - Accepted Version Download (9MB) |
Abstract
Akurasi Optical Character Recognition (OCR) merupakan komponen penting dalam digitalisasi dokumen akademik, namun kemampuannya seringkali menurun jauh saat berhadapan dengan dokumen scan yang memiliki noise. Penelitian ini mencoba mencari cara terbaik untuk mengatasi masalah tersebut dengan membandingkan tiga pendekatan utama. Pertama, dilakukan pengujian kemampuan empat model OCR yang bekerja menggunakan arsitektur model masing-masing (standalone), baik untuk bagian deteksi (detektor) maupun bagian pengenalan (recognizer), untuk dijadikan sebagai acuan awal (baseline) kinerja dasar model OCR. Kedua, dilakukan pengujian dengan pendekatan OCR Hybrid di mana Hybrid memiliki arti penggabungan bagian deteksi (detektor) dari satu model dengan bagian pengenalan (recognizer) dari model lain, untuk melihat keberhasilan untuk kombinasi ini bisa bekerja lebih baik. Ketiga, kami juga menguji sebuah langkah perbaikan gambar (pra-pemrosesan) dengan harapan untuk bisa memperbaiki dan meningkatkan kinerja OCR Hybrid yang kurang baik. Saat diuji sendiri-sendiri (standalone), tidak ada satu pun model yang sempurna karena selalu ada trade-off antara kecepatan, akurasi, dan ketahanan terhadap noise. Ketika model-model tersebut digabungkan (OCR Hybrid), hasilnya ternyata tidak bisa ditebak. Kebanyakan kombinasi justru membuat hasilnya lebih buruk, namun juga terdapat beberapa kombinasi yang kinerjanya baik. Terakhir, langkah perbaikan gambar (pra-pemrosesan) terbukti sangat berguna untuk memperbaiki kombinasi OCR Hybrid yang gagal, tetapi juga bisa merusak hasil dari pasangan model yang sudah berhasil. Penelitian ini menunjukkan bahwa tidak ada satu cara yang paling baik dan benar untuk semua kondisi.
======================================================================================================================================
The accuracy of Optical Character Recognition (OCR) is a crucial component in the digitization of academic documents, but its performance often suffers significantly when faced with noisy document scans. This study attempts to find the best way to address this issue by comparing three main approaches. First, we tested the capabilities of four OCR models working with their respective model architectures (standalone), for both the detection (detector) and recognition (recognizer) parts, to serve as a baseline for basic OCR model performance. Second, we tested a Hybrid OCR approach, where Hybrid means combining the detection (detector) part of one model with the recognition (recognizer) part of another model, to see if this combination can perform better. Third, we also tested an image enhancement step (pre-processing) in the hope of improving and enhancing the poor performance of Hybrid OCR. When tested individually (standalone), none of the models were perfect because there is always a trade-off between speed, accuracy, and resistance to noise. When these models were combined (Hybrid OCR), the results were unpredictable. While most combinations actually worsened the results, some performed well. Finally, the image enhancement (pre-processing) step proved very useful for improving failed Hybrid OCR combinations, but it could also damage the results of successful model pairs. This research shows that there is no single best approach for all situations.
| Item Type: | Thesis (Other) |
|---|---|
| Uncontrolled Keywords: | OCR, OCR Hybrid, Pra-pemrosesan Gambar, Word Error Rate (WER), Noise Dokumen, DocTR, Tesseract OCR, Paddle OCR, Easy OCR. |
| Subjects: | Q Science > QA Mathematics > QA336 Artificial Intelligence Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science) T Technology > T Technology (General) > T57.5 Data Processing |
| Divisions: | Faculty of Information and Communication Technology > Informatics > 55201-(S1) Undergraduate Thesis |
| Depositing User: | Daniel Hermawan |
| Date Deposited: | 29 Jan 2026 08:27 |
| Last Modified: | 29 Jan 2026 08:27 |
| URI: | http://repository.its.ac.id/id/eprint/131172 |
Available Versions of this Item
-
Analisis Perbandingan Kinerja Deteksi Dan Pengenalan Dokumen Scan Menggunakan Model OCR Open-Source. (deposited 29 Jan 2026 04:34)
- Analisis Perbandingan Kinerja Deteksi Dan Pengenalan Dokumen Scan Menggunakan Model OCR Open-Source. (deposited 29 Jan 2026 08:27) [Currently Displayed]
Actions (login required)
![]() |
View Item |
