Nawaningrum, Agnes Leonita (2024) Sistem Pendeteksi Teks dan Pengenalan Teks Portabel sebagai Alat Bantu Tunanetra. Masters thesis, Institut Teknologi Sepuluh Nopember.
Text
6022221042-Master_Thesis.pdf - Accepted Version Restricted to Repository staff only until 1 October 2026. Download (5MB) | Request a copy |
Abstract
Penelitian ini bertujuan untuk mengembangkan sistem pendeteksi dan pengenalan teks untuk membantu individu tunanetra dalam mendapatkan informasi penting melalui kamera pada sistem. Kemudian sistem akan menginformasikan teks melalui suara yang dikirim ke penyandang tunanetra. Tujuan utama dari proyek ini adalah untuk memungkinkan individu tunanetra berinteraksi lebih efektif dengan lingkungan mereka dengan mengakses informasi tekstual secara mandiri. Dalam hal ini citra teks yang akan dikenali misalnya berupa teks pada papan petunjuk/pengumuman, teks pada rambu, dan juga teks yang tertera pada label kemasan makanan-minuman maupun obat.
Sistem ini menggunakan algoritma deteksi objek/teks YOLOv8, yang mencapai akurasi 0,66, presisi 0,75, recall 0,85, dan F-1 score sebesar 0,80 untuk deteksi teks, yang dipadukan dengan Optical Character Recognition (OCR) untuk mengonversi teks ke format yang dapat dibaca mesin. Selanjutnya, teks diubah menjadi suara menggunakan perangkat lunak eSpeak, memberikan keluaran audio bagi pengguna dengan waktu pemrosesan rata-rata 7.271 ms. Sistem pada penelitian ini dikembangkan dengan menggunakan Raspberry Pi 4, yang kemudian dikemas secara portabel dengan catu daya dari power bank. Selain itu, penelitian ini juga melibatkan uji penerimaan pengguna dengan lima peserta tunanetra untuk menilai kegunaan sistem. Umpan balik dari peserta sangat positif, menyoroti efektivitas sistem dalam memfasilitasi akses ke konten berbasis teks.
===================================================================================================================================
This research aims to develop a text detection and recognition system to assist visually impaired individuals in obtaining important information through a camera-based system. The system will then inform the text via voice to the visually impaired user. The primary goal of this project is to enable visually impaired individuals to interact more effectively with their environment by accessing textual information independently. The types of text images to be recognized include text on signage/announcements, text on signs, and text on food-beverage or medicine packaging labels.
The system uses the YOLOv8 object/text detection algorithm, which achieves an accuracy of 0,66, precision of 0,75, recall of 0,85, and an F1-score of 0,80 for text detection, combined with Optical Character Recognition (OCR) to convert text to machine-readable format. Subsequently, the text is transformed into speech using eSpeak software, providing audio output for users with an average processing time of 7.271 ms. The system in this research is developed using a Raspberry Pi 4, which is then packaged portably with power supplied by a power bank. Additionally, this study involves a user acceptance test with five visually impaired participants to assess the system’s usability. Feedback from the participants has been overwhelmingly positive, highlighting the system’s effectiveness in facilitating access to text-based content.
Item Type: | Thesis (Masters) |
---|---|
Uncontrolled Keywords: | object detection, portable, Raspberry Pi, teknologi bantu, text recognition object detection, portable, Raspberry Pi, assistive technology, text recognition |
Subjects: | T Technology > TK Electrical engineering. Electronics Nuclear engineering > TK7888.3 Digital computers |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Electrical Engineering > 20101-(S2) Master Thesis |
Depositing User: | Agnes Leonita Nawaningrum |
Date Deposited: | 29 Jul 2024 03:44 |
Last Modified: | 29 Jul 2024 03:44 |
URI: | http://repository.its.ac.id/id/eprint/109509 |
Actions (login required)
View Item |