Rahmanti, Farah Zakiyah (2025) Klasifikasi Pose Manusia Menggunakan Convolutional Neural Network 3D Berbasis Point Cloud. Doctoral thesis, Institut Teknologi Sepuluh Nopember.
|
Text
7022221017-Doctoral.pdf - Accepted Version Restricted to Repository staff only Download (9MB) | Request a copy |
Abstract
Aplikasi visi komputer yang dikolaborasikan dengan kecerdasan buatan biasanya memanfaatkan sensor kamera untuk klasifikasi objek, mendeteksi objek, mengenali manusia, mengenali aktivitas manusia, dan lain-lain. Namun, kamera memiliki keterbatasan pada cahaya yang rendah. Penelitian ini memanfaatkan sensor LiDAR 3D untuk melakukan klasifikasi pose manusia berbasis point cloud. LiDAR 3D handal pada cahaya yang rendah serta memberikan informasi spasial, geometrik, dan temporal. Klasifikasi pose manusia dengan 3D point cloud data merupakan tugas penting dalam mengawali penelitian besar terkait dengan pengenalan aktivitas manusia. Hal ini bertujuan untuk melakukan klasifikasi pose-pose dasar manusia. Namun, pemrosesan data 3D spatio-temporal point cloud yang rumit menjadi tantangan utama pada penelitian ini. Oleh karena itu, diperlukan solusi yang tepat dan cepat dalam penanganan data 3D menggunakan pendekatan voxel serta dibutuhkan juga model deep learning yang ringan tanpa mengorbankan nilai akurasinya merupakan hal yang penting. Melalui rekonstruksi voxel terhadap setiap titik 3D yang ada pada point cloud data. kemudian merubahnya menjadi voxel biner yang digunakan untuk mengetahui dan menandai grid mana yang kosong atau tidak memiliki titik 3D point cloud. Penelitian ini bertujuan untuk melakukan klasifikasi pose manusia menggunakan Convolutional Neural Network 3D dari LiDAR point cloud. Metode ini sangat efektif untuk menganalisis data spatio-temporal dari sistem Light Detection and Ranging (LiDAR) 3D. Hasilnya adalah penelitian ini telah meraih rata-rata nilai akurasi yang sangat baik 99,25%, sehingga dapat mengenali beberapa pose manusia dengan sangat baik. Penelitian ini juga menghasilkan kumpulan data baru yang didapatkan dari LiDAR 3D dan dapat digunakan oleh masyarakat umum, pengembang, ataupun peneliti lain. Link kumpulan data LiDAR 3D pada https://data.mendeley.com/datasets/gpvrnphw66/3
===================================================================================================================================
Computer vision applications combined with artificial intelligence typically utilize camera sensors for object classification, object detection, human recognition, and human activity recognition. However, cameras have limitations in low light. This study utilizes a 3D LiDAR sensor to classify human poses based on point clouds. 3D LiDAR is reliable in low light and provides spatial, geometric, and temporal information. Human pose classification using 3D point cloud data is an important task in initiating large-scale research related to human activity recognition. This aims to classify basic human poses. However, processing complex 3D spatio-temporal point cloud data is a major challenge in this study. Therefore, an appropriate and fast solution is needed in handling 3D data using a voxel approach. A lightweight deep learning model is also needed without sacrificing accuracy. Through voxel reconstruction of each 3D point in the point cloud data, it is then converted into binary voxels which are used to identify and mark which grids are empty or do not have 3D point cloud points. This study aims to classify human poses using a 3D Convolutional Neural Network from a LiDAR point cloud. This method is very effective for analyzing spatio-temporal data from a 3D Light Detection and Ranging (LiDAR) system. The result is that this study has achieved an excellent average accuracy value of 99.25%, so it can recognize several human poses very well. This study also produces a new dataset obtained from 3D LiDAR and can be used by the general public, developers, or other researchers. The link to the 3D LiDAR dataset is at https://data.mendeley.com/datasets/gpvrnphw66/3
| Item Type: | Thesis (Doctoral) |
|---|---|
| Uncontrolled Keywords: | 3D point cloud, LiDAR, klasifikasi pose manusia, Convolutional Neural Network (CNN) 3D; 3D point cloud, LiDAR, human pose classification, Convolutional Neural Network (CNN) 3D |
| Subjects: | T Technology > T Technology (General) > T59.7 Human-machine systems. |
| Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Electrical Engineering > 20001-(S3) PhD Thesis |
| Depositing User: | Farah Zakiyah Rahmanti |
| Date Deposited: | 07 Jan 2026 07:21 |
| Last Modified: | 07 Jan 2026 07:21 |
| URI: | http://repository.its.ac.id/id/eprint/129339 |
Actions (login required)
![]() |
View Item |
