Zahroni, Muhammad Ilham (2025) Pengaturan Kecepatan Motor Pada Sistem Kendali Quadcopter Dengan Reinforcement Learning Untuk Stabilitas Dalam Kondisi Dinamis. Other thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
5009211021-Undergraduate_Thesis.pdf - Accepted Version Restricted to Repository staff only Download (3MB) | Request a copy |
Abstract
Kontrol quadcopter yang stabil dan presisi dalam kondisi dinamis merupakan tantangan utama akibat dinamikanya yang non-linear. Kontroler konvensional seringkali memiliki keterbatasan dalam menghadapi gangguan tak terduga seperti angin. Penelitian ini mengusulkan perancangan dan evaluasi sistem kontrol hibrida yang memanfaatkan kecerdasan buatan untuk meningkatkan performa navigasi quadcopter. Tujuan penelitian ini adalah menerapkan reinforcement learning (RL) dalam penentuan kecepatan motor pada sistem kontrol quadcopter untuk mencapai tujuan navigasi serta mengetahui respons dinamisnya dalam lingkungan yang dinamis. Metode yang digunakan adalah dengan mengimplementasikan arsitektur kontrol bertingkat dalam lingkungan simulasi menggunakan RL dengan algoritma Proximal Policy Optimization (PPO). Sistem ini terdiri dari outer loop untuk pelacakan posisi yang menggunakan kontroler berbasis PPO, dan inner loop untuk stabilisasi sikap yang menggunakan kontroler PID. Agen PPO dirancang dengan arsitektur Actor-Critic, di mana kedua jaringan saraf tiruannya memiliki lapisan input dengan 6 node, dua hidden layer dengan masing-masing 128 node, dan lapisan output yang disesuaikan untuk fungsi masing-masing. Untuk menguji performa sistem, dilakukan simulasi pada tiga skenario lintasan: manuver vertikal (take-off, hover, landing), lintasan persegi, dan lintasan melingkar. Hasil simulasi menunjukkan bahwa sistem kontrol yang diusulkan berhasil mengikuti semua lintasan dengan sangat baik. Analisis kuantitatif menunjukkan performa presisi tinggi, dengan nilai Root Mean Square Error (RMSE) lintasan meningkat secara wajar dari 0,0788 meter untuk lintasan vertikal, menjadi 0,1357 meter untuk lintasan persegi, dan mencapai 0,2076 meter pada lintasan melingkar yang paling dinamis. Keberhasilan ini membuktikan bahwa arsitektur hibrida RL-PID secara efektif menggabungkan kemampuan adaptif RL untuk navigasi strategis dengan keandalan PID untuk stabilisasi tingkat rendah, menghasilkan sistem kontrol yang robust dan presisi.
=====================================================================================================================================
A stable and precise quadcopter control in dynamic conditions is the main challenge due to its non-linear dynamics. Conventional controllers often have limitations in dealing with unexpected disturbances like wind. This research proposes the design and evaluation of a hybrid control system that utilizes artificial intelligence to enhance the navigation performance of a quadcopter. The aim of this research is to apply reinforcement learning (RL) in determining the motor speed in a quadcopter control system to achieve navigation goals and to understand its dynamic response in a dynamic environment. The method involves implementing cascade control architecture in a simulation environment using Reinforcement Learning (RL) with Proximal Policy Optimization (PPO) algorithm. The system consists of an outer loop for position tracking that uses a PPO based controller, and an inner loop for attitude stabilization using a PID controller. The PPO agent is designed with an Actor-Critic architecture, both its neural networks feature a 6 node input layer, two hidden layers with 128 nodes each, and output layers tailored for their respective functions. To test the system's performance, simulations were conducted on three trajectory scenarios: a vertical maneuver (take-off, hover, and landing), a square path, and a circular path. The simulation results show that the proposed control system successfully tracked all trajectories with excellent performance. Quantitative analysis demonstrates high precision performance, with the total Root Mean Square Error (RMSE) reasonably increasing from 0.0788 meters for the vertical trajectory, to 0.1357 meters for the square path, and reaching 0.2076 meters for the most dynamic circular trajectory. This success proves that the hybrid RL-PID architecture effectively combines the adaptive capabilities of RL for strategic navigation with the reliability of PID for low level stabilization, resulting in a robust and precise control system.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | proximal policy optimization, quadcopter, reinforcement learning, sistem kontrol, uji lintasan, control system, trajectory testing |
Subjects: | T Technology > TA Engineering (General). Civil engineering (General) T Technology > TL Motor vehicles. Aeronautics. Astronautics T Technology > TL Motor vehicles. Aeronautics. Astronautics > TL521.3 Automatic Control |
Divisions: | Faculty of Industrial Technology and Systems Engineering (INDSYS) > Physics Engineering > 30201-(S1) Undergraduate Thesis |
Depositing User: | Muhammad Ilham Zahroni |
Date Deposited: | 06 Aug 2025 07:20 |
Last Modified: | 06 Aug 2025 07:20 |
URI: | http://repository.its.ac.id/id/eprint/127771 |
Actions (login required)
![]() |
View Item |