Irvansyah, Muhammad Adhitya (2020) IMPLEMENTASI METODE REINFORCEMENT LEARNING PADA SIMULASI PERGERAKAN ROBOT MULTI-SENDI. Other thesis, Institut Teknologi Sepuluh Nopember.
Preview |
Text
05111540000143-Undergraduate_Thesis.pdf Download (1MB) | Preview |
Abstract
Reinforcement Learning (RL) merupakan salah satu cabang kecerdasan buatan yang sedang berkembang dan banyak diteliti. Perbedaan dari RL dengan cabang lain pada studi kecerdasan buatan adalah algoritma pada RL tidak belajar dari korelasi antara masukan dan keluaran yang seharusnya. Namun algoritma ini belajar dari feedback atau timbal balik yang dia dapat saat dia memberikan suatu keluaran atau aksi dari masukan yang ia terima. Dengan metode pembelajaran ini, algortima RL bisa menyelesaikan berbagai masalah yang penyelesaiannya tidak bisa diberikan langsung oleh manusia sehingga algoritma harus mencari sendiri jawaban dari permasalahannya, seperti kontrol pada robot, mengemudikan mobil, bermain gim dan sebagainya.
Pada tugas akhir ini, penulis mengimplementasikan sebuah algoritma RL menggunakan Augmented Random Search (ARS). Algoritma ARS bekerja dengan cara memberikan perubahanperubahan acak pada agen dan menggunakan perubahan yang dinilai terbaik untuk melakukan perbaruan pada agen tersebut.
Algoritma ARS diimplementasikan pada serangkaian simulasi pergerakan robot multi-sendi untuk melihat dan menguji apakah algoritma ini dapat menyelesaikan goals atau tujuan dari simulasi tersebut. Dari hasil pengujian berbagai simulasi robot multi-sendi menunjukkan bahwa algoritma ARS mampu menyelesaikan simulasi-simulasi tersebut dan bahkan memberikan performa yang menyaingi algoritma Asynchronus Actor Critic (A2C) yang memiliki sample complexity lebih besar, dengan mencapai hasil 243% lebih baik pada salah satu simulasi.
==================================================================================================================
Reinforcement Learning (RL) is one of the branches of Artificial Intelligent that are being studied and researched. The difference between RL and the other branches is how the algorithm learns to do its task. Reinforcement Learning algorithm doesn’t learn the correlation between inputs and expected output. It learns from how the feedback from the outputs that they give. The output itself come from processing the observed data or the inputs from the system.With the way RL algorithm works, it can solve the problem that a normal algorithm cannot solve due to large solution space that we humans cannot provide, such as robot control, self-driving car, playing a game, and so on.
In this undergraduate thesis, writer will implement an algorithm called Augmented Random Search (ARS) published in the paper with title “Simple Random Search Provides a Competitive Approach to Reinforcement Learning”. ARS algorithm works by giving random change in the models and see which changes gives the best result and use that change to update the model.
This algorithm will be implemented to run a series of multijointed robot movement simulation to test the ability of this algorithm to finish the task of the simulations. The result of these tests shows that ARS Algorithm can solve any type of multi-joint robot simulation and have a good performance. With an optimal parameter setting, ARS can even compete and beat the more complex RL algorithm that uses Deep Learning with more than 243% better result in one of the simulation using same amount of sample data
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | Reinforcement Learning, Random Search, Simulasi Pergerakan Robot, Augmented Random Search , Simulation |
Subjects: | Q Science > QA Mathematics > QA336 Artificial Intelligence T Technology > T Technology (General) > T57.62 Simulation |
Divisions: | Faculty of Information and Communication Technology > Informatics > 55201-(S1) Undergraduate Thesis |
Depositing User: | Muhammad Adhitya irvansyah |
Date Deposited: | 27 Aug 2020 03:07 |
Last Modified: | 02 Jan 2024 08:41 |
URI: | http://repository.its.ac.id/id/eprint/81401 |
Actions (login required)
View Item |