Pengembangan Framework Deep Stochastic Reinforcement Learning Untuk Pengukuran Risiko Dan Strategi Perdagangan Karbon

Pradana, Yan Aditya (2026) Pengembangan Framework Deep Stochastic Reinforcement Learning Untuk Pengukuran Risiko Dan Strategi Perdagangan Karbon. Doctoral thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 7002211005-Doctoral.pdf] Text
7002211005-Doctoral.pdf - Accepted Version
Restricted to Registered users only

Download (8MB) | Request a copy

Abstract

Pasar karbon memainkan peran strategis dalam upaya mitigasi emisi gas rumah kaca, namun karakteristik pergerakan harga karbon bersifat fluktuatif menjadikan perumusan strategi perdagangan sebagai suatu tantangan. Penelitian ini mengembangkan kerangka strategi perdagangan karbon berbasis Deep Stochastic Reinforcement Learning (DSRL) yang mengintegrasikan pendekatan stokastik, pengukuran risiko dan reinforcement learning untuk mengatasi gap pemodelan yang masih terpisah. Pengukuran risiko volatilitas, kerugian dan likuiditas diformulasikan ke dalam fungsi reward sebagai penalty. Pendekatan hybrid ini diterapkan pada tiga pasar karbon (GRN, CFI2Z dan KEUA) dengan memilih agen industri dan spekulan. Pendekatan utama yang digunakan untuk memodelkan dinamika harga karbon menggunakan Geometric Brownian Motion (GBM): GBM–DQN sebagai baseline, GBM–LSTM–RSAC dengan estimasi volatilitas berbasis pembelajaran sekuensial dan GBM–GARCH–RSAC sebagai pembanding. Evaluasi risiko dilakukan dengan menggunakan sejumlah ukuran berbeda, seperti volatilitas historis dan GARCH, Value-at-Risk (VaR), Conditional Value-at-Risk (CVaR), dan rasio likuiditas Amihud yang diintegrasikan menjadi fungsi imbalan. Pendekatan ini memungkinkan agen untuk tidak hanya mengoptimalkan keuntungan tetapi juga secara aktif mengelola risiko. Hasil penelitian dan analisis menunjukkan bahwa pendekatan GBM–LSTM–RSAC menunjukkan kinerja yang paling konsisten di antara semua model yang diuji. Pendekatan ini memiliki ROI yang lebih tinggi, sharpe ratio yang lebih stabil, penurunan maksimum yang lebih rendah, dan kemampuan generalisasi yang baik, seperti yang ditunjukkan oleh hasil uji overfitting. Dari segi perilaku, pendekatan ini menghasilkan strategi perdagangan yang realistis, dengan agen industri menunjukkan kinerja yang lebih stabil daripada agen spekulatif, yang cenderung mengambil lebih banyak risiko. Secara umum, penelitian ini menunjukkan bahwa penambahan estimasi volatilitas berbasis LSTM ke dalam kerangka kerja DSRL menghasilkan keputusan yang konsisten dan efektif dalam keputusan perdagangan karbon.
==================================================================================================================================
Carbon markets play a strategic role in greenhouse gas mitigation efforts, but the volatility of carbon prices makes it challenging to formulate trading strategies. This research develops a carbon-based trading strategy framework Deep Stochastic Reinforcement Learning (DSRL) that integrates stochastic approaches, risk measurement, and reinforcement learning to address the remaining modeling gap. Volatility, loss, and liquidity risk measurements are formulated into a reward function as a penalty. This hybrid approach is applied to three carbon markets (GRN, CFI2Z, and KEUA) by selecting industry agents and speculators. The primary approach used to model carbon price dynamics uses Geometric Brownian Motion (GBM): GBM–DQN as the baseline, GBM–LSTM–RSAC with sequential learning-based volatility estimation, and GBM–GARCH–RSAC as a benchmark. Risk evaluation is performed using several measures, including historical and GARCH volatility,
Value-at-Risk (VaR), Conditional Value-at-Risk (CVaR), and the Amihud liquidity ratio, which calculates the imbalance ratio. This approach allows agents not only to optimize profits but also to actively manage risk. The research and analysis results show that the GBM–LSTM–RSAC approach demonstrates the most consistent performance among all tested models. This approach has a higher ROI, a more stable Sharpe ratio, a lower maximum decline, and good generalizability, as demonstrated by the overfitting test results. Behaviorally, this approach produces realistic trading strategies, with industrial agents exhibiting more stable performance than speculative agents, who tend to take more risks. Overall, this study shows that adding LSTMbased volatility estimation to the DSRL framework yields consistent, effective decisions in carbon trading.

Item Type: Thesis (Doctoral)
Uncontrolled Keywords: Kata kunci: Model stokastik, deep reinforcement learning, pengukuran risiko, green economy, harga karbon Keywords: Stochastic modeling, deep reinforcement learning, risk measurement, green economy, carbon prices
Subjects: Q Science
Q Science > QA Mathematics > QA274.2 Stochastic analysis
Q Science > QA Mathematics > QA336 Artificial Intelligence
Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science)
Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science)
Q Science > QA Mathematics > QA9.58 Algorithms
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Mathematics > 44002-(S3) PhD Thesis
Depositing User: Yan Aditya Pradana
Date Deposited: 11 Feb 2026 05:35
Last Modified: 11 Feb 2026 05:36
URI: http://repository.its.ac.id/id/eprint/132354

Actions (login required)

View Item View Item