Open JinraeKim opened 2 years ago
10 과 관련 있는 이슈인가여?
오.. 혹시 깊이 있게 들어가는 거라면 저도 발을 살짝 담궈보겠습니다.
여기에 질문이나 알게된 것을 자유롭게 공유하는식으로 리뷰하면 좋을 것 같네요~
최근에 Hybrid Iteration (HI) 이 제안되었는데 (Adaptive Optimal Control of Continuous-Time Linear Systems via Hybrid Iteration), 대충 훑어봤을 때는 VI -> stabilising gain 이 얻어지면 PI 로 스위칭하는 two-stage method 같네요. 참고~
Tao Bian 의 value iteration (VI) 기반 CT ADP 를 리뷰한다 [1, 2].
10 은 해당 논문의 구현을 다룸.
Refs
[1] T. Bian and Z.-P. Jiang, “Value Iteration, Adaptive Dynamic Programming, and Optimal Control of Nonlinear Systems,” in 2016 IEEE 55th Conference on Decision and Control (CDC), Las Vegas, NV, USA, Dec. 2016, pp. 3375–3380. doi: 10.1109/CDC.2016.7798777. [2] T. Bian and Z.-P. Jiang, “Reinforcement Learning and Adaptive Optimal Control for Continuous-Time Nonlinear Systems: A Value Iteration Approach,” IEEE Trans. Neural Netw. Learning Syst., pp. 1–10, 2021, doi: 10.1109/TNNLS.2020.3045087.