fdcl-data-driven-control / data-driven-control

4 stars 0 forks source link

Initial stabilising gain 이 필요없는 Tao Bian's CT VI ADP 리뷰 #14

Open JinraeKim opened 2 years ago

JinraeKim commented 2 years ago

Tao Bian 의 value iteration (VI) 기반 CT ADP 를 리뷰한다 [1, 2].

10 은 해당 논문의 구현을 다룸.

Refs

[1] T. Bian and Z.-P. Jiang, “Value Iteration, Adaptive Dynamic Programming, and Optimal Control of Nonlinear Systems,” in 2016 IEEE 55th Conference on Decision and Control (CDC), Las Vegas, NV, USA, Dec. 2016, pp. 3375–3380. doi: 10.1109/CDC.2016.7798777. [2] T. Bian and Z.-P. Jiang, “Reinforcement Learning and Adaptive Optimal Control for Continuous-Time Nonlinear Systems: A Value Iteration Approach,” IEEE Trans. Neural Netw. Learning Syst., pp. 1–10, 2021, doi: 10.1109/TNNLS.2020.3045087.

seong-hun commented 2 years ago

10 과 관련 있는 이슈인가여?

JinraeKim commented 2 years ago

10 과 관련 있는 이슈인가여?

10 은 구현, 이건 리뷰 (링크가 안 걸려있었네요 쏴리)

seong-hun commented 2 years ago

오.. 혹시 깊이 있게 들어가는 거라면 저도 발을 살짝 담궈보겠습니다.

JinraeKim commented 2 years ago

여기에 질문이나 알게된 것을 자유롭게 공유하는식으로 리뷰하면 좋을 것 같네요~

JinraeKim commented 2 years ago

최근에 Hybrid Iteration (HI) 이 제안되었는데 (Adaptive Optimal Control of Continuous-Time Linear Systems via Hybrid Iteration), 대충 훑어봤을 때는 VI -> stabilising gain 이 얻어지면 PI 로 스위칭하는 two-stage method 같네요. 참고~