olixu / blog-comment

0 stars 0 forks source link

使用PPO设计线性系统控制器 | Oliver xu's Blog #61

Open olixu opened 4 years ago

olixu commented 4 years ago

https://blog.oliverxu.cn/2020/08/27/%E4%BD%BF%E7%94%A8PPO%E8%AE%BE%E8%AE%A1%E7%BA%BF%E6%80%A7%E7%B3%BB%E7%BB%9F%E6%8E%A7%E5%88%B6%E5%99%A8/

论文《Policy Iteration Adaptive Dynamic Programming Algorithm for Discrete-Time Nonlinear Systems》 这几天读了ADP相关的几篇论文,早期08年-14年都是用Policy Iteration方法进行求解,14-18年,Policy Gradient方法多了起来。

mumuyanyan commented 3 years ago

博主,你算法的实现用的是一有的ppo吧,不是原文章的算法吧

olixu commented 3 years ago

博主,你算法的实现用的是一有的ppo吧,不是原文章的算法吧

对的啊,就是现成的PPO算法