使用PPO设计线性系统控制器 | Oliver xu's Blog

olixu / blog-comment

0 stars 0 forks source link

使用PPO设计线性系统控制器 | Oliver xu's Blog #61

Open olixu opened 4 years ago

olixu commented 4 years ago

https://blog.oliverxu.cn/2020/08/27/%E4%BD%BF%E7%94%A8PPO%E8%AE%BE%E8%AE%A1%E7%BA%BF%E6%80%A7%E7%B3%BB%E7%BB%9F%E6%8E%A7%E5%88%B6%E5%99%A8/

论文《Policy Iteration Adaptive Dynamic Programming Algorithm for Discrete-Time Nonlinear Systems》这几天读了ADP相关的几篇论文，早期08年-14年都是用Policy Iteration方法进行求解，14-18年，Policy Gradient方法多了起来。

mumuyanyan commented 3 years ago

博主，你算法的实现用的是一有的ppo吧，不是原文章的算法吧

olixu commented 3 years ago

博主，你算法的实现用的是一有的ppo吧，不是原文章的算法吧

对的啊，就是现成的PPO算法