PPO implementation - Githubissues

deepmuseum / Algorithms-for-Reinforcement-Learning

Implementations of some popular RL algorithms

0 stars 0 forks source link

PPO implementation #1

Open SofianChay opened 3 years ago

SofianChay commented 3 years ago

https://openai.com/blog/openai-baselines-ppo/
https://medium.com/intro-to-artificial-intelligence/proximal-policy-optimization-ppo-a-policy-based-reinforcement-learning-algorithm-3cf126a7562d
https://arxiv.org/abs/1707.06347 (original paper)
[x] should be adapted to both one-player and multi-player training (see dqn for an example)

SofianChay commented 3 years ago

https://github.com/deepmuseum/Algorithms-for-Reinforcement-Learning/commit/3c0272497d1193700c0129a6444df2fb3d667b4e