Quickstart example doesn't work

tensorforce / tensorforce

Tensorforce: a TensorFlow library for applied reinforcement learning

Apache License 2.0

3.3k stars 530 forks source link

Closed nikoliazekter closed 7 years ago

nikoliazekter commented 7 years ago

Learning finished. Total episodes: 3000. Average reward of last 100 episodes: 17.76.

That doesn't look right.

michaelschaarschmidt commented 7 years ago

TRPO has a numerical issue that makes it crash occasionally, PPO and VPG work well. I will change quickstart to PPO for now

michaelschaarschmidt commented 7 years ago

Changed quickstart to PPO