ACER impl. broken? - Githubissues

openai / baselines

OpenAI Baselines: high-quality implementations of reinforcement learning algorithms

MIT License

15.64k stars 4.86k forks source link

When I train the ACER impl., as given in the ACER section (python -m baselines.run --alg=acer --env=PongNoFrameskip-v4 --num_timesteps=10e6 --save_path=/tmp/acer-models/pong_10M_acer), then the trained model, loaded for visualization (python -m baselines.run --alg=acer --env=PongNoFrameskip-v4 --num_timesteps=0 --play --load_path=/tmp/acer-models/pong_10M_acer), does not score at all. Are there any parameters that need to be provided (apart from the default ones)? Or is ACER unsuited for pong, or even buggy?

openai / baselines

ACER impl. broken? #747