Why acktr algorithm cannot be used in Mujoco settings?

ikostrikov / pytorch-a2c-ppo-acktr-gail

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) and Generative Adversarial Imitation Learning (GAIL).

MIT License

3.57k stars 829 forks source link

Why acktr algorithm cannot be used in Mujoco settings? #275

Open ChenDRAG opened 3 years ago