RL Updates - Githubissues

MKorablyov / LambdaZero

4 stars 0 forks source link

RL Updates #129

Closed MJ10 closed 3 years ago

MJ10 commented 4 years ago

This PR adds quite a lot of RL based experiments. #107 was merged into this branch, so please merge that PR before merging this.

Overview of changes:

Improve Persistent Buffer: Add support for similarity threshold, Random Episode Restarts, and support for graph-based env
Random Network Distillation: Add implementation of RND on the graph-based environment
PPO Additional Experiments: Added configuration for entropy regularization and environment parameters.
AlphaZero: Update AlphaZero implementation and add support for policy optimization based improvements.