Policy Optimization Method

TMmichi / vrep_jaco

1 stars 0 forks source link

Closed TMmichi closed 2 years ago

TMmichi commented 4 years ago

Proximal Policy Optimization Algorithms - PPO (2017) https://arxiv.org/pdf/1707.06347.pdf

TMmichi commented 4 years ago

Addressing Function Approximation Error in Actor-Critic Methods - TD3 (2018) https://arxiv.org/pdf/1802.09477.pdf

TMmichi commented 4 years ago

HIGH-DIMENSIONAL CONTINUOUS CONTROL USING GENERALIZED ADVANTAGE ESTIMATION - GAE (2016) https://arxiv.org/pdf/1506.02438.pdf

TMmichi commented 4 years ago

Policy invariance under reward transformations: Theory and application to reward shaping (1999) http://luthuli.cs.uiuc.edu/~daf/courses/games/AIpapers/ng99policy.pdf