PaddlePaddle / PARL

A high-performance distributed training framework for Reinforcement Learning
https://parl.readthedocs.io/
Apache License 2.0
3.24k stars 819 forks source link

建议再提供一个动态调整温度系数的SAC版本 #911

Closed amocken closed 2 years ago

amocken commented 2 years ago

我看目前parl提供的SAC算法框架的温度系数是固定的,但SAC的论文提供了动态调整温度系数的方法,希望parl也提供一下动态调整温度系数的版本

TomorrowIsAnOtherDay commented 2 years ago

我们之前测试过动态调整的版本,在mujoco上还是不如手动调整的效果好,所以只开源了目前的版本。

amocken commented 2 years ago

我们之前测试过动态调整的版本,在mujoco上还是不如手动调整的效果好,所以只开源了目前的版本。

好吧