Open Gzq0302 opened 1 month ago
作者您好,请问在hppo的代码的第789行,为何对学习率的更新是self.lr_scheduler_actor.step(),而不是self.lr_scheduler_actor_con.step()和self.lr_scheduler_actor_dis.step()?
你的理解是对的,我应该写错了
作者您好,请问在hppo的代码的第789行,为何对学习率的更新是self.lr_scheduler_actor.step(),而不是self.lr_scheduler_actor_con.step()和self.lr_scheduler_actor_dis.step()?