Closed ParadoxZW closed 1 year ago
video在更新文件夹中。
上一次提交发现在gif中,火箭并没有竖直落地。经检查发现是训练不充分导致(训练过程中某一次return超过了提前停止训练的阈值,导致训练还不到一半就中断了)
load上一次训练的ckpt之后继续训练,得到了更好的模型。在deploy中成功竖直落地(gif文件已更新)。
另外发现使用PPOF的deploy接口load eval.pth.tar之前需要
agent.policy.enable_mode.remove('learn')
Q3正在训练中,训练完会上传log和视频