evolveDB / tuning-survey

17 stars 9 forks source link

请问ddpg如何做预测? #1

Open m729448362 opened 1 year ago

m729448362 commented 1 year ago

根据save_epoch_interval的epoch间隔保存模型,是根据日志reward最大的epoch来选择已保存的模型来预测吗?

zhouxh19 commented 1 year ago

感谢指出! 目前我们保存的是最后一轮更新的actor、critic模型,更合理的方式是“根据日志reward最大的epoch”进行模型checkpoint,麻烦@momo1578改下吧