Open m729448362 opened 1 year ago
根据save_epoch_interval的epoch间隔保存模型,是根据日志reward最大的epoch来选择已保存的模型来预测吗?
感谢指出! 目前我们保存的是最后一轮更新的actor、critic模型,更合理的方式是“根据日志reward最大的epoch”进行模型checkpoint,麻烦@momo1578改下吧
根据save_epoch_interval的epoch间隔保存模型,是根据日志reward最大的epoch来选择已保存的模型来预测吗?