Closed terminator123 closed 1 year ago
大模型微调一个epoch太久了,想看下中间按step的loss和ckpt,博主知道怎么设置吗
可以设置 dl_train.size=300,会视作300个step为一个epoch,注意设置dataloader的shuffle=True
大模型微调一个epoch太久了,想看下中间按step的loss和ckpt,博主知道怎么设置吗