Open ybdesire opened 8 months ago
(1)可以先训练一个2000的,设置 --max_steps 2000 \ --save_steps 2000 (2)然后在上面继续训练,设置 --max_steps 3000 \ --save_steps 5
(1)可以先训练一个2000的,设置 --max_steps 2000 --save_steps 2000 (2)然后在上面继续训练,设置 --max_steps 3000 --save_steps 5
感谢回复,这也是个思路。 请问有没有能直接一次训练就能做到的方法?因为有些平台上提交训练没法中断后再接着训练这样操作
(1)可以先训练一个2000的,设置 --max_steps 2000 --save_steps 2000 (2)然后在上面继续训练,设置 --max_steps 3000 --save_steps 5
感谢回复,这也是个思路。 请问有没有能直接一次训练就能做到的方法?因为有些平台上提交训练没法中断后再接着训练这样操作
这个我就不太知道了,抱歉
Is there an existing issue for this?
Current Behavior
比如,微调模型的配置如下
这样保存的checkpoint就会从5, 10, 15, 20, ..., 3000。这样就保存太多checkpoint了。
我想跳过step小于2000的部分,就是只保存checkpoint从 2000, 2005, 2010, ..., 3000。请问应该如何配置呢?
Expected Behavior
No response
Steps To Reproduce
Environment
Anything else?
No response