finetune_hf.py中的resume_from_checkpoint部分可能存在影响性能以及值得改进的地方

THUDM / ChatGLM3

ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

Apache License 2.0

13.51k stars 1.57k forks source link

WechatIMG80 如图： ------红色部分的代码是为了寻找最新的checkpoint的step ------绿色1是从最新的checkpoint恢复训练 ------绿色2是从指定的checkpoint恢复训练一.如果从指定的checkpoint恢复训练执行绿色2的代码，实际上却先要去执行红色部分的代码来进行循环获取最新的checkpoint的step，如果这部分的checkpoint目录很多可能会大大延长训练的时间。而红色部分的代码实际是为绿色部分1服务的二.黄色部分的代码是存在冗余，应该是可以抽取出来的

THUDM / ChatGLM3

finetune_hf.py中的resume_from_checkpoint部分可能存在影响性能以及值得改进的地方 #1272