Closed guvsta closed 2 months ago
CUDA 12.1
No response
GLM4训练过程时,进行验证速度非常慢,500个样本验证要33分钟, 训练chatGLM3时每完成一轮训练 ,几千个样本很短的时间就可以完成验证
提升验证的速度
你把combine改成true,不然每一轮对话都验证了
改成true了,测试 100个样本 ,需要7分钟 之前chatglm3几千个样本 ,十几秒就跑完了
主要两个原因:
你这是微调的训练 还是全量参数训练, 作者有公开从0开始的训练代码吗
lora微调
System Info / 系統信息
CUDA 12.1
Who can help? / 谁可以帮助到您?
No response
Information / 问题信息
Reproduction / 复现过程
GLM4训练过程时,进行验证速度非常慢,500个样本验证要33分钟, 训练chatGLM3时每完成一轮训练 ,几千个样本很短的时间就可以完成验证
Expected behavior / 期待表现
提升验证的速度