Closed liuqi8827 closed 2 months ago
这不是模型没读入成功吗
感谢回复
我要做SFT,所以把代码改成如下图所示,代码可以正常运行
但是一直会报OutOfMemoryError: CUDA out of memory.的错误
计算资源如下图,运行时已经设置为--nproc_per_node=8:
使用的是官方代码和官方给的数据集
sft.yaml配置如下:
ds_zero_2.json配置如下:
ds_zero_3.json配置如下:
无论使用ds_zero_2.json还是ds_zero_3.json,dou都会报OutOfMemoryError: CUDA out of memory.的错误
已经解决
System Info / 系統信息
ubuntu
Who can help? / 谁可以帮助到您?
@Btlmd
Information / 问题信息
Reproduction / 复现过程
Expected behavior / 期待表现
正常训练