Open 154912369 opened 3 months ago
可以相对低资源的训练较大模型了,感谢大佬们
谢谢鼓励和支持哈
H100 开OPTIMIZER_OFFLOAD = auto 性能损失非常小!尤其是batch size比较大的时候!
可以相对低资源的训练较大模型了,感谢大佬们