Open qazzombie opened 8 months ago
我在A800上,设置batchsize=1,为啥还会oom呀
同问,训练mobilellama的sft需要多大显存?
请问你解决问题了吗?
I met the same problem on a 40G A100 GPU. Waiting for feedback.
我在A800上,设置batchsize=1,为啥还会oom呀