Open lainxx opened 4 months ago
一致卡在0,但是显存利用率是满的,不知道为啥
zero3需要把model权重offload到本地,效率低(速度慢),可以先试试用7b的模型跑小样本测试下。