Open dragonlee258079 opened 7 months ago
你好,我用分布式训练的方式训练该模型的时候发现,进程全都占用在0卡上,其他卡没有显存占用,请问这个情况该怎么解决
具体是这种情况:
Could you please tell me if you have solved the distributed training problem?
你好,我用分布式训练的方式训练该模型的时候发现,进程全都占用在0卡上,其他卡没有显存占用,请问这个情况该怎么解决 请问这个分布式训练问题,您解决了吗
你好,我用分布式训练的方式训练该模型的时候发现,进程全都占用在0卡上,其他卡没有显存占用,请问这个情况该怎么解决