Closed listwebit closed 5 months ago
pt阶段,如果基础模型比较大,32B,模型并行GPU使用效率不高,是否支持多机多卡否支持3D并行呢,需要怎么做呢,谢谢
暂不支持。
Describe the Question
pt阶段,如果基础模型比较大,32B,模型并行GPU使用效率不高,是否支持多机多卡否支持3D并行呢,需要怎么做呢,谢谢