Closed jinyouzhi closed 1 year ago
- 分布式环境初始化的时候就没有初始化 mp,请问你的初始化代码是什么。
- 不会的。
- 已经支持
https://github.com/PaddlePaddle/PaddleFleetX/blob/60f9de6be49627d92d08d3085ecd1ac5c6186487/projects/ernie/auto_export_ernie_345M_mp2_npu.sh#L27 https://github.com/PaddlePaddle/PaddleFleetX/blob/60f9de6be49627d92d08d3085ecd1ac5c6186487/projects/ernie/run_inference_mp2_npu.sh#L18 感谢回复,参考这里,分别将device替换为intel_gpu。
@GuoxiaWang 您好,除了上面初始化的问题,还想请教NPU的多节点并行是否也有支持?
还没跑过多机,只跑过单机。可以试试能不能跑,如果不能跑,可以把问题抛出来。
@jinyouzhi 这里log是个bug,不用管
@jinyouzhi 这里log是个bug,不用管
与NPU表现一致?其实是MP生效了是吗?有什么快速验证的建议吗?谢谢~
@jinyouzhi 打log查看下是否有 cembedding,c* 这类op被调用即可