Open YunxinLi opened 7 months ago
MOE 模型的MLP parallel 是基于deepspeed 怎么实现的呢?
是使用自研框架实现的,我们也在vllm中实现了并行推理的代码
MOE 模型的MLP parallel 是基于deepspeed 怎么实现的呢?