PaddlePaddle / Paddle

PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署)
http://www.paddlepaddle.org/
Apache License 2.0
22.3k stars 5.62k forks source link

有使用Volcano提交多机多卡的yaml例子么? #68857

Open AUP0 opened 1 month ago

AUP0 commented 1 month ago

需求描述 Feature Description

请问有使用Volcano提交多机多卡的yaml例子么?使用的是华为昇腾910B的卡

替代实现 Alternatives

No response

openvino-book commented 3 weeks ago

@AUP0 能进一步介绍你的应用背景、目标和PaddlePaddle的版本吗?

AUP0 commented 3 weeks ago

@AUP0 能进一步介绍你的应用背景、目标和PaddlePaddle的版本吗?

@YuanRisheng @openvino-book 硬件Atlas 800T A2 训练服务器 cann: 8.0.RC2.beta1 paddle: 最新dev分支,编译出来是3.0.0版本 调度器Volcano:v 1.7.0 apiVersion: batch.volcano.sh/v1alpha1 需要在昇腾的环境中提交多机多卡的任务,能否提供一个提交两机八卡的yaml例子?

YuanRisheng commented 3 weeks ago

这看起来不是paddle的问题,可以去相关社区提问一下