open-mmlab / mmsegmentation

OpenMMLab Semantic Segmentation Toolbox and Benchmark.
https://mmsegmentation.readthedocs.io/en/main/
Apache License 2.0
8.03k stars 2.58k forks source link

分布式训练 #3607

Open 1687412531 opened 6 months ago

1687412531 commented 6 months ago

您好,我在使用分布式训练的时候,并没有加快训练的速度,跟单卡训练的时间一样,请问是什么原因导致的,非常感谢,期待您的回复。

Shen001 commented 6 months ago

明明是更慢~

Albertwindows commented 5 months ago

所以怎么办,同样遇到此问题?8块3090速度变得更慢了,要上nvlink吗? So what should I do if I also encounter this problem? The speed of 8 RTX3090 is slower than single RTX3090. Do I need to use nvlink?

1687412531 commented 5 months ago

当然,有nvlink自然是好的,但是这个成本很高,后来我换了lightning框架了。

Shen001 commented 3 months ago

当然,有nvlink自然是好的,但是这个成本很高,后来我换了lightning框架了。

正解!~