Open J-like opened 3 months ago
你好,这次的预训练权重是在单卡的4090上训练的~
请问如何进行双GPU训练?使用DataParallel时会出现权重不在同一设备的错误。
请问您的问题解决了吗,我也尝试了采用双GPU训练,但是遇到了一些问题,请问可以请教一下您吗
你好,这次的预训练权重是在单卡的4090上训练的~
最新的论文上不是说是在4张4090显卡上训练的吗?请问是哪个型号的模型用到了多卡训练?
你好,训练的是最小的型号,MedMamba-T用单张4090刚好, S和B型号需要多卡~
请问如何进行双GPU训练?使用DataParallel时会出现权重不在同一设备的错误。