megvii-research / MOTRv2

[CVPR2023] MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object Detectors
Other
343 stars 44 forks source link

您好,我无法在12g显存的2080ti上训练,只能在v100或3090上训练 #22

Closed hanzifan closed 1 year ago

hanzifan commented 1 year ago

问题如题目

微信图片_20230116214937
hanzifan commented 1 year ago
微信图片_20230116215027
zyayoung commented 1 year ago

从log上看,在ddp初始化阶段就出错了,可能不是显存不够的问题? 这组卡其他ddp代码是可以跑的吗?

hanzifan commented 1 year ago

其他的ddp可以跑,可能是显存不够。我在v100上使用checkpoint运行,显存占用达到了16g。但我这个2080ti卡只有12g显存。