Open ZhangX-Lab opened 1 year ago
你好,我使用了你的mobilev1-yolov4的代码进行训练,使用的kaggle的云平台的P100,发现GPU的使用率一直变化,有时能到100%,有时又是1%,总是变化不定,总体来讲GPU的使用率很低。但是之前训练过YOLOv3,没有出现这样的问题。我试着加大了batch_size,但是无济于事,加到128后会出现OOM。减少batch_size也没有用,想问问可能是代码哪部分的原因?导致GPU可能在训练过程中大部分时间是在等待中?不知道能否实现优化?希望能回答,谢谢。
可以加大一下num works,加快数据加载
你好,我使用了你的mobilev1-yolov4的代码进行训练,使用的kaggle的云平台的P100,发现GPU的使用率一直变化,有时能到100%,有时又是1%,总是变化不定,总体来讲GPU的使用率很低。但是之前训练过YOLOv3,没有出现这样的问题。我试着加大了batch_size,但是无济于事,加到128后会出现OOM。减少batch_size也没有用,想问问可能是代码哪部分的原因?导致GPU可能在训练过程中大部分时间是在等待中?不知道能否实现优化?希望能回答,谢谢。