Open cuiyong127 opened 9 months ago
请问由于这个模型比较小,现在采用3090训练,GPU利用率很低,大部分时间GPU利用率为0,加大batch size 也没有改善,反而占用了更多的GPU显存。应该是cpu或者硬盘读写速度不够,请问有什么方式可以优化?
请问由于这个模型比较小,现在采用3090训练,GPU利用率很低,大部分时间GPU利用率为0,加大batch size 也没有改善,反而占用了更多的GPU显存。应该是cpu或者硬盘读写速度不够,请问有什么方式可以优化?