Closed thunder95 closed 1 year ago
Paddle默认将所有数据拷贝至GPU,确实显存占用更大,但是我这里没出现这么夸张得差距,gpu利用率低可以设置多线程读取数据,因为Paddle在win10上不支持多线程数据读取,所以我设置num_works默认为0,https://github.com/GuoQuanhao/YOLOv5-Paddle/blob/b4d2758b78aa58d7f7be8fa77e2163c80f736c0a/utils/datasets.py#L112,如果是Linux系统,你可以修改代码增加线程数,另外Paddle的Tensor还不是那么友好,为了偷懒,精度验证部分用numpy计算的,这部分会导致GPU利用率低
本次更新实现了yolov5的全新迁移,能够实现分类、分割、检测和各种格式模型的导出。解决了显存占用过高问题
使用pytorch训练同样的数据集,只需要2G左右显存,但是paddle却要9G多,而且gpu利用率极低, 是哪里造成的显存占用如此大