PaddlePaddle / PaddleYOLO

🚀🚀🚀 YOLO series of PaddlePaddle implementation, PP-YOLOE+, RT-DETR, YOLOv5, YOLOv6, YOLOv7, YOLOv8, YOLOX, YOLOv5u, YOLOv7u, YOLOv6Lite, RTMDet and so on. 🚀🚀🚀
https://github.com/PaddlePaddle/PaddleYOLO
GNU General Public License v3.0
534 stars 132 forks source link

YOLOv8在客制化数据集上训练出现SystemError #191

Closed LorenzoSun-V closed 4 months ago

LorenzoSun-V commented 9 months ago

问题确认 Search before asking

Bug组件 Bug Component

Training

Bug描述 Describe the Bug

我制作了一个客制化数据集,用labelimg标注后转成coco格式,其中有一些负样本没有标签,在coco标签中的表现为在images字段有image_id,但在annotations字段没有对应image_id的标签。在数据集中,我已设置allow_empty=True,并在yolov5和yolox上可以正常训练和推理。 但在yolov8训练时,会出现以下bug: image 看报错信息的话,dataset已经加载成功,但是在Dataloader取数据的时候报错了。 我把worker_num设置为0,可以正常训练,但是loss太大就卡住了: image 这个问题我在训练yolov7u的时候也遇到了。

我的配置文件为: image 修改的optimizer_100e.yml为: image

复现环境 Environment

Bug描述确认 Bug description confirmation

是否愿意提交PR? Are you willing to submit a PR?

LorenzoSun-V commented 9 months ago

另外我试了一下原始的coco配置文件训练,yolov8是可以正常训练的。

LorenzoSun-V commented 9 months ago

根据 #164 的回答,把 use_shared_memory 设为False可以正常训练,但是同时也出现了训练loss一直为0的情况。

nemonameless commented 4 months ago

https://github.com/PaddlePaddle/PaddleYOLO/issues/166 谢谢建议,后续进展在166中更新