Closed kaixin-bai closed 1 year ago
yolov7可以顺利训练,loss也显示比较正常,请问config文件中我有哪些需要修改?yolov8训练时我将reader文件的share_memory给设置为False,因为会报错。其他的没有什么修改了
数据集建议再检查下,loss_dfl loss_iou 在第0iter理论上不会为0 此外训练配置的lr bs不合理,训练自定义数据集最好加上coco权重预训练。 配置文件里加一行 pretrain_weights: https://paddledet.bj.bcebos.com/models/yolov8_l_500e_coco.pdparams 或运行命令后加上 -o pretrain_weights=https://paddledet.bj.bcebos.com/models/yolov8_l_500e_coco.pdparams 同时lr改小1/10 https://github.com/PaddlePaddle/PaddleYOLO/issues/43
hi,请问你这个问题解决了嘛,我遇到跟你一摸一样的问题,将reader文件的share_memory给设置为False,我加载了预训练模型,我学习率设置是正常的
数据集建议再检查下,loss_dfl loss_iou 在第0iter理论上不会为0 此外训练配置的lr bs不合理,训练自定义数据集最好加上coco权重预训练。 配置文件里加一行 pretrain_weights: https://paddledet.bj.bcebos.com/models/yolov8_l_500e_coco.pdparams 或运行命令后加上 -o pretrain_weights=https://paddledet.bj.bcebos.com/models/yolov8_l_500e_coco.pdparams 同时lr改小1/10 #43
我的情况跟上面的一样,只是中途loss变为了0,加载了预训练模型,bs为16,lr设置的0.00125
问题确认 Search before asking
Bug组件 Bug Component
Training
Bug描述 Describe the Bug
在paddleyolo中使用yolov8训练自定义数据集时,显示loss全为0,对保存的checkpoint进行推理无法推理出结果。同样的数据集在paddledetection的yolov3上可以顺利训练并推理。
训练命令:
推理命令:
配置文件:
复现环境 Environment
cudatoolkit 11.2.2 hbe64b41_10 conda-forge cudnn 8.2.1.32 h86fa8c9_0 conda-forge paddlepaddle-gpu 2.4.2.post112 pypi_0 pypi
Bug描述确认 Bug description confirmation
是否愿意提交PR? Are you willing to submit a PR?