Closed ultramangod closed 1 week ago
主要还是验证集和测试集差异导致的,建议把符合业务数据分布的数据加进来训练呢
The issue has no response for a long time and will be closed. You can reopen or new another issue if are still confused.
From Bot
The issue has no response for a long time and will be closed. You can reopen or new another issue if are still confused.
From Bot
问题详情
我在使用标准PPLCNet_x1_0.yaml训练text_image_orientation时,使用了预训练模型text_image_orientation_pretrained.pdparams
训练数据为官方公开数据集10365张图片+自己数据(包含文档,带图文档,表格,APP截图等)3500张图片。每张图片均先摆正+四向旋转构建样本rot_0到rot_270。后续也尝试过只使用自己数据,结果差异不大。
PPLCNet_x1_0.yaml参数修改项为分辨率相关,严格按照https://github.com/PaddlePaddle/PaddleClas/blob/develop/docs/zh_CN/training/single_label_classification/finetune.md#faq 的标准将分辨率修改为320。
训练后期best_model能够达到97%以上的精度,但是正式用于业务数据infer时,许多特征明确的0°文档都会被识别为180°。
较为鲜明的错误类型包括:
错识别为180°且置信度较高>0.7
错识别为180°且置信度较低,甚至top1和top2置信度接近。
问题如下:
**1. 如何增强数据解决上述问题?
谢谢解答。
PaddleClas版本以及PaddlePaddle版本
训练环境信息:
a. 具体操作系统,ubuntu b. Python版本号,3.9.18 c. CUDA/cuDNN版本, CUDA12.2/CUDNN8.9.6