直接识别不使用检测模型 - Githubissues

PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

Apache License 2.0

39.74k stars 7.38k forks source link

直接识别不使用检测模型 #12066

Closed ymy1005 closed 1 month ago

ymy1005 commented 1 month ago

我的场景是，很多的单元格图片，识别里面的文字，可以设置det=False直接使用识别模型识别文字吗？？如果想微调文本识别模型，数据集如何标注？？使用ppocrlabel标注后生成的crop_img是裁剪过的，可以不用这个目录里的直接用原图片吗？

UserWangZz commented 1 month ago

可以不det直接识别，但是需要确保每张图片都是单一的单元格，否则识别结果会下降很严重，这也是为什么需要有一个detection模型的原因。

ymy1005 commented 1 month ago

可以不det直接识别，但是需要确保每张图片都是单一的单元格，否则识别结果会下降很严重，这也是为什么需要有一个detection模型的原因。

不det直接识别只能识别到一个块的内容，比如两行文字就只能识别到一行；单元格较大，里面只有一个字符，空白面积过大时，基本识别不到。微调识别模型的话，用ppocrlabel数据标注必须有框，识别对应的是裁剪过的图片，识别模型微调时用裁剪过的图片还是原图片？

TingquanGao commented 1 month ago

那这个场景还是建议使用det模型。

ymy1005 commented 1 month ago

那这个场景还是建议使用det模型。

原检测模型画文本框时有长宽比限制，单字符框不出来，在1000+的数据集上微调了检测模型，效果比原模型差一丢丢，还是检测不到单字符。请问这种情况有解决方法吗啊

UserWangZz commented 1 month ago

是要做字符级检测吗？

ymy1005 commented 1 month ago

是要做字符级检测吗？

因为只有一个字符时检测不到，所以想微调一个模型，专门识别单个字符的情况，但是微调的检测模型没效果，微调后还是框不出来单个字符的情况。请问有解决方法吗

UserWangZz commented 1 month ago

目前模型基本上都是word level和line level，针对字符级的检测，可能需要使用大量数据重新训练

ymy1005 commented 1 month ago

目前模型基本上都是word level和line level，针对字符级的检测，可能需要使用大量数据重新训练

整张图片只有一个字符，检测模型没有输出文本框，导致识别不到。这种情况，有方法解决吗？如果微调，需要多大数据量呢？

UserWangZz commented 1 month ago

检测模型的作用就是为识别模型缩小关注的区域，针对你所提到的场景，目前可以尝试的是生成一部分单字符的数据，可以参考文档 https://github.com/PaddlePaddle/PaddleOCR/blob/main/StyleText/README_ch.md