PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
Apache License 2.0
39.74k stars 7.38k forks source link

直接识别不使用检测模型 #12066

Closed ymy1005 closed 1 month ago

ymy1005 commented 1 month ago

我的场景是,很多的单元格图片,识别里面的文字,可以设置det=False直接使用识别模型识别文字吗?? 如果想微调文本识别模型,数据集如何标注??使用ppocrlabel标注后生成的crop_img是裁剪过的,可以不用这个目录里的直接用原图片吗?

UserWangZz commented 1 month ago

可以不det直接识别,但是需要确保每张图片都是单一的单元格,否则识别结果会下降很严重,这也是为什么需要有一个detection模型的原因。

ymy1005 commented 1 month ago

可以不det直接识别,但是需要确保每张图片都是单一的单元格,否则识别结果会下降很严重,这也是为什么需要有一个detection模型的原因。

不det直接识别只能识别到一个块的内容,比如两行文字就只能识别到一行;单元格较大,里面只有一个字符,空白面积过大时,基本识别不到。微调识别模型的话,用ppocrlabel数据标注必须有框,识别对应的是裁剪过的图片,识别模型微调时用裁剪过的图片还是原图片?

TingquanGao commented 1 month ago

那这个场景还是建议使用det模型。

ymy1005 commented 1 month ago

那这个场景还是建议使用det模型。

原检测模型画文本框时有长宽比限制,单字符框不出来,在1000+的数据集上微调了检测模型,效果比原模型差一丢丢,还是检测不到单字符。请问这种情况有解决方法吗啊

UserWangZz commented 1 month ago

是要做字符级检测吗?

ymy1005 commented 1 month ago

是要做字符级检测吗?

因为只有一个字符时检测不到,所以想微调一个模型,专门识别单个字符的情况,但是微调的检测模型没效果,微调后还是框不出来单个字符的情况。请问有解决方法吗

UserWangZz commented 1 month ago

目前模型基本上都是word level和line level,针对字符级的检测,可能需要使用大量数据重新训练

ymy1005 commented 1 month ago

目前模型基本上都是word level和line level,针对字符级的检测,可能需要使用大量数据重新训练

整张图片只有一个字符,检测模型没有输出文本框,导致识别不到。这种情况,有方法解决吗?如果微调,需要多大数据量呢?

UserWangZz commented 1 month ago

检测模型的作用就是为识别模型缩小关注的区域,针对你所提到的场景,目前可以尝试的是生成一部分单字符的数据,可以参考文档 https://github.com/PaddlePaddle/PaddleOCR/blob/main/StyleText/README_ch.md