hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.12k stars 2.72k forks source link

文本在图像边缘且文字很少时,无法识别 #660

Open liujia0422 opened 1 month ago

liujia0422 commented 1 month ago

Issues

Umi-OCR version 程序版本

2.1.3

Windows version 系统版本

win10

OCR plugins Used 使用的OCR插件

RapidOCR

Reproduction steps 复现步骤

image image 类似这种图片,只有一两个数字且不在图像中间就无法识别

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

No response

liujia0422 commented 1 month ago

其实无论文字在什么位置,只要文字在图像中占比很少就基本识别不出来

hiroi-sora commented 1 month ago

det(文本检测模型)主要是用句子作为训练素材的,单个字的训练比较少,所以检测准度低一些。暂时没有好的解决方法