hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
22.96k stars 2.34k forks source link

希望HTTP接口中加入忽略区域或者指定识别的区域 #525

Closed wahsonG closed 1 month ago

wahsonG commented 1 month ago

Issues

Expected behavior 预期的功能

在/api/ocr接口中,加入指定识别的区域参数,在识别的时候只识别该区域。

Approximate reference (optional) 近似的参考(可选)

No response

hiroi-sora commented 1 month ago

建议收到 √

wahsonG commented 1 month ago

能否加上去除水印功能?作者大大

hiroi-sora commented 1 month ago

如果你指的是对图片操作、抹除图片中的水印,这并不在Umi的设计范围以内,还是使用别的专业图像编辑软件比较好呢。

wahsonG commented 1 month ago

了解,谢谢大佬回复

wahsonG commented 1 month ago

作者大大,HTTP协议里面,要确定指定识别区域,参数说明有吗?

wahsonG commented 1 month ago

大佬,有一个小bug,就是识别2张图片,文字内容一样的,识别出来的结果不一样,我把2张图片上传给你测试一下,懵、惜、槽这种类似的字眼识别不是很准确 01 02

hiroi-sora commented 1 month ago

HTTP协议里面,要确定指定识别区域

HTTP 接口暂不支持指定识别区域(即白名单制度),只支持忽略区域(黑名单制度)。

识别2张图片,文字内容一样的,识别出来的结果不一样

这是 OCR 技术固有的问题。两张图片虽然文本一样,但是文本背后的纹理有所不同,会干扰OCR的识别。

一般来说,纯色背景的准确率是最高的。而复杂纹理背景有可能降低准确率。另外,懵、惜、槽这类文字的外观比较相近,在OCR模型看来它们的”特征“也是很像的,所以容易弄混。

wahsonG commented 1 month ago

有没有可能优化一下?

hiroi-sora commented 1 month ago

有没有可能优化一下?

Umi-OCR 项目本身不训练和微调模型库。我们提供一个OCR引擎到用户的桥梁。

目前,Paddle系列模型库已经是开源领域内精度最好的OCR模型(尤其对简体中文)。我们会持续跟踪Paddle的更新,并寻找更多优秀的开源OCR项目,让其作为 Umi 的识别引擎组件。

未来,我们也会支持腾讯、百度等商业在线OCR服务,它们在复杂情景中也许能提供更好的精度。

wahsonG commented 1 month ago

谢谢大佬的答复