希望HTTP接口中加入忽略区域或者指定识别的区域

hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码。内置多国语言库。

MIT License

27.47k stars 2.76k forks source link

Closed wahsonG closed 5 months ago

wahsonG commented 5 months ago

在/api/ocr接口中，加入指定识别的区域参数，在识别的时候只识别该区域。

No response

hiroi-sora commented 5 months ago

建议收到 √

wahsonG commented 5 months ago

能否加上去除水印功能？作者大大

hiroi-sora commented 5 months ago

如果你指的是对图片操作、抹除图片中的水印，这并不在Umi的设计范围以内，还是使用别的专业图像编辑软件比较好呢。

wahsonG commented 5 months ago

了解，谢谢大佬回复

wahsonG commented 5 months ago

作者大大，HTTP协议里面，要确定指定识别区域，参数说明有吗？

wahsonG commented 5 months ago

大佬，有一个小bug，就是识别2张图片，文字内容一样的，识别出来的结果不一样，我把2张图片上传给你测试一下，懵、惜、槽这种类似的字眼识别不是很准确

hiroi-sora commented 5 months ago

HTTP协议里面，要确定指定识别区域

HTTP 接口暂不支持指定识别区域（即白名单制度），只支持忽略区域（黑名单制度）。

识别2张图片，文字内容一样的，识别出来的结果不一样

这是 OCR 技术固有的问题。两张图片虽然文本一样，但是文本背后的纹理有所不同，会干扰OCR的识别。

一般来说，纯色背景的准确率是最高的。而复杂纹理背景有可能降低准确率。另外，懵、惜、槽这类文字的外观比较相近，在OCR模型看来它们的”特征“也是很像的，所以容易弄混。

wahsonG commented 5 months ago

有没有可能优化一下？

hiroi-sora commented 5 months ago

有没有可能优化一下？

Umi-OCR 项目本身不训练和微调模型库。我们提供一个OCR引擎到用户的桥梁。

目前，Paddle系列模型库已经是开源领域内精度最好的OCR模型（尤其对简体中文）。我们会持续跟踪Paddle的更新，并寻找更多优秀的开源OCR项目，让其作为 Umi 的识别引擎组件。

未来，我们也会支持腾讯、百度等商业在线OCR服务，它们在复杂情景中也许能提供更好的精度。

wahsonG commented 5 months ago

谢谢大佬的答复