hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.45k stars 2.76k forks source link

[需求请求] 我是一名产品经理,我觉得您的工具是否好用。如果可以有一个 自定义输入的名词过滤就更好了!如 录入字典 “水杯”,识图返回值含有“水杯” 则匹配结果=True ,否则为“False” 。 那就更好用了!我需要对部分图片进行本地拉黑处理,但是奈何我不会编程;后续望作者,能将图片中文字的“坐标 / 占位值”也可以记录在Json中,那就更好了! #675

Open 1014209142 opened 1 month ago

1014209142 commented 1 month ago

Issues

Expected behavior 预期的功能

如 录入字典 “水杯”,识图返回值含有“水杯” 则匹配结果=True ,否则为“False” 。 那就更好用了!我需要对部分图片进行本地拉黑处理,但是奈何我不会编程;后续望作者,能将图片中文字的“坐标 / 占位值”也可以记录在Json中,那就更好了!

Approximate reference (optional) 近似的参考(可选)

github建议

hiroi-sora commented 1 month ago

你好,当前版本可以实现你的需求。

自定义输入的名词过滤

批量OCR→保存文件类型→勾选 csv表格文件 ,用Excel打开生成的csv,就能方便的整理识别内容和对应的文件名。

你可以在Excel中过滤出指定关键词对应的文件名(路径),批量复制这些路径,然后让gpt给你写一个bat批处理脚本来拉黑(移动)这些文件。

将图片中文字的“坐标 / 占位值”也可以记录在Json中

这也是支持的,勾选 jsonl 原始信息 即可。

不过受限于OCR引擎的特性,只会以句子为最小单位记录坐标,而不会记录单字的坐标。