[需求请求] 我是一名产品经理，我觉得您的工具是否好用。如果可以有一个自定义输入的名词过滤就更好了！如录入字典 “水杯”，识图返回值含有“水杯” 则匹配结果=True ，否则为“False” 。那就更好用了！我需要对部分图片进行本地拉黑处理，但是奈何我不会编程；后续望作者，能将图片中文字的“坐标 / 占位值”也可以记录在Json中，那就更好了！

hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码。内置多国语言库。

MIT License

27.45k stars 2.76k forks source link

Open 1014209142 opened 1 month ago

1014209142 commented 1 month ago

如录入字典 “水杯”，识图返回值含有“水杯” 则匹配结果=True ，否则为“False” 。那就更好用了！我需要对部分图片进行本地拉黑处理，但是奈何我不会编程；后续望作者，能将图片中文字的“坐标 / 占位值”也可以记录在Json中，那就更好了！

github建议

hiroi-sora commented 1 month ago

你好，当前版本可以实现你的需求。

自定义输入的名词过滤

批量OCR→保存文件类型→勾选 csv表格文件 ，用Excel打开生成的csv，就能方便的整理识别内容和对应的文件名。

你可以在Excel中过滤出指定关键词对应的文件名（路径），批量复制这些路径，然后让gpt给你写一个bat批处理脚本来拉黑（移动）这些文件。

将图片中文字的“坐标 / 占位值”也可以记录在Json中

这也是支持的，勾选 jsonl 原始信息 即可。

不过受限于OCR引擎的特性，只会以句子为最小单位记录坐标，而不会记录单字的坐标。