hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.13k stars 2.72k forks source link

对中文文字支持不完全,比如【祂】 #667

Closed huanshiwushuang closed 1 month ago

huanshiwushuang commented 1 month ago

Issues

Umi-OCR version 程序版本

2.1.4

Windows version 系统版本

win10专业版 22H2 19045.4780

OCR plugins Used 使用的OCR插件

PaddleOCR

Reproduction steps 复现步骤

screenshots

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

No response

qwedc001 commented 1 month ago

请见 https://github.com/hiroi-sora/Umi-OCR/issues/447#issuecomment-2025245747 Umi 并非实际识别方,生僻字识别效果差是 Umi 本身调用引擎 Paddle 对生僻字训练较少导致的。

不知道什么时候插件系统重写好,重写好接入在线API这种情况可能会有所改善,不过目前没办法搞定。

huanshiwushuang commented 1 month ago

请见 #447 (comment) Umi 并非实际识别方,生僻字识别效果差是 Umi 本身调用引擎 Paddle 对生僻字训练较少导致的。

不知道什么时候插件系统重写好,重写好接入在线API这种情况可能会有所改善,不过目前没办法搞定。

感谢,明白了