hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.47k stars 2.76k forks source link

大佬,关于软件识别对于竖排的日语文字识别容易识别错误 #434

Closed kevinfkw closed 5 months ago

kevinfkw commented 8 months ago

Expected behavior 预期的功能

我在使用软件的时候,横排文字识别都还是有很高的正确率,但是竖排文字就非常容易识别错误,请问这部分的弱点能够调整吗? 识别差异

Approximate reference (optional) 近似的参考(可选)

No response

hiroi-sora commented 8 months ago

很抱歉,在 Umi-OCR 已经支持的5款开源OCR引擎中,对 日文+竖排 情景的识别率都不太如人意。

你可以尝试这个项目: manga-ocr 。对 竖排漫画 特攻。

未来,Umi也考虑引入manga-ocr的识别库作为可选插件。

qwedc001 commented 8 months ago

未来,Umi也考虑引入manga-ocr的识别库作为可选插件。

好的收到这就去做(?)

能否提供一些样本图片,发在这里或者发送到邮箱2364319479@qq.com都可