hiroi-sora / Umi-OCR_v2

结束和新的开始
MIT License
915 stars 69 forks source link

竖排繁体识别差,以及识别去格式问题 #63

Open sezhai opened 7 months ago

sezhai commented 7 months ago

竖排繁体识别非常差,基本是无法用的。 还有,希望增加“合并文本”的功能,就是去除所有空格与段落,方便直接粘贴使用。

hiroi-sora commented 7 months ago

Paddle插件中,繁体中文(v2) 的竖排识别能力是比v3要好的,可以试下。(不过,由于训练量的制约,竖排性能还是没有横排好。)

image

关于“合并文本”,是希望让OCR每次识别出的文本,都合并为单一行么

954224685 commented 5 months ago

Paddle插件中,繁体中文(v2) 的竖排识别能力是比v3要好的,可以试下。(不过,由于训练量的制约,竖排性能还是没有横排好。)

image

关于“合并文本”,是希望让OCR每次识别出的文本,都合并为单一行么

你好,请看一下最新的问题