hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
23.48k stars 2.39k forks source link

想请问升级底层识别模型的方法 #405

Closed PopsGitHub21 closed 4 months ago

PopsGitHub21 commented 4 months ago

大佬,想问一下如果想用PaddleOCR新的版本(PP-OCRv4)识别,计算速度和准确度是否会提高点? 目前有些文件识别时错别字较多,请问下如果想自己测试的话应该要怎么操作么?

hiroi-sora commented 4 months ago

你可以下载个 win7_x64_RapidOCR-json 的插件,里面自带 PP-OCRv4 模型。不过我实测,准确度提升有限。

PopsGitHub21 commented 4 months ago

感谢大佬,我测试一下