hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.59k stars 2.77k forks source link

PaddleX更新PP-OCRv4,这里也能更新一下吗? #202

Closed yiusing134 closed 1 year ago

yiusing134 commented 1 year ago

如题

🔥2023.8.7 发布 PaddleOCR release/2.7 发布PP-OCRv4,提供mobile和server两种模型 PP-OCRv4-mobile:速度可比情况下,中文场景效果相比于PP-OCRv3再提升4.5%,英文场景提升10%,80语种多语言模型平均识别准确率提升8%以上 PP-OCRv4-server:发布了目前精度最高的OCR模型,中英文场景上检测模型精度提升4.9%, 识别模型精度提升2% 可参考快速开始 一行命令快速使用,同时也可在飞桨AI套件(PaddleX)中的通用OCR产业方案中低代码完成模型训练、推理、高性能部署全流程

hiroi-sora commented 1 year ago

v2Rapid版已经默认附带了PP-OCRv4的简中轻量模型,可以去体验一下。

Paddle版有一些引擎兼容性问题,暂时不支持v4 mobile模型。可以支持server级模型,实测确实有比较高的精度,但在家用设备上速度太慢了,不太实用,所以没有附带。如果想体验,可以自己下载并导入Umi-OCR_v2。

hiroi-sora commented 1 year ago

导入PP-OCRv4高精度模型的方法请见: https://github.com/hiroi-sora/Umi-OCR_v2/issues/12