hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
25.59k stars 2.59k forks source link

看到paddleocr更新可以扫描版pdf直接识别为word文档,有后续跟进吗? #79

Closed wentongkeji closed 7 months ago

wentongkeji commented 1 year ago

如题,如果直接可以识别扫描版PDF就方便多了

hiroi-sora commented 1 year ago

pdf识别是有计划滴。以后有空了整。

hiroi-sora commented 7 months ago

v2.1.0 测试版 已支持PDF识别。

https://github.com/hiroi-sora/Umi-OCR/releases