hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.04k stars 2.71k forks source link

pdf文档内容识别错误 #685

Open llm163520 opened 3 weeks ago

llm163520 commented 3 weeks ago

Issues

Umi-OCR version 程序版本

2.1.4

Windows version 系统版本

win10

OCR plugins Used 使用的OCR插件

PaddleOCR

Reproduction steps 复现步骤

1、用批量文档识别 2、点击开始任务

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

image 20240729185649698-6421.pdf

llm163520 commented 3 weeks ago

image 其识别结果内容不对,识别结果内容参考上图

hiroi-sora commented 3 weeks ago

试试: 批量文档标签页→设置→内容提取模式 → 整页强制OCR

llm163520 commented 3 weeks ago

试试: 批量文档标签页→设置→内容提取模式 → 整页强制OCR

尝试过不行

hiroi-sora commented 3 weeks ago

可以的话,把PDF文件上传上来我看看

llm163520 commented 3 weeks ago

可以的话,把PDF文件上传上来我看看 文件有上传的呢 https://github.com/user-attachments/files/17348843/20240729185649698-6421.pdf

hiroi-sora commented 3 weeks ago

哦哦,懂了。你这个文件是旋转了90°的,需要勾选【纠正文本方向】才能正确识别。

另外,排版解析方案建议【不做处理】,以免被方向所干扰。

image

llm163520 commented 3 weeks ago

如果是API的话这个应该怎么处理呢?

hiroi-sora commented 3 weeks ago

如果是API的话这个应该怎么处理呢?

可以传参开启此功能,详见文档。

https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_doc.md#/api/doc

image

llm163520 commented 3 weeks ago

可以的了,感谢!