hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
25.71k stars 2.6k forks source link

一个nvdia的英文开发文档 Paddle Rapid 选择识别英文后均无法正常识别英文文字 #668

Open Zcodeoooo opened 2 days ago

Zcodeoooo commented 2 days ago

Issues

Umi-OCR version 程序版本

2.1.0

Windows version 系统版本

win11

OCR plugins Used 使用的OCR插件

No response

Reproduction steps 复现步骤

NVIDIA Reflex SDK Integration Guide.pdf

下载文档识别复现

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

No response

hiroi-sora commented 10 hours ago

我看了下,可能是这份PDF的图像元数据,Umi读取的时候有问题,暂不明确具体原因。

不过,请将 设置→文档处理→内容提取模式 改为 整页强制OCR 即可对该PDF进行OCR。

image