hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.47k stars 2.76k forks source link

在wimdow图片识别没问题,centos 7没有识别出来 ,OCR插件Used 使用的OCR插件RapidOCR #638

Open deict opened 2 months ago

deict commented 2 months ago

Issues

Umi-OCR version 程序版本

2.1.3

Windows version 系统版本

windows10

OCR plugins Used 使用的OCR插件

PaddleOCR

Reproduction steps 复现步骤

在本地运行的运行api_doc_demo.pyimage 在服务器上运行api_doc_demo.py image 测试的pdf文件ss1.pdf

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

No response

hiroi-sora commented 2 months ago

我在ubuntu18 + docker(debian:11)上测试了你的示例文件,结果是正常的。

另外从你的截图中,OCR引擎的工作是正常的, 这是一段话we are you? 这句话也可以正常转出,但是丢失了后续的内容。

我估计问题出在引擎的几率很小。也许是网络转换或者python输出时,丢弃了第一个换行符之后的内容?

请检查一下 下载文件 [OCR]_ss1.zip 中,内容是否正确?

deict commented 2 months ago

因为测试文件中除了这句话 这是一段话we are you?,下面的是一张内嵌进去的图片,在centos 7上正如第二张截图,是正常运行,但是只识别出了这是一段话we are you?, 下面的那张图片的内容没有出来,不知道为什么

hiroi-sora commented 2 months ago

要不试下 docker部署

deict commented 2 months ago

用的就是docker部署的,用的无头模式,代码正常运行,就是图片没识别出来就很奇怪,ubuntu18 + docker(debian:11)这是你的测试环境吗

deict commented 2 months ago

自己解决了,麻烦你了,谢谢

hiroi-sora commented 2 months ago

我用 centos7 + docker 进行了测试,没有问题,结果正常。


咋解决哒?

deict commented 2 months ago

https://github.com/hiroi-sora/Umi-OCR/releases根据你发的这个image cho重新下载里面的ocr识别的包就好了