hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
23.04k stars 2.35k forks source link

[BUG]无法同时提交超过255个pdf文件进行扫描 #476

Closed kylincaster closed 1 month ago

kylincaster commented 2 months ago

Issues

Umi-OCR version 程序版本

2.1.0

Windows version 系统版本

win10

OCR plugins Used 使用的OCR插件

No response

Reproduction steps 复现步骤

同时在window文件浏览器中选中超过255个pdf文件,然后拖入Umi-OCR中,这样Umi-OCR就会失去一部分组件功能的作用,也无法再添加或删除待扫描的pdf文件,只能扫描已有的前255个pdf文件。

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

我是在将整个pdf文件以页为单位进行拆分扫描时发现的。主要是Umi-OCR对pdf文件进行扫描时没有暂停功能,因此,本人将大的pdf文件拆散进行处理,然后再合并已扫描的文件。因此,希望Umi-OCR添加暂停功能,或临时保存能力。

hiroi-sora commented 2 months ago

暂停功能在开发中。


我这边测试(Win11),拖入超过800个文件是正常的哦,虽然拖入的瞬间会因为预处理而卡一下。

image

你的问题,我估计有几个可能:

  1. 拖入瞬间的卡顿状态下,因为点击鼠标或者别的原因,使得预处理中断,只有前255个文件被导入。
  2. 操作系统限制,一次只能拖拽255个文件。

你可以做这些尝试:

  1. 拖入、松开左键的瞬间,确保不要继续碰鼠标或键盘。
  2. 不要全选所有文件拖入,而是拖入单个父文件夹。
  3. 不拖入,而是点打开文档的按钮,Ctrl+A全选→导入多个文件。
butitsblue commented 1 month ago

暂停功能在开发中。

我这边测试(Win11),拖入超过800个文件是正常的哦,虽然拖入的瞬间会因为预处理而卡一下。

另外在我的程序设计上,按理说不会有数量上限或者遇到性能上限。

image

你的问题,我估计有几个可能:

  1. 拖入瞬间的卡顿状态下,因为点击鼠标或者别的原因,使得预处理中断,只有前255个文件被导入。
  2. 操作系统限制,一次只能拖拽255个文件。

你可以做这些尝试:

  1. 拖入、松开左键的瞬间,确保不要继续碰鼠标或键盘。
  2. 不要全选所有文件拖入,而是拖入单个父文件夹。
  3. 不拖入,而是点打开文档的按钮,Ctrl+A全选→导入多个文件。

同样遇到类似问题,拖入超过255个文件没问题,点击开始任务就会弹出错误提示,255个文件往后的所有文件都是初始化输出器失败,无法加载文档 @hiroi-sora

hiroi-sora commented 1 month ago

同样遇到类似问题,拖入超过255个文件没问题,点击开始任务就会弹出错误提示,255个文件往后的所有文件都是初始化输出器失败,无法加载文档

你是输出 什么文件?双层PDF吗?

butitsblue commented 1 month ago

@

同样遇到类似问题,拖入超过255个文件没问题,点击开始任务就会弹出错误提示,255个文件往后的所有文件都是初始化输出器失败,无法加载文档

你是输出 什么文件?双层PDF吗?

对,批量双层pdf

hiroi-sora commented 1 month ago

对,批量双层pdf

好的,大概知道问题在哪了,正在修复。

butitsblue commented 1 month ago

对,批量双层pdf

好的,大概知道问题在哪了,正在修复。

谢谢,期待

hiroi-sora commented 1 month ago

v2.1.2 版本 发布,优化了大批文件加载的性能,理论上能避免此 Bug 。

如果还有此问题复现,可能是系统限制一次拖入的数量,可尝试分批拖入文件,或者拖入单个 父文件夹。

butitsblue commented 1 month ago

v2.1.2 版本 发布,优化了大批文件加载的性能,理论上能避免此 Bug 。

如果还有此问题复现,可能是系统限制一次拖入的数量,可尝试分批拖入文件,或者拖入单个 父文件夹。

感恩