识别繁体字图片报错，更换models_1.3后报同样的错误

hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码。内置多国语言库。

MIT License

25.44k stars 2.58k forks source link

识别繁体字图片报错，更换models_1.3后报同样的错误 #620

Open ericye-cn opened 1 month ago

ericye-cn commented 1 month ago

Issues

[X] I have browsed through the Issues. 我已浏览过Issues，确定没有重复提问。

Umi-OCR version 程序版本

2.1.3

Windows version 系统版本

Windows10 LTSC

OCR plugins Used 使用的OCR插件

PaddleOCR

Reproduction steps 复现步骤

识别繁体字时报错，更换models_1.3，一样报错，但简体识别能正常工作

Problem screenshots or related files (optional) 问题截图或相关文件（可选）

[Error] OCR init fail. Argd: {'enable_mkldnn': True, 'cpu_threads': 8, 'config_path': 'models/config_chinese_cht(v2).txt', 'cls': False, 'use_angle_cls': False, 'limit_side_len': 960} OCR init fail.

hiroi-sora commented 1 month ago

你好，麻烦测试下：除了繁体外，别的语言，英日韩那些，可以正常识别吗？

qpgzxx commented 4 weeks ago

你好，麻烦测试下：除了繁体外，别的语言，英日韩那些，可以正常识别吗？

我这也是语言/模型库选择“繁体中文”就会出现报错： [Error] OCR init fail. Argd: {'enable_mkldnn': True, 'cpu_threads': 8, 'config_path': 'models/config_chinese_cht(v2).txt', 'cls': False, 'use_angle_cls': False, 'limit_side_len': 2880} OCR init fail.

其他语言都试了一遍，都成功运行了，只有繁中不行。另外，选简中，识别内容出现不少繁体字。

Rapid版不会报错。

hiroi-sora commented 4 weeks ago

感谢提供信息。已确认bug，是配置文件错误。下个版本将修复此问题。

目前，可以手动更新模型库以修复：

下载 models.zip ，解压得到 models 文件夹。
在 Umi-OCR\UmiOCR-data\plugins\win7_x64_PaddleOCR-json 目录中，删除原来的 models 文件夹，然后粘贴新下载的。