hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
25.44k stars 2.58k forks source link

识别繁体字图片报错,更换models_1.3后报同样的错误 #620

Open ericye-cn opened 1 month ago

ericye-cn commented 1 month ago

Issues

Umi-OCR version 程序版本

2.1.3

Windows version 系统版本

Windows10 LTSC

OCR plugins Used 使用的OCR插件

PaddleOCR

Reproduction steps 复现步骤

识别繁体字时报错,更换models_1.3,一样报错,但简体识别能正常工作

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

[Error] OCR init fail. Argd: {'enable_mkldnn': True, 'cpu_threads': 8, 'config_path': 'models/config_chinese_cht(v2).txt', 'cls': False, 'use_angle_cls': False, 'limit_side_len': 960} OCR init fail.

hiroi-sora commented 1 month ago

你好,麻烦测试下:除了繁体外,别的语言,英日韩 那些,可以正常识别吗?

qpgzxx commented 4 weeks ago

你好,麻烦测试下:除了繁体外,别的语言,英日韩 那些,可以正常识别吗?

我这也是语言/模型库选择“繁体中文”就会出现报错: [Error] OCR init fail. Argd: {'enable_mkldnn': True, 'cpu_threads': 8, 'config_path': 'models/config_chinese_cht(v2).txt', 'cls': False, 'use_angle_cls': False, 'limit_side_len': 2880} OCR init fail.

其他语言都试了一遍,都成功运行了,只有繁中不行。另外,选简中,识别内容出现不少繁体字。

Rapid版不会报错。

hiroi-sora commented 4 weeks ago

感谢提供信息。已确认bug,是配置文件错误。下个版本将修复此问题。

目前,可以手动更新模型库以修复:

  1. 下载 models.zip ,解压得到 models 文件夹。
  2. Umi-OCR\UmiOCR-data\plugins\win7_x64_PaddleOCR-json 目录中,删除原来的 models 文件夹,然后粘贴新下载的。