hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
25.58k stars 2.59k forks source link

错误] Umi-OCR Error 主程序启动失败! gbk' codec can't encode character yu2022' in position 1718: illegalmutibte segwence ........ .......... .......sss. #336

Closed xiahan4956 closed 5 months ago

xiahan4956 commented 7 months ago

image

背景是批量的识别图片,用CLI,出现了这个错误

hiroi-sora commented 7 months ago

请问你是使用命令行指令,比如 Umi-OCR.exe --path="xxx" 的时候出现了该报错吗?如果是,那么使用的是什么指令?

如果某一张图片能稳定触发该bug,请将这张图片也传上来,我研究下。

xiahan4956 commented 7 months ago
        cmd = f'"{ocr_tool}" --path "{image_path}" -->"{text_path}"'
        res = subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True, shell=True)

       就是你所说的,加了-->

图片我还没有找到,因为发现报错了也可以通过ahk的脚本跳过 - - 回头找到了发出来

hiroi-sora commented 7 months ago
  1. 你的指令 -->"{text_path}" 中,是不是漏了一个空格?
  2. 如果不加 --> ,识别同一张图片,仍会有报错吗?