测试：1.3.1和2.0.0的简体中文模型识别English无间隙

hiroi-sora / Umi-OCR_v2

结束和新的开始

MIT License

933 stars 73 forks source link

哦哦哦！感谢你的测试。

实际上，v1.3和v2的Paddle中文模型库是同一个，理论上准确度不会有差别。但是经过测试，发现二者确实存在差异。

我再次分析了两版代码，认为很可能是图片数据在程序内部的编码存在差别，进而导致了结果不同。

你可以进行以下步骤来修改内部编码：

找到第98行：

    image.save(buffer, "JPEG")  # 将 QImage 保存为字节数组

将 JPEG 改为 PNG ：

    image.save(buffer, "PNG")  # 将 QImage 保存为字节数组

通过以上步骤，似乎可以减少截图OCR时空格缺失问题发生的机率。你可以试试。

hiroi-sora / Umi-OCR_v2