hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
23.48k stars 2.39k forks source link

建议增加 HEIC 格式图片识别的支持 #424

Open ygb8745 opened 4 months ago

ygb8745 commented 4 months ago

部分手机可以保存照片为HEIC格式,在不降低清晰度的情况下减少照片文件体积. 刚才试了一下,好像Umi-OCR不支持识别HEIC格式的照片. 建议考虑增加对HEIC文件的支持.

hiroi-sora commented 4 months ago

HEIC应该是ios上常用的格式,苹果以外的设备几乎不默认使用HEIC文件。我认为让Umi直接支持HEIC的开发优先级很低。原因:

zhangziran commented 4 months ago

HEIC应该是ios上常用的格式,苹果以外的设备几乎不默认使用HEIC文件。我认为让Umi直接支持HEIC的开发优先级很低。原因:

  • 简易的解决方案:使用 iTunes 将苹果手机的照片拷贝到 Windows 系统时,会默认转换为 jpg 等通用格式。
  • 开发的复杂性:多数OCR引擎基于OpenCV图像解析库,该库不支持读取HEIC二进制文件。若要兼容该格式,需要额外的处理步骤,使开发和维护更麻烦。

现在安卓手机也开始采用该格式了,比如小米手机(可选的)。不过我也认同项目应该更专注项目本身(比如支持更多的ocr引擎),而不是无限制的扩展,比如需要可以先把heic转为jpg等格式。

hiroi-sora commented 4 months ago

以后,我打算再创建一个“批量转换格式”的标签页。 一方面,像你说的,将heic、gif等无法直接导入OCR的格式,转换为支持OCR的格式。这个标签页独立于OCR组件,耦合小,开发维护更简单。 另一方面,利用同一个图像处理库,可以提供更多实用功能:如图像压缩、裁切等。允许将体积大的照片转换为小体积jpg。

zhangziran commented 4 months ago

以后,我打算再创建一个“批量转换格式”的标签页。 一方面,像你说的,将heic、gif等无法直接导入OCR的格式,转换为支持OCR的格式。这个标签页独立于OCR组件,耦合小,开发维护更简单。 另一方面,利用同一个图像处理库,可以提供更多实用功能:如图像压缩、裁切等。允许将体积大的照片转换为小体积jpg。

如果这样的话可以考虑类似于以下的交互逻辑 1、开启递归目录,选择后单独提示是否转换(gif/heic)并ocr识别(识别后删除转换后文件选项) 2、在设置里提供1对应的选项

不过现在这个问题其实也还好,比如可以这样解决: 找一个格式转换软件,转到同目录。用umi-ocr选择目录使用就好了(因为不支持gif所以会自己剔除)