hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
25.95k stars 2.63k forks source link

如何在mac环境下进行umi的二开 #242

Open CrazyShado opened 10 months ago

CrazyShado commented 10 months ago

hello,我当前想基于mac环境下进行umi的二开,但执行之后挺多报错的,umi在mac下环境需求是什么样的呢

hiroi-sora commented 10 months ago

你可以先尝试一遍 windows开发环境搭建 流程,以熟悉本项目。

umi并不是一个基于传统python环境的项目,只靠主仓库代码是不够的,需要手动引入嵌入式python环境+第三方包。

关于多平台移植,前端部分是很容易搞的,只需要更换对应平台的python嵌入式解释器、和第三方库就行了。可参考 https://github.com/hiroi-sora/Umi-OCR/issues/228

但是后端(OCR引擎插件)比较难搞,需要编译一个适用于mac平台的PaddleOCR-json离线推理引擎。该项目有很多辅助二次开发的文档,比如可参考 移植指南

或者,你也可以参考 Umi-OCR_插件开发指南 ,创建一个适用于mac平台的新插件。如果不追求离线的话,可以写一个基于在线API的插件,开发难度会低很多。

CrazyShado commented 10 months ago

好的,由于我们需要对图片进行归类整理,所以更倾向于离线的推理引擎

sheng-di commented 7 months ago

MacOS 下可以使用系统自带的“预览”,新版的和 iOS 一样可以直接复制文字了。