这里是存放开源软件 Umi-OCR 的插件的仓库。
Umi-OCR (v2 以上) 支持以插件的形式导入 OCR 引擎等组件,只需将插件文件放置于软件指定目录即可。
(重要的事情说三遍)
UmiOCR-data/plugins
性能和准确率优秀的开源离线 OCR 组件。支持 mkldnn 数学库加速,能充分榨干 CPU 的潜力。适合高配置电脑使用。
源仓库 | PaddleOCR-json |
---|---|
下载 | Releases |
计算方式 | 本地,CPU |
平台兼容 | Windows 7 x64 / Linux x64 |
硬件兼容 | CPU 须带 AVX 指令集(不支持凌动 Atom,安腾 Itanium,赛扬 Celeron,奔腾 Pentium) |
附带语言库 | 简, 繁, 英, 日, 韩, 俄 |
相当于PaddleOCR的“轻量版”。CPU兼容性好、内存占用低。速度相对慢一点。适合低配置老电脑使用。
源仓库 | RapidOCR-json |
---|---|
下载 | Releases |
计算方式 | 本地,CPU |
平台兼容 | win7 以上,64 位 |
硬件兼容 | 无特殊要求 |
附带语言库 | 简, 繁, 英, 日, 韩, 俄 |
支持中英文/数学公式/混合排版。插件体积大,加载速度较慢,识别速度快。
源仓库 | Pix2Text |
---|---|
下载 | Releases |
计算方式 | 本地,CPU |
平台兼容 | win7 以上,64 位 |
硬件兼容 | 无特殊要求 |
附带语言库 | 中文/英文/数学公式 |
老牌开源模型,支持多国语言。速度较快,英文准确率优秀,中文准确率稍差。支持导入多个小语种识别库。
自带排版识别模型,能整理复杂的文档排版,比Umi自带的排版解析器准确率更好。如果使用此插件,请在Umi的标签页设置中将“排版解析方案”设为“不做处理”。
源仓库 | TesseractOCR |
---|---|
下载 | Releases |
计算方式 | 本地,CPU |
平台兼容 | win7 以上,64 位 |
硬件兼容 | 无特殊要求 |
附带语言库 | 简, 繁, 英, 日,数学公式 (另支持自行下载其他语言模型 |
支持中英文识别,ChineseOCR 的轻量级模型,仍在接入适配中。
源仓库 | ChineseOCR |
---|---|
下载 | Releases |
计算方式 | 本地,CPU |
平台兼容 | win7 以上,64 位 |
硬件兼容 | 无特殊要求 |
附带语言库 | 中英文 |
请见 插件开发文档及 demo。
**
后缀表示本仓库(插件库
)包含的内容。
Umi-OCR
└─ UmiOCR-data
├─ main.py
├─ version.py
├─ qt_res
│ └─ 项目qt资源,包括图标和qml源码
├─ py_src
│ └─ 项目python源码
├─ plugins **
│ └─ 插件
└─ i18n
└─ 翻译文件