OcrLiteNcnn
联系方式
- QQ①群:994929053(满)
- QQ②群:820132154(满)
- QQ③群:904091319(满)
- QQ④群:615877948(满)
- QQ⑤群:185905924(满)
- QQ⑥群:628010752
Project下载
- 整合好源码和依赖库的完整工程项目,可以在Release中下载(github)
- 可到Q群共享内下载,以Project开头的压缩包文件为源码工程,例:Project_OcrLiteNcnn-版本号.7z
- 如果想自己折腾,则请继续阅读本说明
Demo下载(win、mac、linux)
- 编译好的demo,可以在release中下载,或者Q群共享内下载
- 或者Gitee下载
- 或者Github下载
- 各平台可执行文件:linux-bin.7z、macos-bin.7z、windows-bin.7z
- 用于java的jni库:linux-jni.7z、macos-jni.7z、windows-jni.7z
- 用于C的动态库:linux-clib.7z、macos-clib.7z、windows-clib.7z
- C动态库调用范例:OcrLiteNcnnLibTest
- 注意:linux编译平台为ubuntu18.04,如果你的linux版本无法运行demo,请自行从源码编译依赖库和完整项目。
介绍
ChineseOcr Lite Ncnn,超轻量级中文OCR PC Demo,支持ncnn推理
对应chineseocr lite的onnx分支
这个项目使用ncnn框架进行推理,模型是从onnx模型转成了ncnn模型格式。
详情请查看 https://github.com/ouyanghuiyu/chineseocr_lite
采用ncnn神经网络前向计算框架https://github.com/Tencent/ncnn
更新说明
2021-10-13 update
- opencv 4.5.4
- ncnn 20210720
- 优化编译脚本和测试脚本
2021-10-25 update
- fix:win编译打包C动态库缺少lib文件
- 编译c动态库添加打包include
2022-06-18 update
- opencv 4.6.0
- ncnn 20220420,模型格式变化,需重新转换db和angle模型
- 修改c lib导出方法,支持C调用
2022-10-14 update
- ncnn: 20220729
- vulkan: 1.2.189.0
- 范例工程windows版默认使用mt版依赖库
2023-02-14 update
- ncnn: 20221128
- vulkan: 1.3.236.0
模型下载
模型下载地址
下载后解压到项目根目录
OcrLiteNcnn/models
├── angle_op.bin
├── angle_op.param
├── crnn_lite_op.bin
├── crnn_lite_op.param
├── dbnet_op.bin
├── dbnet_op.param
└── keys.txt
测试说明
- 根据系统下载对应的程序包linux-bin.7z、macos-bin.7z、windows-bin.7z,并解压.
- 把上面的模型下载,解压到第一步解压的文件夹里.
- 终端运行run-test.sh或命令行运行run-test.bat,查看识别结果.
- 终端运行run-benchmark.sh或命令行运行run-benchmark.bat,查看识别过程平均耗时.
FAQ
macOS缺少openmp(从1.7.0开始已不再依赖openmp)
brew install libomp
gpu版程序运行出错,缺少vulkan sdk
参考编译说明 安装vulkan sdk
windows提示缺少"VCRUNTIME140_1.dll"
下载安装适用于 Visual Studio 2015、2017 和 2019 的 Microsoft Visual C++ 可再发行软件包
下载地址
Windows7执行错误|中文乱码
- cmd窗口左上角-属性
- 字体选项卡-选择除了“点阵字体”以外的TrueType字体,例如:Lucida Console、宋体
- 重新执行bat
输入参数说明
- 请参考main.h中的命令行参数说明。
- 每个参数有一个短参数名和一个长参数名,用短的或长的均可。
-d或--models
:模型所在文件夹路径,可以相对路径也可以绝对路径。
-1或--det
:dbNet模型文件名(不含扩展名)
-2或--cls
:angleNet模型文件名(不含扩展名)
-3或--rec
:crnnNet模型文件名(不含扩展名)
-4或--keys
:keys.txt文件名(含扩展名)
-i或--image
:目标图片路径,可以相对路径也可以绝对路径。
-t或--numThread
:线程数量。
-p或--padding
:图像预处理,在图片外周添加白边,用于提升识别率,文字框没有正确框住所有文字时,增加此值。
-s或--maxSideLen
:按图片最长边的长度,此值为0代表不缩放,例:1024,如果图片长边大于1024则把图像整体缩小到1024再进行图像分割计算,如果图片长边小于1024则不缩放,如果图片长边小于32,则缩放到32。
-b或--boxScoreThresh
:文字框置信度门限,文字框没有正确框住所有文字时,减小此值。
-o或--boxThresh
:请自行试验。
-u或--unClipRatio
:单个文字框大小倍率,越大时单个文字框越大。此项与图片的大小相关,越大的图片此值应该越大。
-a或--doAngle
:启用(1)/禁用(0) 文字方向检测,只有图片倒置的情况下(旋转90~270度的图片),才需要启用文字方向检测。
-A或--mostAngle
:启用(1)/禁用(0) 角度投票(整张图片以最大可能文字方向来识别),当禁用文字方向检测时,此项也不起作用。
-h或--help
:打印命令行帮助。
-G或--GPU
:尝试使用gpu进行计算,-1(使用CPU)/0(使用GPU0)/1(使用GPU1)/...,GPU选择失败时,则使用CPU进行计算。
关于内存泄漏与valgrind
- 项目根目录的valgrind-memcheck.sh用来检查内存泄漏(需要debug编译)。
- valgrind-memcheck.txt是demo在linux平台的检查报告。
- 报告中的"possibly lost"均发生在第三方库,possibly lost可能不一定是泄露,暂时不管。