xiaofengShi / CHINESE-OCR

[python3.6] 运用tf实现自然场景文字检测,keras/pytorch实现ctpn+crnn+ctc实现不定长场景文字OCR识别
2.92k stars 964 forks source link

我配置了两天多,终于在windows10+anaconda3+python3.6+pytorch下配置好了,不过速度和准确率感人。 #162

Open QiTianDaShengDaShi opened 3 years ago

QiTianDaShengDaShi commented 3 years ago

我配置了两天多,终于在windows10+anaconda3+python3.6+pytorch下配置好了,主要是三点吧。 1、安装pytroch gpu版本,并验证通过。 2、可以仔细看博主的setup.sh中有个sh make.sh,因此需要找到那个make.sh中有个python setup.py build_ext --inplace,应该是要生成一个bbox.py和cython_nms.py。但是由于经常编译不成功,可以参考:https://github.com/xiaofengShi/CHINESE-OCR/issues/130 ,将bbox.py和cython_nms.py重新保存。 3、下载相关资源,主要是ctpn-checkpoint 和角度模型modelAngle.h5、ocr0.2.h5等资源,可以参考:https://www.jianshu.com/p/58671f61e886,然后坐着很多文件路径用的自己的绝对路劲,可以将路径进行全部的查找替换成你自己的路劲,比如可以搜索:“xiaofeng”等关键词

不过速度和准确率感人。 如下图所示,运行了./test/4.jpg图片,耗时300多秒,显卡是GTX2060,不知道是不是我电脑问题, image

image

zhk221225 commented 3 years ago

image image 用的以前租的一个服务器跑的,单核cpu,关了角度那个18s

john012343210 commented 3 years ago

我是直接放电脑pdf格式文件进去 准确率特别高

这种实物图片 估计准确率怎么都不会太高 或者你自己先放一些去train

Dyna2015 commented 3 years ago

您好,请问如何只对OCR(crnn)部分进行验证?

ZZHHogan commented 3 years ago

感觉你这个准确率还可以啊,也挺高的了