chineseocr / chineseocr

yolo3+ocr
MIT License
5.95k stars 1.73k forks source link

请教yolo3和crnn的训练数据 #23

Open xray1111 opened 6 years ago

xray1111 commented 6 years ago

你好!请问用于训练yolov3的文本检测和crnn的识别模型的数据是公开的么?或者有哪些公开的中文语料可以用于训练这两个模型的吗?谢谢!

wenlihaoyu commented 6 years ago

如果完全依靠开源的数据集,可能实现不了这么好的效果,混合了一部分公司业务数据,所有就不方便公开了,还请理解。不过有一部分公开数据集,可以借鉴:http://www.icdar2017chinese.site:5080/dataset/,这个数据集质量还不错,不过也存在少量错误

xray1111 commented 6 years ago

@wenlihaoyu 非常感谢!

Steverdeng commented 6 years ago

请问一下,我测试发现ⅡⅢⅣⅤⅥⅠ这些字很难识别出来,请问我如何在你的基础上增加训练这些类型的字?

gitmessage commented 6 years ago

按照步骤进行了安装(cpu版,无gpu) https://github.com/chineseocr/chineseocr 可以访问:http://loaclhost:8080/ocr 上传文件后报错。错误如下,请问如何解决?多谢!

10.211.55.2:64086 - - [22/Sep/2018 10:37:18] "HTTP/1.1 POST /ocr" - 500 Internal Server Error Torch not compiled with CUDA enabled

gitmessage commented 6 years ago

opencv dnn直接调用darknet模型,有例子吗。小白用户,这个项目太高深还得照着简单的例子一步步的走。多谢!

wenlihaoyu commented 6 years ago

@gitmessage 详细可以参考opencv相关文档哈