YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras
Apache License 2.0
2.76k stars 1.08k forks source link

数据集准备 #356

Open 15737939656 opened 4 years ago

15737939656 commented 4 years ago

请问下怎样准备自己的数据,有开源的标注工具吗?

AustinKuture commented 4 years ago

可以去百度公众平台

15737939656 commented 4 years ago

可以去百度公众平台

您好,自己没找到匹配的链接,能麻烦您发送下吗?(目前是通过目标区域检测(craft)检测文本,然后通过比例大小padding之后resize,之后有OCR识别训练样本再人工校验识别错误的)

AustinKuture commented 4 years ago

这个还真不好弄,你需要去百度公众平台,注册成用户

15737939656 commented 4 years ago

ha

这个还真不好弄,你需要去百度公众平台,注册成用户

好的,谢谢~

fire717 commented 4 years ago

你说的数据集是检测的还是识别的啊? 检测的话随便找一个目标检测标注工具就行,开源的很多,打框后用它的脚本转成ctpn要的形式就行。 识别的话自己先裁剪好,然后直接修改图片名为字符串名,这样就可以标注。