senlinuc / caffe_ocr

主流ocr算法研究实验性的项目,目前实现了CNN+BLSTM+CTC架构
1.26k stars 535 forks source link

关于样本生成的一些疑问 #29

Open kasyoukin opened 6 years ago

kasyoukin commented 6 years ago

您的数据集上都使用了哪些字体?是否每个字在不同字体中都要生成? 如果我要加入一些带下划线的数据,在您的数据集上,应该加多少合适? 噪声是用的什么方法?感觉加的不够,自己想多加点。