YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras
Apache License 2.0
2.74k stars 1.08k forks source link

请问自己构建数据集,如何实现“每个样本固定10个字符,字符随机截取自语料库中的句子”? #361

Open ybdesire opened 4 years ago

ybdesire commented 4 years ago

自己构建的数据集,无法满足每个样本固定10个字符。 请问用什么方法/项目,能做到把您提供的百度网盘中的Chinese_dataset\images剪裁为固定10个字符的训练集呢?