YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras
Apache License 2.0
2.73k stars 1.08k forks source link

Densenet 训练val_loss 偏高 #199

Open WYanNuo opened 5 years ago

WYanNuo commented 5 years ago

[我在使用自己准备的数据集(64w)训练时,准确率只能达到95%,val_loss的值是1.1971却很高,不知道为什么,求作者指点

@YCG09

YCG09 commented 5 years ago

数据集质量不太好,训练集和验证集样本偏差比较大

WYanNuo commented 5 years ago

嗯嗯 谢谢

an1018 commented 5 years ago

@YCG09 @WYanNuo 你好,也遇到上述问题,请问解决了吗 1)数据质量不太好是模糊吗,2)偏差比较大是指样本分布不一样,还是数据不平衡呢 下面是我生成的数据 image 训练过程(自己的数据,800W): image