你好，请问训练该模型要多长时间呢？在什么机器上呢? - Githubissues

yinchangchang / ocr_densenet

第一届西安交通大学人工智能实践大赛（2018AI实践大赛--图片文字识别）第一名；仅采用densenet识别图中文字

459 stars 159 forks source link

你好，请问训练该模型要多长时间呢？在什么机器上呢? #13

Open 2018hello opened 5 years ago

2018hello commented 5 years ago

你好，请问训练该模型要多长时间呢？在什么机器上呢?

yinchangchang commented 5 years ago

titan xp，一个晚上就可以了

2018hello commented 5 years ago

好的，谢谢，想问下，为什么分类的时候不用Linear需要用卷积层作为输出呢？请问下如果直接用densenet的去做单字符的话，效果怎么样呢？

yinchangchang commented 5 years ago

Linear是全连接层，会从整张图像特征预测，Conv是从局部特征预测，就识别文字而言，局部特征效果更好，Linear反而会混淆不同文字的特征

DenseNet会差好几个百分点

xiliu commented 5 years ago

titan xp，一个晚上就可以了

你好，我用的是densenet官方预训练模型，训练数据是自己生成的，当字符集为100或1000时（class_num=100,或1000）时，收敛都都很好。当字符集扩大到6863时，训练7小时（2块1080ti）也未见收敛，batch_size =32 ,lr=0.001,loss一直在0.1-0.2之间。

请问可能会是什么原因？

期待你的回复，非常感谢