yinchangchang / ocr_densenet

第一届西安交通大学人工智能实践大赛(2018AI实践大赛--图片文字识别)第一名;仅采用densenet识别图中文字
455 stars 159 forks source link

请问下怎么使用你最新的预训练模型呢? #5

Open xtanitfy opened 5 years ago

xtanitfy commented 5 years ago

我直接使用你的代码和数据,训练了一晚上精度只有70%,后边精度突然变为了0,我怀疑是预训练的模型没有记载你最新的模型,请问我该怎么做呢?多谢你分享的源码!

xtanitfy commented 5 years ago

可能是因为我训练的时候断掉了网络导致没有下载预训练模型的原因,我再试试看

yinchangchang commented 5 years ago

先加载torchvision的densenet预训练模型,这样会有一个良好的初始化参数,让网络更容易训练的

xtanitfy commented 5 years ago

请问训练求loss的时候,你的每个8×8的小方格的标签是怎么打上并用分类的交叉熵求分类损失的?

yinchangchang commented 5 years ago

最后在输出的label上,用了一个max pooling,就可以算loss了