Open mengpengfei opened 3 years ago
是训练时间太短导致,开始时很快,后面非常慢,比用caffe收敛速度要慢不少,两个数量级了
My training loss was around 2000 at the beginning , then reduced to 4 gradually after 1 epoch.
image = torch.FloatTensor(opt.batchSize, 3, opt.imgH, opt.imgH) text = torch.IntTensor(opt.batchSize 5) 第一行,3应该改成1,因为train.py里面初始化模型用的1通道,然后第二个opt.imgH应该改为opt.imgW,然后text我觉得应该要大于你的序列长度才可以,我改为opt.batchSize 10z,最后使用的是adadelta,初始学习率调整到0.1,就能迅速收敛,如果使用默认学习率直接陷入局部最优,跳不出来,loss一直为17左右
自己训练模型不收敛怎么回事啊, loss从90多下降到15左右时,一直在15附近徘徊,识别率为0