Open bestbzw opened 3 years ago
您好,我在ReCo上用xx_large训练的时候发现模型的loss一直不下降,请问您的超参数是如何设置的?是否加了warmup,dropout等策略?
使用LAMB优化器,lr设置小一点
您好,我在ReCo上用xx_large训练的时候发现模型的loss一直不下降,请问您的超参数是如何设置的?是否加了warmup,dropout等策略?