Open yangtian6781 opened 2 years ago
作者您好,我用batch=8,lr=(1.25e-4)/2的组合,跑了70轮,loss在1.38左右,是否可以认为model已经收敛,您的batch和lr是什么样的组合呢?
你可以设置单独validation set 来确保模型收敛到最低点
作者您好,我用batch=8,lr=(1.25e-4)/2的组合,跑了70轮,loss在1.38左右,是否可以认为model已经收敛,您的batch和lr是什么样的组合呢?