Open guangqianqin opened 4 years ago
用gpu训练时,将学习率降维10-5,训练了几个epoch后loss就变为nan,但是用cpu训练却没问题。而且gpu无论怎么改变learning rate都不起作用
目前训练集loss是4点多
用gpu训练时,将学习率降维10-5,训练了几个epoch后loss就变为nan,但是用cpu训练却没问题。而且gpu无论怎么改变learning rate都不起作用