Open wonderingtom opened 7 months ago
codebase使用RNN_RELU进行训练时会导致loss爆炸(nan)
可以换成sigmoid看看,relu可能会导致梯度太大,或调整学习率
codebase使用RNN_RELU进行训练时会导致loss爆炸(nan)