Open Ulricman opened 2 years ago
你好,请问训练过程中loss变化比较剧烈是什么原因呢? 还有就是,想请教以下,如果自己把代码改成batch_size>1的情况,工程量大不大?(还没仔细看代码)
我跑了很多不同的代码 loss的波动都很剧烈 而且下降特别快
我觉得可能是因为batch_size过小导致的?我跑的其中一个代码的batch_size=4, loss变化就没那么剧烈。
你好,请问训练过程中loss变化比较剧烈是什么原因呢? 还有就是,想请教以下,如果自己把代码改成batch_size>1的情况,工程量大不大?(还没仔细看代码)