Closed lhyscau closed 2 weeks ago
在mola_modeling_llama_hacked.py的第1319行,这里的obalance为false,因此aux_loss并没有加入到loss中进行反向传播
您好,谢谢您对代码的检查!您可以按照我们在readme里的描述,将obalance 设置为True,就可以加入aux_loss到训练之中。 谢谢!
在mola_modeling_llama_hacked.py的第1319行,这里的obalance为false,因此aux_loss并没有加入到loss中进行反向传播