Closed rela0426 closed 2 years ago
能帮忙解释一下gradient_acc参数嘛 ==loss /= self.config.gradient_acc==代码中,用到了gradient_acc参数,所以不太明白这句代码的意思。
gradient_acc
你好,这个参数表示梯度累积的次数,帮助在计算资源(如显存)有限的情况下实现与较大batch size等价的训练过程。
能帮忙解释一下
gradient_acc
参数嘛 ==loss /= self.config.gradient_acc==代码中,用到了gradient_acc
参数,所以不太明白这句代码的意思。