Open 1701000429 opened 2 years ago
step=10000 这个好像不是轮数的意思。每轮是只读取一个batch吗,代码风格和torch官方的train_one_epoch不太一样。 请问 训练轮数=step*batch/训练集张数 吗?
感谢你对我们工作的关注,当时由于GPU资源的限制batchsize不管设置过大,因此为了产生类似batchsize=10的效果,设置了一个每个epoch内的循环迭代,在这个循环类梯度是累加并且不回传,只有当达到batchsize大小的时候梯度回传并且置零。
step=10000 这个好像不是轮数的意思。每轮是只读取一个batch吗,代码风格和torch官方的train_one_epoch不太一样。 请问 训练轮数=step*batch/训练集张数 吗?