Closed songzhonghao closed 4 years ago
确实可以从头训练但是相比预训练从头训练一般有两个问题个问题 1、训练速度很慢。 2、如果没有梯度稳定的机制从头训练无法达到与训练的精度。 你可以参照一下何凯明发过的一篇文章,主要是讲预训练和直接训练的区别的。 论文:Rethinking ImageNet Pre-training
确实可以从头训练但是相比预训练从头训练一般有两个问题个问题 1、训练速度很慢。 2、如果没有梯度稳定的机制从头训练无法达到与训练的精度。 你可以参照一下何凯明发过的一篇文章,主要是讲预训练和直接训练的区别的。 论文:Rethinking ImageNet Pre-training