批量归一化 | Alex_McAvoy

https://alex-mcavoy.github.io/artificial-intelligence/deep-learning/network-fundamentals/a0ecfc36.html

【概述】由于在训练神经网络期间前一层的参数发生了变化，这导致了每层输入的分布不同，难以通过较低的学习率和参数初始化来减慢训练速度，同时要训练的具有饱和非线性模型也十分困难，这种现象被称为内部协变量偏移（Internal Covariate Shift）论文 Batch Normalization: Accelerating Deep Network Training by Reducing In

Alex-McAvoy / Gitalk-Comment

批量归一化 | Alex_McAvoy #1055