Closed shunk031 closed 7 years ago
学習中にsoftmax後の活性化状態がサチると勾配の伝達を妨げ、悪い局所解に落ちる要因となる。そのため、fc -> add noise -> softmax とすることで、サチりずらくすると良い局所解に収束し汎化性能もあがる。 https://twitter.com/asam9891/status/900250424158044160
学習時にsoftmaxへの入力に対して効果的にノイズを加えることで活性化状態の飽和を防ぎ,モデルの汎化性能を上げるNoisy Softmaxを提案.
https://arxiv.org/abs/1708.03769v1