BinaryConnect: Training Deep Neural Networks with binary weights during propagations

0. 論文

Matthieu Courbariaux, Yoshua Bengio, Jean-Pierre David

NNの重みをバイナリ化（-1, 1）

順伝播で重みWをバイナリ化してWbとする更新時にWbを使った勾配でWを更新するそのときに（-1, 1）でクリップ学習自体はWつまり実数で行う

BatchNorm使用

Wを更新するので、バイナリ化での誤差が蓄積しない

バイナリ化することで乗算を加算にできる

重みをバイナリ化すると正則化の効果が出るクリップすることでパラメータが発散しないようにしている

MNIST、CIFAR-10、SVHNでバイナリ化なしとほぼ同等の性能