Open gatheluck opened 4 years ago
通常の方法で学習済みの多クラス分類器の複数の中間層に対して、それぞれの中間層からの出力を入力とした二値分類器(検出器)を取り付ける。ここで、多クラス分類器の重みを固定し、敵対的サンプルと通常のサンプルを区別できるように検出器を学習させる。検出器の学習には binary cross entropy を使用。検出器と分類器両方を同時に攻撃する敵対的サンプルに対する提案手法の脆弱性も評価している。FGSM や JSMA は検出できることができるが、white box の設定では C&W attack で破れることが、「Adversarial Examples Are Not Easily Detected: Bypassing Ten Detection Methods」で報告されている。
論文リンク
公開日(yyyy/mm/dd)
2017/02/14 ICLR 2017
概要
TeX