INFO

author

Krishna Kumar Singh, Yong Jae Lee

affiliation

University of California, Davis

conference

ICCV 2017

link

pdf 実装

概要

入力画像の一部をランダムに隠すことで，イメージレベルのラベルのみの弱教師あり学習で object localization の精度を向上させた．また，行動認識のタスクにも取り組んでいる．既存研究の CAM(#24)では，discriminative な領域しか学習出来なかったが，本研究ではそれだけでなく関連する領域すべてを学習することが可能になった．上図は既存研究との比較．

提案手法

サイズが H × W × 3の入力画像を，固定サイズ S×Sのパッチでグリットに分割する．これらのグリットを確率 p でランダムに隠し，ネットワークに分類問題を学習させる．パッチの隠し方はエポックごとに変えていて，これによって物体に関連する複数の領域を学習することができる．ネットワークの基本構造は，CAM(#24)で用いられているものと同じ．パッチで隠された部分はデータセットの画像全部のピクセル値の平均を用いて学習を行っている．