Open yiskw713 opened 5 years ago
Krishna Kumar Singh, Yong Jae Lee
University of California, Davis
ICCV 2017
pdf 実装
入力画像の一部をランダムに隠すことで,イメージレベルのラベルのみの弱教師あり学習で object localization の精度を向上させた.また,行動認識のタスクにも取り組んでいる.既存研究の CAM(#24)では,discriminative な領域しか学習出来なかったが,本研究ではそれだけでなく関連する領域すべてを学習することが可能になった.上図は既存研究との比較.
サイズが H × W × 3の入力画像を,固定サイズ S×Sのパッチでグリットに分割する.これらのグリットを確率 p でランダムに隠し,ネットワークに分類問題を学習させる.パッチの隠し方はエポックごとに変えていて,これによって物体に関連する複数の領域を学習することができる.ネットワークの基本構造は,CAM(#24)で用いられているものと同じ.パッチで隠された部分はデータセットの画像全部のピクセル値の平均を用いて学習を行っている.
object localization においてパッチサイズを比較した時の精度のの比較.
既存手法との比較.Backprop(#25)やCAM(#24)よりも精度が高いことが確認できる.
定量的結果の図.discriminative な領域以外も検出できている.
パッチを隠す確率で比較した表.
パッチサイズ32が最も高い精度だったのに,他の実験ではなんでパッチサイズ56を用いている?
Jan. 31, 2018
INFO
author
Krishna Kumar Singh, Yong Jae Lee
affiliation
University of California, Davis
conference
ICCV 2017
link
pdf 実装
概要
入力画像の一部をランダムに隠すことで,イメージレベルのラベルのみの弱教師あり学習で object localization の精度を向上させた.また,行動認識のタスクにも取り組んでいる.既存研究の CAM(#24)では,discriminative な領域しか学習出来なかったが,本研究ではそれだけでなく関連する領域すべてを学習することが可能になった.上図は既存研究との比較.
提案手法
サイズが H × W × 3の入力画像を,固定サイズ S×Sのパッチでグリットに分割する.これらのグリットを確率 p でランダムに隠し,ネットワークに分類問題を学習させる.パッチの隠し方はエポックごとに変えていて,これによって物体に関連する複数の領域を学習することができる.ネットワークの基本構造は,CAM(#24)で用いられているものと同じ.パッチで隠された部分はデータセットの画像全部のピクセル値の平均を用いて学習を行っている.
検証
object localization においてパッチサイズを比較した時の精度のの比較.
既存手法との比較.Backprop(#25)やCAM(#24)よりも精度が高いことが確認できる.
定量的結果の図.discriminative な領域以外も検出できている.
パッチを隠す確率で比較した表.
comment
パッチサイズ32が最も高い精度だったのに,他の実験ではなんでパッチサイズ56を用いている?
date
Jan. 31, 2018