Open yiskw713 opened 4 years ago
Jinwoo Choi et al.
Virginia Tech
NeurIPS 2019
pdf pytorch実装
行動認識のタスクにおいて発生する背景バイアス(背景から行動を予測してしまうこと)を軽減するような学習方法を提案した論文. 具体的には3つのロス関数を組み合わせて学習を行っている i) 通常通り動画中の複数フレームからなるクリップに対して,特徴抽出を行い,目的の行動ラベルの確率を最大化させるための cross entropy loss ii) クリップから得られた特徴量に対して,Places365で学習したモデルから得られた soft lable を pseudo lableとしてシーン分類を行わせ,そのpsuedo label の予測できないようにするためにGradient Reversal Layer を通して,学習を行わせる scene adversarial loss. これによりシーンに依存しない特徴量を獲得できるらしい iii) 人間にマスクをつけた動画に対しては行動認識を行えないようにする human mask confusion loss.
他手法との比較
ロス関数のablation study
Apr. 13th, 2020
INFO
author
Jinwoo Choi et al.
affiliation
Virginia Tech
conference or year
NeurIPS 2019
link
pdf pytorch実装
概要
行動認識のタスクにおいて発生する背景バイアス(背景から行動を予測してしまうこと)を軽減するような学習方法を提案した論文. 具体的には3つのロス関数を組み合わせて学習を行っている i) 通常通り動画中の複数フレームからなるクリップに対して,特徴抽出を行い,目的の行動ラベルの確率を最大化させるための cross entropy loss ii) クリップから得られた特徴量に対して,Places365で学習したモデルから得られた soft lable を pseudo lableとしてシーン分類を行わせ,そのpsuedo label の予測できないようにするためにGradient Reversal Layer を通して,学習を行わせる scene adversarial loss. これによりシーンに依存しない特徴量を獲得できるらしい iii) 人間にマスクをつけた動画に対しては行動認識を行えないようにする human mask confusion loss.
検証
他手法との比較
ロス関数のablation study
Comment
date
Apr. 13th, 2020