Open gatheluck opened 4 years ago
データセットDの scene representation bias は以下で定義される。
を提案している。
Standard CE Loss
Scene adversarial loss
シーンラベル p はKineticsで事前学習したResNet50をPlaces365を学習したモデルによる分類結果を擬似ラベルとして使用する。
Human mask confusion loss
人間のBBは事前に計算しておいて、BB内のピクセルの平均色で塗りつぶす。
通常の動画が入力の時の目的関数
人間が塗りつぶされた動画が入力の時の目的関数
論文リンク
https://arxiv.org/abs/1912.05534
公開日(yyyy/mm/dd)
2019/12/11 NeurIPS 2019
概要
video representation learning において scene bias を修正する手法を提案。