Open idekazuki opened 5 years ago
一言で言うと 一人称動画における行動認識において、appearance-based streamとmotion-based streamの2つのstreamを共同学習するtwin stream networkを提案。
論文リンク http://www.cs.cmu.edu/~kkitani/pdf/MFK-CVPR2016.pdf
著者・所属機関
投稿日時 概要 一人称動画における行動認識において、appearance-based streamで手の位置を把握し、手の近くにあるオブジェクトを識別する。motion-based streamではモーション情報を分析する。この2つのstreamを共同学習するtwin stream networkを提案。損失関数として動作、物体、活動の3つを全体損失として計算することで1つのネットワークで同時学習が可能になった。 新規性・差分 手法 結果 ベンチマークに対して平均6.6%の精度向上 object,action,activityを共同学習するとaction,objectdの認識精度がそれぞれ30%,14%上昇。 コメント
一言で言うと 一人称動画における行動認識において、appearance-based streamとmotion-based streamの2つのstreamを共同学習するtwin stream networkを提案。
論文リンク http://www.cs.cmu.edu/~kkitani/pdf/MFK-CVPR2016.pdf
著者・所属機関
投稿日時 概要 一人称動画における行動認識において、appearance-based streamで手の位置を把握し、手の近くにあるオブジェクトを識別する。motion-based streamではモーション情報を分析する。この2つのstreamを共同学習するtwin stream networkを提案。損失関数として動作、物体、活動の3つを全体損失として計算することで1つのネットワークで同時学習が可能になった。 新規性・差分 手法 結果 ベンチマークに対して平均6.6%の精度向上 object,action,activityを共同学習するとaction,objectdの認識精度がそれぞれ30%,14%上昇。 コメント