idekazuki / -Paper-summary

論文をまとめていきたい
0 stars 0 forks source link

Going Deeper into First-Person Activity Recognition #5

Open idekazuki opened 5 years ago

idekazuki commented 5 years ago

一言で言うと 一人称動画における行動認識において、appearance-based streamとmotion-based streamの2つのstreamを共同学習するtwin stream networkを提案。

論文リンク http://www.cs.cmu.edu/~kkitani/pdf/MFK-CVPR2016.pdf

著者・所属機関

投稿日時 概要 一人称動画における行動認識において、appearance-based streamで手の位置を把握し、手の近くにあるオブジェクトを識別する。motion-based streamではモーション情報を分析する。この2つのstreamを共同学習するtwin stream networkを提案。損失関数として動作、物体、活動の3つを全体損失として計算することで1つのネットワークで同時学習が可能になった。 新規性・差分 手法 結果 ベンチマークに対して平均6.6%の精度向上 object,action,activityを共同学習するとaction,objectdの認識精度がそれぞれ30%,14%上昇。 コメント