yiskw713 / paper_summary

Write summaries of papers I've read in Japanese
10 stars 1 forks source link

DAPs: Deep Action Proposals for Action Understanding #57

Open yiskw713 opened 5 years ago

yiskw713 commented 5 years ago

INFO

author

Victor Escorcia, Fabian Caba Heilbron, Juan Carlos Niebles, Bernard Ghanem

affiliation

conference or year

ECCV 2016

link

pdf

概要

Screenshot from 2019-05-16 18-45-34

動画から時系列方向のaction proposal を検出する Deep Action Proposals (DAPs)を提案. シングルパスでマルチスケールのaction proposal を検出できる.既存研究よりもリコールが高く,134fpsと高速である.

提案手法

Screenshot from 2019-05-16 19-09-50

提案手法は4つのパートに別れている.

  1. Visual Encoder: 動画をエンコードする.エンコードモデルはC3Dを用いている.
  2. Sequence Encoder: C3Dから得られた特徴量をLSTMに入力し,さらに時系列情報を考慮した特徴へとエンコードする.
  3. Localization Module: LSTMの出力から,全結合層を組み合わせて,action proposal の位置と長さを出力する
  4. Prediction: Action proposal に対する確信度を出力する.全結合層とsigmoid関数からなる.

ロスは以下のようになる. action proposal と g.t. のユークリッド距離であらわされる Lmatchと,確信度に対するバイナリクロスエントロピーからなる. Screenshot from 2019-05-16 19-14-41

検証

結果 Screenshot from 2019-05-16 19-13-24

新規性

議論,展望

date

May 16, 2019