yiskw713 / paper_summary

Write summaries of papers I've read in Japanese
10 stars 1 forks source link

SCSampler: Sampling Salient Clips from Video for Efficient Action Recognition #115

Open yiskw713 opened 4 years ago

yiskw713 commented 4 years ago

INFO

author

Bruno Korbar, Du Tran, Lorenzo Torresani

affiliation

Facebook AI

conference or year

ICCV2019

link

pdf

概要

Screenshot from 2020-01-21 09-00-05

これまで action recognition の分野では,推論時にビデオをクリップ(例えば16フレームを1クリップとして)に分割し,すべてのクリップをモデルに入力,その出力結果の平均値をビデオに対する最終的な出力結果としていた.しかしながら,クリップの中には無駄な情報を含むものもあり,すべてのクリップの結果を平均するのは得策ではないと言える.そこで本研究では,Action Recognitionにおいて,出力結果に大きく寄与するクリップを選択する Salient Clip-Sampler(SCSampler) を提案している.

SCSampler として,visual-based sampler と audio-based sampler の2つを提案している.これらの sampler は,軽量化行動モデル(action classifier),もしくは saliency ranker として学習される.

検証

Screenshot from 2020-01-21 09-16-27

Comment

date

Jan. 21, 2020