Ultrafast Video Attention Prediction with Coupled Knowledge Distillation

論文概要

動画の顕著性予測を超軽量(メモリ0.68MB)かつ超高速(10106fps@GPU)で行う。入力を低解像度にしつつ畳み込みはdepth-wiseベース。ただし単純に学習するとさすがに性能が出ないので、時空間的特徴を抽出できる知識蒸留を提案・利用。従来のモデルよりも206倍高速で性能が同等。

未確認。