Open tkuri opened 3 years ago
動画の顕著性予測を超軽量(メモリ0.68MB)かつ超高速(10106fps@GPU)で行う。入力を低解像度にしつつ畳み込みはdepth-wiseベース。ただし単純に学習するとさすがに性能が出ないので、時空間的特徴を抽出できる知識蒸留を提案・利用。従来のモデルよりも206倍高速で性能が同等。
https://ojs.aaai.org//index.php/AAAI/article/view/6710
未確認。
論文概要
動画の顕著性予測を超軽量(メモリ0.68MB)かつ超高速(10106fps@GPU)で行う。入力を低解像度にしつつ畳み込みはdepth-wiseベース。ただし単純に学習するとさすがに性能が出ないので、時空間的特徴を抽出できる知識蒸留を提案・利用。従来のモデルよりも206倍高速で性能が同等。
https://ojs.aaai.org//index.php/AAAI/article/view/6710
Code
未確認。