Open naoymd opened 3 years ago
Jingwen Wang, Lin Ma, Wenhao Jiang
AAAI2020
pdf
図
タスク Temporal Moment Retrieval
問題点 スライディングウィンドウ方式では様々な時間幅を持つタイムスタンプをカバーし切れない また,計算コストも高く,無駄な処理が多い 文章との相互関係をより良く捉える必要がある
提案手法
LSTMでvideo(v_t) とquery(q_j) の特徴抽出
各フレームの隠れ層と各単語の隠れ層から認識に有効な重みづけを作成(attention map)
attention mapから各フレームごとにattentionされた文章特徴量を算出
attentionされた文章特徴と動画特徴をconcatしたinteraction特徴量をLSTMで算出
Contextual Integration Module
Localization Module
Loss
Anchorサブモジュールの理解が浅い
論文情報
著者
Jingwen Wang, Lin Ma, Wenhao Jiang
投稿先
AAAI2020
論文のリンク
pdf
概要
図
タスク Temporal Moment Retrieval
問題点 スライディングウィンドウ方式では様々な時間幅を持つタイムスタンプをカバーし切れない また,計算コストも高く,無駄な処理が多い 文章との相互関係をより良く捉える必要がある
提案手法
LSTMでvideo(v_t) とquery(q_j) の特徴抽出
各フレームの隠れ層と各単語の隠れ層から認識に有効な重みづけを作成(attention map)
attention mapから各フレームごとにattentionされた文章特徴量を算出
attentionされた文章特徴と動画特徴をconcatしたinteraction特徴量をLSTMで算出
Contextual Integration Module
Localization Module
Loss
課題・展望など
Anchorサブモジュールの理解が浅い
次に読んでみたい関連論文