GlideNet: Global, Local and Intrinsic Based Dense Embedding NETwork for Multi-Category Attributes Prediction

論文概要

画像中の物体の属性（色・形・状態・行動等）を予測する。3つの異なる特徴抽出器を利用し、各特徴抽出器の適切な重みを学習するために自己注意の手法を採用。3つの異なる特徴抽出器を2つのデータセットにおいてある指標(mR)で従来技術に対して5%以上の向上。