Closed shunk031 closed 6 years ago
https://arxiv.org/abs/1804.02391
画像認識に対して学習可能なattention機構をCNNに導入し、ベースラインを超える精度を実現している。Attentionを計算する場合にクエリが必要な画像キャプションやVQAに対して、本研究ではattentionを推定するために大局的な画像表現を利用し、分類問題においてもattentionを導入可能にした。
Learn to Pay Attention - Paper Survey
https://arxiv.org/abs/1804.02391