wisteria2gp / DataScience_survey

0 stars 0 forks source link

Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding #6

Open wisteria2gp opened 4 years ago

wisteria2gp commented 4 years ago

一言でいうと

4 にでてきたモデル構造の1つ

論文リンク

https://arxiv.org/abs/1606.01847

著者/所属機関

Akira Fukui, Dong Huk Park, Daylen Yang, Anna Rohrbach, Trevor Darrell, Marcus Rohrbach

投稿日付(yyyy/MM/dd)

2016/06/06 6 Jun 2016

概要

新規性・差分

手法

スクリーンショット 2020-02-17 0 43 38

結果

コメント