yusukekyokawa / paper_list

2 stars 0 forks source link

Learning Visual Representations with Caption Annotations #19

Open yusukekyokawa opened 4 years ago

yusukekyokawa commented 4 years ago

書誌情報

論文リンク

著者/所属機関

conf/journal

year

2020arxiv

どんな論文か?

image-conditioned mas language modeling(ICMLM)の提案論文。 一部分が歯抜けになっている説明文と画像が与えられ、画像から歯抜けの箇所を推定するするタスク。 これまでのVQAのようなタスクよりもより注視箇所が明確になる

新規性

手法

結果

コメント

気になった論文 G.: A simple framework for con￾trastive learning of visual representations.

On the variance of the adaptive learning rate and beyond

Parkhi, O.M., Vedaldi, A., Zisserman, A., Jawahar, C.: Cats and dogs. In: Proc. CVPR (2012) 2