knok / arxiv-memo

My arxiv papers memo
0 stars 0 forks source link

Dual Vision Transformer #183

Open knok opened 2 years ago

knok commented 2 years ago

Ting Yao, Yehao Li, Yingwei Pan, Yu Wang, Xiao-Ping Zhang, Tao Mei

https://arxiv.org/abs/2207.04976v2

概要

ViTのバックボーンをsemantic担当とpixel担当の2 pathway networkにしたモデル。 実装 https://github.com/yehli/imagenetmodel