ViG与transformer的区别

huawei-noah / Efficient-AI-Backbones

Efficient AI Backbones including GhostNet, TNT and MLP, developed by Huawei Noah's Ark Lab.

4.08k stars 707 forks source link

你好，我想请教下ViG与transformer的本质区别是什么？

在阅读完代码后，我感觉ViG与transformer有很多的相似之处。transformer是根据相似度进行特征的融合与提取，ViG也在做这个事情，只不过在"相似度"的计算上有所区别，显式地增加了相对位置信息；另外一点不同则是在特征融合上有所区别。整体而言，ViG给我的感觉就是增加了一些归纳偏置的transformer。以上是我的一些个人理解，希望您能够告诉我这个问题的正确答案！

huawei-noah / Efficient-AI-Backbones

ViG与transformer的区别 #214