Open Maggie1998 opened 9 months ago
MixFormerV2和MixFormer在模型结构上有哪些相同和不同呢?
最主要的区别是预测head不同,v2不再采用之前的corner head, 而是通过添加4个可学习的token,通过在backbone中跟search和template tokens进行交互提取内容和位置信息,最后直接利用mlp head来预测top bottom left right四个位置。
想请教一下,head在学习的过程中只能通过蒸馏来吗?
MixFormerV2和MixFormer在模型结构上有哪些相同和不同呢?