megvii-research / MOTRv2

[CVPR2023] MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object Detectors
Other
343 stars 44 forks source link

关于网络结构设计的疑问 #52

Open lebron-2016 opened 10 months ago

lebron-2016 commented 10 months ago

尊敬的作者您好:

特别感谢您在多目标跟踪领域做出的贡献。

想请教一下MOTRv2结构图中Y0和Y1应该如何理解呢?为什么第一帧的anchors与偏移量相加后要全部与第二帧的YOLOX检测结果拼接作为第二帧的anchors呢?这样再对所有的anchors计算偏移然后向后传递不就会不断累积、产生大量重叠的框,其作用是什么?

image

希望得到您的解答!!万分感谢!!