woodfrog / maptracker

Code for paper "MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping", ECCV 2024 (Oral)
https://map-tracker.github.io/
Other
144 stars 10 forks source link

您好,小白想咨询一下关于代码理解的问题 #11

Closed 304886938 closed 2 months ago

304886938 commented 3 months ago

您好, 按您论文中的意思,鸟瞰图记忆缓存器中已经存储了历史帧的鸟瞰图信息。 但是在代码中,看起来还需要将前几帧的数据再经过Backbone、Neck的处理,然后再对当前帧的环视相机特征进行处理。 按我的理解,应该不需要再处理一遍了,历史帧信息可以直接和当前帧信息进行融合。 请问是我的理解有问题吗? 希望您有空能回复我,非常感谢您!

woodfrog commented 3 months ago

可能什么地方理解有点问题。是不需要重复处理前几帧的数据的,每一帧的数据只会过一次backbone和bev encoder。

304886938 commented 3 months ago

谢谢您的回复! 我还想请问下,这一部分代码的作用是什么呢? forword

woodfrog commented 3 months ago

谢谢您的回复! 我还想请问下,这一部分代码的作用是什么呢? forword

这部分是训练的代码。每个iteration会随机sample一个video clip用来训练,我们用的clip长度是5帧(所以你这个截图里num_prev_frames=4)。这5帧会一步步rollout,每一帧只会过一次backbone。

304886938 commented 3 months ago

好的好的,谢谢您