CrystalSixone / DSRG

Code for A Dual Semantic-Aware Recurrent Global-Adaptive Network For Vision-and-Language Navigation
MIT License
15 stars 0 forks source link

请问测试集在哪呢? #3

Closed wuxiaofei01 closed 1 year ago

wuxiaofei01 commented 1 year ago

作者你好,我最近在关注你们团队的论文。但是我发现在valid的时候,并不会输出test的数据,但是团队的paper中有test数据,请问是另外进行测试的么?

CrystalSixone commented 1 year ago

test需要上传到online leaderboard获取结果: https://eval.ai/web/challenges/challenge-page/97/overview

wuxiaofei01 commented 1 year ago

感谢作者的回复!

wuxiaofei01 commented 1 year ago

请问一下,object_bbox_v2.json文件是作者预先抽取得到的么?然后,很疑惑的一点是,为什么会有36个item?

wuxiaofei01 commented 1 year ago

请问一下,object_bbox_v2.json文件是作者预先抽取得到的么?然后,很疑惑的一点是,为什么会有36个item?

panorama是36张图片合成的,但是从matterport数据集得到的只有6张图片(包括头顶,脚底),所以很疑惑怎么预先得到36张图片的物体检测?(最后,感谢作者非常好的工作)

CrystalSixone commented 1 year ago

你好,如何获取36张图及特征提取可以参考这个代码:https://github.com/cshizhe/VLN-HAMT/blob/main/preprocess/precompute_img_features_vit.py

wuxiaofei01 commented 1 year ago

感谢回复