关于论文中指标的一个问题

YifanXu74 / MQ-Det

Official PyTorch implementation of "Multi-modal Queried Object Detection in the Wild" (accepted by NeurIPS 2023)

Apache License 2.0

256 stars 12 forks source link

关于论文中指标的一个问题 #5

Open Baboom-l opened 10 months ago

Baboom-l commented 10 months ago

您的论文中GLIP-T在OdinW13上zero-shot的AP值和GLIP论文中不一致，是有设置上的差异吗 MQ-DET中 1697160276149 GLIP论文中 1697160162429

Baboom-l commented 10 months ago

同时还想请教一下few-shot setting中，是只微调GCP吗？还是会微调所有参数？

YifanXu74 commented 10 months ago

@Baboom-l 哈喽， Q1: “您的论文中GLIP-T在OdinW13上zero-shot的AP值和GLIP论文中不一致，是有设置上的差异吗？”

A: 不是设置差异的问题哈，这里是直接加载官方权重复现的结果，并且这个指标GLIP官方github开源的模型权重差不多。

Q2: “few-shot setting中，是只微调GCP吗？还是会微调所有参数？”

这两种方式效果都不错，具体可见附录里的第A.3节，文中的结果是只微调GCP的，微调所有参数效果会更好。

Baboom-l commented 10 months ago

感谢您的回复，我还有一些小问题请教一下，finetuneFree的设置时，是只在o365上训练过GCP吗？我观察到部分ODinw里少部分数据集加了visual query性能反而下降，这部分原因不知道您有没有探索过(例如在Shellfish 上G-DINO-T zero-shot我试过能到0.344)。

YifanXu74 commented 10 months ago

感谢您的回复，我还有一些小问题请教一下，finetuneFree的设置时，是只在o365上训练过GCP吗？我观察到部分ODinw里少部分数据集加了visual query性能反而下降，这部分原因不知道您有没有探索过(例如在Shellfish 上G-DINO-T zero-shot我试过能到0.344)。

finetuneFree设置就是直接用o365预训练的模型直接测试；文章只在多模态查询目标检测上迈出了第一步，并没有解决其中的所有问题，关于所提到的现象，目前阶段没有深入探索过哈。