shenyunhang / APE

[CVPR 2024] Aligning and Prompting Everything All at Once for Universal Visual Perception
https://arxiv.org/abs/2312.02153
Apache License 2.0
459 stars 28 forks source link

文本特征提取 #15

Open nhw649 opened 6 months ago

nhw649 commented 6 months ago

作者你好,我拜读了您的文章,有一些不太理解的地方想请你指教。对于coco数据集仅有类别,如何得到句子特征,是构建一个类似于“a photo of xxx”的prompt吗?我对grounding任务不太熟悉,那grounding是如何构建单词特征呢?是取所有类别吗?

shenyunhang commented 6 months ago

感谢您的关注。 对于文本特征提取:

  1. detection任务,直接把每个类别当作一个句子,相当于直接提取类别的特征,没有加前缀和后缀。这部分代码在这里
  2. grounding任务,提取gt里的句子的特征,同时再加一些其他句子做负类。这部分代码在这里
nhw649 commented 6 months ago

感谢您的关注。 对于文本特征提取:

  1. 检测任务,直接把每个类别当作一个句子,相当于直接提取类别的特征,没有加前缀和后缀。这部分代码在这里
  2. grounding任务,提取gt里的句子的特征,同时再加一些其他句子做负类。这部分代码在这里

明白了,谢谢回复。