关于跨模态检索的召回率疑问，请大佬解答一番

OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.

MIT License

4.21k stars 439 forks source link

Open 954028118 opened 5 months ago

954028118 commented 5 months ago

为什么文搜图的召回率和图搜文的召回率不相等啊，抽完特征之后图像特征和文本特征不是都固定了吗，文搜图和图搜文计算得到的相似度不应该是一致的吗，为什么文搜图的召回率和图搜文的召回率不相等呢？

yangapku commented 5 months ago

您好，您可以具体参看代码中的计算逻辑哈，主要是图文对往往是一对多或者多对一关系哈，对于这种情况下，两者的召回率是不等的