OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.
MIT License
4.21k stars 439 forks source link

关于跨模态检索的召回率疑问,请大佬解答一番 #264

Open 954028118 opened 5 months ago

954028118 commented 5 months ago

为什么文搜图的召回率和图搜文的召回率不相等啊,抽完特征之后图像特征和文本特征不是都固定了吗,文搜图和图搜文计算得到的相似度不应该是一致的吗,为什么文搜图的召回率和图搜文的召回率不相等呢?

yangapku commented 5 months ago

您好,您可以具体参看代码中的计算逻辑哈,主要是图文对往往是一对多或者多对一关系哈,对于这种情况下,两者的召回率是不等的