OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.
MIT License
4.38k stars 453 forks source link

无进行任何微调,直接用模型对总的数据集进行测试R@5值为50多,把总数据集切割为train、test和valid后直接测试R@5为10多 #299

Open EasonTuT opened 5 months ago

EasonTuT commented 5 months ago

这是对数据集总的: 13319639d5d44bbd758a74ee4e938d4 这是划分后,对test数据集的:

c448d2c4fbecce4c7a84d5a69758dae

想问一下为什么会这样,按理来说划分之后干扰项应该是降低的了,R@5评分不是应该上升吗?数据集全是1图对1文本的