lerogo / aaai24_itr_cusa

Source code of our AAAI 2024 paper "Cross-Modal and Uni-Modal Soft-Label Alignment for Image-Text Retrieval"
29 stars 3 forks source link

关于{}_unicom.npy文件 #4

Open zhw0516 opened 7 months ago

zhw0516 commented 7 months ago

大佬,由于网络问题一直不能下载api的模型,您方便提供一下coco和flickr的{}_unicom.npy文件吗谢谢!

lerogo commented 7 months ago

你好,coco数据集生成的unicom.py这个文件约15GB,flickr生成的约5GB,实在是太大了,没法传;请参考之前的issue自行生成。 有任何问题欢迎联系,谢谢。

zhw0516 commented 7 months ago

好的谢谢!

zhw0516 commented 7 months ago

请问您提到的forward_features是哪里的呀? 我用ViT-L/14生成(1,768)维度特征可以吗?

lerogo commented 7 months ago

在unicom源码里面,你可以找到这个函数。

我所知的 @Lelege0 已经把我们的方法用在他的方法里,并提点了;

你生成768维的应该区别不大,请自行调试参数。不过需要多试试

200084 commented 6 months ago

楼主请问你解决了吗?我是把模型文件下载下来了,但是不知道怎么生成复现需要的特征