lerogo / aaai24_itr_cusa

Source code of our AAAI 2024 paper "Cross-Modal and Uni-Modal Soft-Label Alignment for Image-Text Retrieval"
29 stars 3 forks source link

数据集 #3

Open Lelege0 opened 8 months ago

Lelege0 commented 8 months ago

训练集的格式是正确的,测试集的格式是错误的【字幕五条放在一起了】,作者能提供一下数据集的标注文件的下载吗?

lerogo commented 8 months ago

训练集的格式是正确的,测试集的格式是错误的【字幕五条放在一起了】,作者能提供一下数据集的标注文件的下载吗?

你好,请问你说的”测试集的格式是错误的【字幕五条放在一起了】“具体是什么意思,数据集的标注文件制作方式请参考:https://github.com/salesforce/ALBEF

lerogo commented 8 months ago

制作好的数据集:https://drive.google.com/drive/folders/19vCLPr9uoR-_HNQ9ViZXVJz6S0fbxaFf?usp=sharing

lerogo commented 8 months ago

注意,该仓库的数据集加载代码和albef有点区别,请查阅数据集加载部分的代码

Lelege0 commented 8 months ago

对的,我用的albef的数据集,他的训练数据集和你的一样,但是测试数据集和验证集格式不一样,今天我跑起来发现报错一看你的测试集和验证集的加载不一样,所以想问问你有没有flickr30k和coco验证集和测试集的标注文件就和你的这个读取方式一致的格式

lerogo commented 8 months ago

对的,我用的albef的数据集,他的训练数据集和你的一样,但是测试数据集和验证集格式不一样,今天我跑起来发现报错一看你的测试集和验证集的加载不一样,所以想问问你有没有flickr30k和coco验证集和测试集的标注文件就和你的这个读取方式一致的格式

制作好的数据集:https://drive.google.com/drive/folders/19vCLPr9uoR-_HNQ9ViZXVJz6S0fbxaFf?usp=sharing

数据集的文件已经上传,请记得替换自己的文件路径,谢谢。有任何问题欢迎联系😁

Lelege0 commented 8 months ago

作者您好,我在您的163邮箱发了邮件,请教一些问题,帮忙回复一下,谢谢!

VcRenOne commented 7 months ago

楼主您复现的这两个参数(scores_i2t, scores_t2i)的shape是怎么样的,我的服务器cuda版本太低了,用不了torch2.0,太难了。 image

lerogo commented 7 months ago

楼主您复现的这两个参数(scores_i2t, scores_t2i)的shape是怎么样的,我的服务器cuda版本太低了,用不了torch2.0,太难了。 image

用conda,可以装对应cuda的torch

VcRenOne commented 7 months ago

楼主您复现的这两个参数(scores_i2t, scores_t2i)的shape是怎么样的,我的服务器cuda版本太低了,用不了torch2.0,太难了。 image

用conda,可以装对应cuda的torch

试过不太行,直接Segmentation fault,最高只能用1.13的