Open jqsun98 opened 5 months ago
您好,您在这个repo的首页提到了用finetuned CLIP提取视频特征,finetune时候用的是CLIP4CLIP的方式,请问这个finetuned CLIP checkpoint可以提供一下吗?
谢谢!
抱歉,过了太久了,我刚才在网盘里又找了一下还是没找到,但是CLIP4CLIP的权重是使用它们方法在MSR-VTT数据集上训练后就能得到。
好的,谢谢您了!
您好,您大概还记得当时用CLIP4CLIP代码对CLIP进行finetune的时候用的参数吗?是文章里面默认的吗?我finetune完,提取特征再用您提供的caption模型在MSVD数据集上大概只能得到CIDEr 108,在MSRVTT数据上大概是57。
您好,您在这个repo的首页提到了用finetuned CLIP提取视频特征,finetune时候用的是CLIP4CLIP的方式,请问这个finetuned CLIP checkpoint可以提供一下吗?
谢谢!