OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.
MIT License
4.32k stars 448 forks source link

图像描述数据集图文特征提取finetune #222

Open kukuhaza opened 10 months ago

kukuhaza commented 10 months ago

你好请问我想使用我的特定中文图像描述数据集finetune此模型,步骤是跟您公开的跨膜态检索里的finetune一样吗? 还是需要改变什么? 谢谢!

Y-HuiMing-Y commented 8 months ago

你好,我也在做图像描述这块,我没有找到源代码里的语言解码器,可以交流一下