OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.
MIT License
4.21k stars 439 forks source link

使用默认超参数在COCO-CN上微调,无法收敛 #252

Open xiuxiuxius opened 7 months ago

xiuxiuxius commented 7 months ago

你好作者,我使用coco-cn_finetune_vit-b-16_rbt-base.sh在你们提供的处理好的COCO-CN上做微调,查看微调过程发现没有收敛,而MUGE和Flickr使用默认参数微调是收敛的,请问问题可能出在哪里呢?

仅修改了两个字段

GPUS_PER_NODE=1
export MASTER_ADDR=localhost

下面是三个数据集上的微调折线图 image image image

附上我在COCO-CN上微调的log文件 out_2024-01-11-09-33-24.log