Ucas-HaoranWei / Vary-toy

Official code implementation of Vary-toy (Small Language Model Meets with Reinforced Vision Vocabulary)
565 stars 41 forks source link

训练的问题 #13

Open duchenzhuang opened 5 months ago

duchenzhuang commented 5 months ago
  1. --model_name_or_path 这里应该是指定qwen 1.8B的path是吧?而不是vary-toy模型的path。。。

  2. 似乎训练代码里好像没加载sam自己的weights哈?我看vary论文里写的是用SAM预训练的ViTDet backbone。但是这个库里训练的时候似乎没有加载weights呢?我尝试下载sam的ckpt,加载起来也不是很顺利。。

    image
  3. Qwen1.8B是用的chat版本,还是非chat版本哈?是用的这个吗?https://huggingface.co/Qwen/Qwen-1_8B

sixgod-666 commented 5 months ago

您好,我也想要训练 请问您的问题解决了吗?