THUDM / CogVLM2

GPT4V-level open-source multi-modal model based on Llama3-8B
Apache License 2.0
1.42k stars 77 forks source link

微调glm-4v-9B时的lora-target应该写什么? #119

Open Qinger27 opened 6 days ago

Qinger27 commented 6 days ago

使用peft_lora.py 运行,报错ValueError: Target modules {'vision_expert_query_key_value'} not found in the base model. Please check the target modules and try again. 请问对于 glm-4v-9B 模型,这个参数应该是什么?

zRzRzRzRzRzRzR commented 5 days ago

emm 这个是cogvlm的吧,9b的话或许你应该根据9B的代码看看? 目前我还没做到这个部分的适配

Qinger27 commented 5 days ago

glm-4v-9B 不是你们发布的吗?不好意思啊,我以为你们是一个team😬

zRzRzRzRzRzRzR commented 4 days ago

这两个模型有一定的差距,glm-4v应该少了视觉专家的部分,glm-4v-9b应该是用query_key_value,而且这两个代码应该不兼容,所以估计要重新做的

Qinger27 commented 3 days ago

请问大概什么时候可以给一个finetune的脚本呀?非常期待你们的工作~