有什么办法把llm部分切换到hf上的qwen2吗？

Ucas-HaoranWei / Vary-toy

Official code implementation of Vary-toy (Small Language Model Meets with Reinforced Vision Vocabulary)

565 stars 41 forks source link

Open shifan3 opened 4 months ago

shifan3 commented 4 months ago

如果要用hf的qwen2，应该参照vary_opt修改还是参照vary_toy_qwen1_8修改呢？以及，如何使用其他的llm模型，例如llama2

Gary-code commented 4 months ago

我觉得这份代码非常不好修改LLM模型，由于作者是继承了QWenModel来写的，并没有明确定义language_model这个模块，导致如果修改了LLM的话预训练的vision_tower等参数非常难导入。