Open shifan3 opened 4 months ago
如果要用hf的qwen2,应该参照vary_opt修改还是参照vary_toy_qwen1_8修改呢? 以及,如何使用其他的llm模型,例如llama2
我觉得这份代码非常不好修改LLM模型,由于作者是继承了QWenModel来写的,并没有明确定义language_model这个模块,导致如果修改了LLM的话预训练的vision_tower等参数非常难导入。
如果要用hf的qwen2,应该参照vary_opt修改还是参照vary_toy_qwen1_8修改呢? 以及,如何使用其他的llm模型,例如llama2