Closed tian969 closed 6 months ago
是使用 xtuner 复现?还是说自己开发了一套新代码准备复现?
在原版LLAVA上改代码进行复现的.
@tian969 https://github.com/InternLM/xtuner/tree/main/xtuner/configs/llava/llama3_8b_instruct_clip_vit_large_p14_336 这个结果,我们只是在指令微调对 vit 进行 lora 微调,其他和官方是一样的。
我推荐你用 xtuner 来训练 llava,因为
我自己尝试复现, 在英文领域表现更低了, 感觉不正常. 我在原版llava上进行的改动, 我只改了对输入进行preprocess的整体逻辑,包括mask targets 这部分和 conversation部分的内容. 请问其他还有啥需要改动的地方嘛?