Open qyc-98 opened 2 weeks ago
修改了huggingface上我们模型的resampler和minicpmv模型文件,这个pr需要和huggingface的pr一起提交,主要解决了目前zero3需要强制聚拢参数的问题,以及主模型运行时某些变量没有及时被deepspeed发送到对应的显卡上导致minicpmv2不能使用zero3算法微调
hey, i wonder why is this PR in pending.
修改了huggingface上我们模型的resampler和minicpmv模型文件,这个pr需要和huggingface的pr一起提交,主要解决了目前zero3需要强制聚拢参数的问题,以及主模型运行时某些变量没有及时被deepspeed发送到对应的显卡上导致minicpmv2不能使用zero3算法微调