非常感谢作者~
我目前的情况是,当我使用8张GPU+deepspeed zero3+4bit qlora就会报错
和这个一样:https://github.com/microsoft/DeepSpeed/issues/3775RuntimeError: expected there to be only one unique element in <generator object Init._convert_to_deepspeed_param..all_gather_coalesced.. at 0x7f7019a30890>
在这个讨论串中,作者尝试修改但仍然报错,怀疑deepspeed是不是目前不支持4bit qlora
但是我如果只用一个gpu跑4bit qlora+deepspeed就不会报错
一旦使用多gpu就会跳上面的错误
我看您有提供4bit的量化finetune,但实际默认的参数是使用8bit
想请问是否用成功用两张gpu+deepspeed+4bit qlora成功finetune过?
非常感谢作者~ 我目前的情况是,当我使用8张GPU+deepspeed zero3+4bit qlora就会报错 和这个一样:https://github.com/microsoft/DeepSpeed/issues/3775
RuntimeError: expected there to be only one unique element in <generator object Init._convert_to_deepspeed_param..all_gather_coalesced.. at 0x7f7019a30890>
在这个讨论串中,作者尝试修改但仍然报错,怀疑deepspeed是不是目前不支持4bit qlora 但是我如果只用一个gpu跑4bit qlora+deepspeed就不会报错 一旦使用多gpu就会跳上面的错误 我看您有提供4bit的量化finetune,但实际默认的参数是使用8bit 想请问是否用成功用两张gpu+deepspeed+4bit qlora成功finetune过?