Open Hkaisense opened 2 months ago
3090报内存不够?有大师试过吗?
全量大概需要30G左右的GPU memory 可以在加载AutoModelForCausalLM.from_pretrained的时候引入参数torch_dtype=torch.float16,这样大概需要11G的GPU memory就可以加载了
AutoModelForCausalLM.from_pretrained
torch_dtype=torch.float16
A100 试了下没问题
3090报内存不够?有大师试过吗?