inferece如何使用多张V100代替一张A100？

DAMO-NLP-SG / Video-LLaMA

[EMNLP 2023 Demo] Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding

BSD 3-Clause "New" or "Revised" License

2.77k stars 255 forks source link

if ckpt_path: print("Load first Checkpoint: {}".format(ckpt_path)) ckpt = torch.load(ckpt_path, map_location="cpu") msg = model.load_state_dict(ckpt['model'], strict=False) ckpt_path_2 = cfg.get("ckpt_2", "")
if ckpt_path_2: print("Load second Checkpoint: {}".format(ckpt_path_2)) ckpt = torch.load(ckpt_path_2, map_location="cpu") msg = model.load_state_dict(ckpt['model'], strict=False)

LlamaForCausalLM.from_pretrained的参数device_map改成auto后，上边load_state_dict过程，依旧load到一张卡导致OOM吧？

DAMO-NLP-SG / Video-LLaMA

inferece如何使用多张V100代替一张A100？ #107