Open klaus-duan opened 2 weeks ago
我的测试脚本:
NPROC_PER_NODE=8 \ ASCEND_RT_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \ HCCL_SOME_VARIABLE=value swift infer \ --model_type '/data2/dxc/Qwen1.5-32B-Chat' \ --load_args_from_ckpt_dir true \ --ckpt_dir '/data2/dxc/Qwen1.5-32B-Chat/v17-20240920-141406/checkpoint-6/' \ --load_dataset_config true \ --tensor_parallel_size 8 \ --merge_lora false \ --model_kwargs '{"device_map": ["npu:0", "npu:1", "npu:2", "npu:3", "npu:4", "npu:5", "npu:6", "npu:7"]}' \ --dataset '/data2/dxc/blossom-math-v2/transformed_dataset.jsonl#100'
运行之后显示device_count:8, 但是model_kwargs: {'device_map': 'npu:0'}
device_count:8
model_kwargs: {'device_map': 'npu:0'}
没找到Swift infer和Swift deploy中有关NPU的多显卡设置参数
Swift infer
Swift deploy
我也有同样的问题,虽然挂了4张卡,但是最后只用了npu:0然后内存不够了
用swift infer里的merge-lora功能,合并出来的权重再用其他框架推理,比如mindie
swift infer
merge-lora
mindie
好吧好吧 感谢 黄大佬说等半个月swift3.0出来能支持多卡推理
我的测试脚本:
运行之后显示
device_count:8
, 但是model_kwargs: {'device_map': 'npu:0'}
没找到
Swift infer
和Swift deploy
中有关NPU的多显卡设置参数