Open sk142857 opened 1 year ago
硬件环境:RTX 6000 ADA (48GB) *1 内存:512GB 模型:moss-moon-003-base
同样问题
修改 sft.yaml,deepspeed_config: gradient_accumulation_steps: 1 gradient_clipping: 1.0 offload_optimizer_device: cpu offload_param_device: cpu zero3_init_flag: true zero3_save_16bit_model: true zero_stage: 3
把deepspeed offload到CPU上
问题解决
硬件环境:RTX 6000 ADA (48GB) *1 内存:512GB 模型:moss-moon-003-base
正在微调中
修改 sft.yaml,deepspeed_config: gradient_accumulation_steps: 1 gradient_clipping: 1.0 offload_optimizer_device: cpu offload_param_device: cpu zero3_init_flag: true zero3_save_16bit_model: true zero_stage: 3
把deepspeed offload到CPU上
问题解决
硬件环境:RTX 6000 ADA (48GB) *1 内存:512GB 模型:moss-moon-003-base
正在微调中
你好,我想问一下在你的环境下微调,batchsize是多少呀?微调的时候内存占用的峰值是多少呀(均offload到cpu上)?
修改 sft.yaml,deepspeed_config: gradient_accumulation_steps: 1 gradient_clipping: 1.0 offload_optimizer_device: cpu offload_param_device: cpu zero3_init_flag: true zero3_save_16bit_model: true zero_stage: 3 把deepspeed offload到CPU上 问题解决 硬件环境:RTX 6000 ADA (48GB) *1 内存:512GB 模型:moss-moon-003-base 正在微调中
你好,我想问一下在你的环境下微调,batchsize是多少呀?微调的时候内存占用的峰值是多少呀(均offload到cpu上)?
bs = 1 ,deepspeed offload到cpu上,需要大约290GB内存。另,deepspeed不支持多线程,会严重受限于CPU的单核性能
请问推理的时候出现这样的错怎么改呀 moss_cli_demo.py RuntimeError: CUDA out of memory. Tried to allocate 576.00 MiB (GPU 0; 31.75 GiB total capacity; 30.01 GiB already allocated; 548.00 MiB free; 30.02 GiB reserved in total by PyTorch) 这时候并没有deepspeed的参数了
请问推理的时候出现这样的错怎么改呀 moss_cli_demo.py RuntimeError: CUDA out of memory. Tried to allocate 576.00 MiB (GPU 0; 31.75 GiB total capacity; 30.01 GiB already allocated; 548.00 MiB free; 30.02 GiB reserved in total by PyTorch) 这时候并没有deepspeed的参数了 推理时用量化比如int8 int4
硬件环境:
RTX A5000(24GB) * 5
内存:210GB
模型:moss-moon-003-base
训练报错,提示:
请问是参数设置,有什么问题吗?