MiniCPM-Llama3-V 2.5 全参数微调最小的显存需求

Millie-Xu commented 2 weeks ago

No response

针对 MiniCPM-Llama3-V 2.5，我使用两张2张v100或者4张v100，batchsize设置为1，deepspeed zero3配置，并尽可能将所有参数放置在cpu上，仍然显示显存不够，请问该模型全参数微调所需的最小显存需求是什么？

No response

- OS:
- Python:
- Transformers:
- PyTorch:
- CUDA (`python -c 'import torch; print(torch.version.cuda)'`):

No response

yihp commented 1 week ago

@Millie-Xu offload到cpu都不够吗？另外请问您使用的是什么微调脚本呢？

Millie-Xu commented 1 week ago

你好，我已经解决啦，谢谢

todaydeath commented 5 days ago

你好，我已经解决啦，谢谢请问你是怎么解决的呢？最终占用了多少显存？

Millie-Xu commented 4 days ago

你好，我已经解决啦，谢谢请问你是怎么解决的呢？最终占用了多少显存？

用了8张V100，显存差不多占满了

LDLINGLINGLING commented 17 hours ago

那你应该是全量微调对吧

OpenBMB / MiniCPM-V