deepseek-ai / DeepSeek-V2

DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model
MIT License
3.47k stars 143 forks source link

模型部署困惑 #49

Open ylhou opened 4 months ago

ylhou commented 4 months ago

在A800 8卡机上按照Chat Completion的示例代码加载模型 设置 max_memory = {i: "75GB" for i in range(8)} device_map="sequential" 启动后显存占用集中在0卡~6卡,7卡被完全放空,然后测试的上下文稍长一点,就报显存无法分配了 这是什么原因呢,有人遇到过吗

fw2325 commented 4 months ago

+1

jixiang25 commented 2 months ago

在A800 8卡机上按照Chat Completion的示例代码加载模型 设置 max_memory = {i: "75GB" for i in range(8)} device_map="sequential" 启动后显存占用集中在0卡~6卡,7卡被完全放空,然后测试的上下文稍长一点,就报显存无法分配了 这是什么原因呢,有人遇到过吗