Open xiaoyezi320 opened 3 months ago
服务器有3张T4卡,每张T4卡显存16G,codegeex4本地化部署启动至少需要19G左右到显存,启动时却只使用一张卡,报了oom异常,请问下如何才能在启动时指定使用多张卡启动模型?
https://github.com/THUDM/ChatGLM-6B里有个utils.py,可以参考一下
服务器有3张T4卡,每张T4卡显存16G,codegeex4本地化部署启动至少需要19G左右到显存,启动时却只使用一张卡,报了oom异常,请问下如何才能在启动时指定使用多张卡启动模型?