如何支持多显卡 - Githubissues

Jittor / JittorLLMs

计图大模型推理库，具有高性能、配置要求低、中文支持好、可移植等特点

Apache License 2.0

2.37k stars 183 forks source link

Open ChinaGPT opened 1 year ago

ChinaGPT commented 1 year ago

你好配置文件支持多显卡么？如何设置谢谢~~

cjld commented 1 year ago

如果您是单卡显存不够，您可以通过环境变量，限制最大内存消耗：https://github.com/Jittor/JittorLLMs#%E9%85%8D%E7%BD%AE%E8%A6%81%E6%B1%82%E4%BD%8E

如果您是想用不同的卡，设置环境变量device_id=x, x是您指定的显卡id

ChinaGPT commented 1 year ago

我们是想对接公司内部客服系统，所以想试试多显卡接线能力，设置device_id=0,1,2,3是不是就支持4显卡了？

cjld commented 1 year ago

device_id=0 api.py chatglm
device_id=1 api.py chatglm
device_id=2 api.py chatglm
device_id=3 api.py chatglm

您可能需要启动4个进程，然后每个进程使用不同的端口

cjld commented 1 year ago

修改端口代码在这里：https://github.com/Jittor/JittorLLMs/blob/main/api.py#L48 您可能需要改一下代码

ChinaGPT commented 1 year ago

能不能在一个api自动开多线程并加入自动调用空闲gpu的能力

ChinaGPT commented 1 year ago

谢谢

cjld commented 1 year ago

您可以自行开发这个功能，理论上几行代码就可以了，在api里面，启动一个multiprocess pool即可

2catycm commented 1 year ago

device_id=0 api.py chatglm
device_id=1 api.py chatglm
device_id=2 api.py chatglm
device_id=3 api.py chatglm
您可能需要启动4个进程，然后每个进程使用不同的端口

这是启动了四个对话模型吧，如何让一个对话模型同时使用四张卡呢

tonylin52 commented 1 year ago

请问支持模型deepspeed大模型分割到不同显卡吗？