Ускорение инференса rugpt3-large

ai-forever / ru-gpts

Russian GPT3 models.

Apache License 2.0

2.08k stars 442 forks source link

Ускорение инференса rugpt3-large #95

Closed Den4ikAI closed 1 year ago

Den4ikAI commented 2 years ago

Приветствую! Имеется отфайнтюненая rugp3-large и пк с 3 tesla m40. Возможно ли ускорить работу модели используя все 3 карты?

king-menin commented 1 year ago

Мы пока не занимались ускорением инференса. Вы можете на каждой запустить по модели и тогда для пользователей будет ускорение, если их много. также можете попробовать использовать onnxruntime или deepspeed inference.