layerism / TensorRT-Inference-Server-Tutorial

服务侧深度学习部署案例
453 stars 73 forks source link

请教大佬,你在p40上跑了多个模型。 #13

Open GoodJoey opened 4 years ago

GoodJoey commented 4 years ago

这些模型做前向的时候,是真正的并行计算的吗? 还是伪并行(时间片轮转),某个时间点只有一个模型在做前向计算。 GPU的利用率如何,和单模型相比有线性提高吗? 谢谢