Closed Chineselock closed 10 months ago
您好,能否调整API使模型推理时存储在多张显卡上?我现在有多张24G显存的显卡并且我希望能够运行LLama-7B进行embedding
您好,能否调整API使模型推理时存储在多张显卡上?我现在有多张24G显存的显卡并且我希望能够运行LLama-7B进行embedding