Open MetaRunning opened 7 months ago
RT
使用加速方法,简单的可以试试vllm:https://github.com/LlamaFamily/Llama-Chinese/tree/main/inference-speed/GPU/vllm_example
RT
使用加速方法,简单的可以试试vllm:https://github.com/LlamaFamily/Llama-Chinese/tree/main/inference-speed/GPU/vllm_example
好的,多谢。我试下看下效果。
RT