Closed LianghuiGuo closed 5 months ago
请问可以支持量化加速推理么
Hey LianghuiGuo, 谢谢你的提问!Bunny现在支持8bit推理的,用bunny/serve/cli.py的--load-8bit就可以。4bit暂时还不支持。
好像,感谢解答~
请问可以支持量化加速推理么