Closed quartets closed 11 months ago
有一个 GGUF 格式的可以用 https://huggingface.co/TheBloke/Yi-34B-GGUF/tree/main
我的服务器是T4 16G VRAM from google colab, 试了2bit、3bit的Yi-34B-GGUF,都freeze状态,等待5分钟也才输出这样一行:
You 你好。
AI
theBloke 出了GPTQ的,在text-gen里用transformer的model loader, 启动text-gen时,要加--trust-remote-code的flag, 然后在transformer的loading参数里勾选disable_exllama.
我试了很多参数组合都加载不成功。