执行sh chat_7B.sh 的问题，推理结果明显错误

Facico / Chinese-Vicuna

Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案，结构参考alpaca

https://github.com/Facico/Chinese-Vicuna

Apache License 2.0

4.15k stars 428 forks source link

Open niuhuluzhihao opened 1 year ago

niuhuluzhihao commented 1 year ago

我当前使用的是Chinese-Vicuna/Chinese-Vicuna-lora-7b-belle-and-guanaco模型，脚本未做任何的更改

为什么执行chat的时候，推理错误很明显呢？如果切换成instrument，则没有问题呢？

另外，他似乎不太容易停止。比如说输入这样的问题，等待下图全部完成之后，他会跳转到新的信息，如下图

Facico commented 1 year ago

这个模型训练的时候的global instruction就是指令格式的，相关的多轮对话能力较弱，可以用我们提供的 https://huggingface.co/Chinese-Vicuna/Chinese-Vicuna-lora-7b-chatv1