Facico / Chinese-Vicuna

Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案,结构参考alpaca
https://github.com/Facico/Chinese-Vicuna
Apache License 2.0
4.15k stars 428 forks source link

执行sh chat_7B.sh 的问题,推理结果明显错误 #204

Open niuhuluzhihao opened 1 year ago

niuhuluzhihao commented 1 year ago

我当前使用的是Chinese-Vicuna/Chinese-Vicuna-lora-7b-belle-and-guanaco模型,脚本未做任何的更改

image 为什么执行chat的时候,推理错误很明显呢?如果切换成instrument,则没有问题呢?

另外,他似乎不太容易停止。比如说输入这样的问题,等待下图全部完成之后 image ,他会跳转到新的信息,如下图 image

Facico commented 1 year ago

这个模型训练的时候的global instruction就是指令格式的,相关的多轮对话能力较弱,可以用我们提供的 https://huggingface.co/Chinese-Vicuna/Chinese-Vicuna-lora-7b-chatv1