Facico / Chinese-Vicuna

Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model —— 一个中文低资源的llama+lora方案,结构参考alpaca
https://github.com/Facico/Chinese-Vicuna
Apache License 2.0
4.14k stars 425 forks source link

Generation问题 #223

Closed Jiangchenglin521 closed 1 year ago

Jiangchenglin521 commented 1 year ago

您好,这边发现在用提供的generate.py文件中do sample是没设置的,用的beam search。我这边用你们训的那个3个Ep的checkpoint-4000的模型,打开了do_sample,生成序列完全是在随机生成答非所问的序列。但是如果使用脚本默认配置,就能得到正确答案。请问这个还是参数的问题么?是因为训练中有做了什么特殊处理么。使用的示例是:世界上最高的山峰是?