SCIR-HI / Huatuo-Llama-Med-Chinese

Repo for BenTsao [original name: HuaTuo (华驼)], Instruction-tuning Large Language Models with Chinese Medical Knowledge. 本草(原名:华驼)模型仓库,基于中文医学知识的大语言模型指令微调
Apache License 2.0
4.31k stars 422 forks source link

生成答案重复 #92

Open loki1017 opened 8 months ago

loki1017 commented 8 months ago

非常感谢您的贡献,我基于活字1.0进行了lora模型的复现工作,下面是我的复现结果: image image

我想请教您关于模型回答一直重复的问题(在temperature=1.0的情况下),我在进行其他模型训练的时候也经常遇到类似的问题,我想知道这个问题产生的具体原因是什么?是因为训练方式的原因,还是因为推理时参数设置的原因呢?万分感谢!!!

cookie925 commented 8 months ago

我也有这个问题

loki1017 commented 8 months ago

目前我也在探索重复的解决方案,有些许想法,如果有大佬知道,也请给出指正:

  1. 与数据集质量有关,模型在过拟合的情况下很容易产生重复内容,如果你的数据集数量少可以适当地扩充数据量。
  2. 一些模型在推理阶段也要参考固定的template,比如baichuan,llama 推荐参考此项目:https://github.com/hiyouga/LLaMA-Efficient-Tuning/issues/473