WisdomShell / codeshell

A series of code large language models developed by PKU-KCL
http://se.pku.edu.cn/kcl
Other
1.61k stars 119 forks source link

代码生成中大量|end>|废话 #40

Open bolt163 opened 10 months ago

bolt163 commented 10 months ago
企业微信截图_100ae13b-66de-457a-9fb6-3f537f2b6529
wenma1993 commented 10 months ago

你好 目前发现也是这样 我通过程序过滤了

ZZR0 commented 10 months ago

您好,非常感谢您对CodeShell项目的支持。由于微调数据格式的问题,当前的模型有可能生成不符合预期的截止符。不过,我们已经在新版的对话微调模型中解决了这个问题,并计划在近期进行更新。目前,您可以通过在推理阶段添加新的截止符(如|end>|)来缓解这一问题。

shuaizai88 commented 7 months ago

您好,非常感谢您对CodeShell项目的支持。由于微调数据格式的问题,当前的模型有可能生成不符合预期的截止符。不过,我们已经在新版的对话微调模型中解决了这个问题,并计划在近期进行更新。目前,您可以通过在推理阶段添加新的截止符(如|end>|)来缓解这一问题。

新版本在哪下载呢??

ruixie commented 7 months ago

目前hugging face的就是最新版本 https://huggingface.co/WisdomShell/CodeShell-7B-Chat 请注意如果你自己构造输入的话需要符合我们的模板,具体可以参考: def build_chat_input(self, query, history, tokenizer, max_new_tokens=None):