train_sft.py的process_supervised和infer.py两边的预处理逻辑不一致

TigerResearch / TigerBot

TigerBot: A multi-language multi-task LLM

https://www.tigerbot.com

Apache License 2.0

2.24k stars 194 forks source link

Closed baibaiw5 closed 1 year ago

baibaiw5 commented 1 year ago

train_sft.py的process_supervised函数，对输入数据没有加prompt

infer.py推理时反而增加了prompt,两边不一致？

i4never commented 1 year ago

Hi，实际训练时我们在数据里加了prompt token。由于sft存在多轮数据，训练代码不知道合理的特殊token位置，因此在数据中添加更合理。dev_sft的数据已经更新，感谢您指出这个问题。