IEIT-Yuan / Yuan-2.0

Yuan 2.0 Large Language Model
Other
681 stars 85 forks source link

LLama训练过程中,训练的语料对原有问题的回答有干扰时,这种情况该如何调参。 #119

Open lijiecheng opened 7 months ago

lijiecheng commented 7 months ago

1、使用LLama训练语料的过程中,当语料中有较多图1格式的问答时,在提问和训练的语料无关的问题,回答结果会按照训练的语料格式进行回答。源2.0在进行大预言训练的时候,如果某一种格式的语料较多时,对非语料中的问题进行提问时,会产生产生干扰,这种情况要如何调参 图片1

图1

图片2

图2

2、训练出来的语料在提问的时候,会出现一直循环打印相同的内容

图片3

zhaoxudong01 commented 7 months ago

第二个问题,生成重复内容,可以考虑加入重复性惩罚参数,我们在5c6fc64已经更新了该功能