模型对预训练数据集拟合效果很差

yuanzhoulvpi2017 / zero_nlp

中文nlp解决方案(大模型、数据、模型、训练、推理)

MIT License

2.95k stars 363 forks source link

Open yanchaoguo opened 1 year ago

yanchaoguo commented 1 year ago

不知道作者是否真的跑通了[code02_训练模型全部流程.ipynb] 这个demo，训练出来的模型和原版没啥区别，数据集里的问题可以说一个都没记住

yuanzhoulvpi2017 commented 1 year ago

yanchaoguo commented 1 year ago

要是希望能够让模型记住你的数据内容，数据量需要加大，只训练一个epoch，基本上是不行的。

在我改名的经验中，如果想要让模型忘记他之前的名字，那么这个意图数据需要重复🔁1600条左右。

具体可以参考这个链接大佬修改名称有什么经验呢 #39

为啥要训练这么多次lora技术不是用来拟合小样本的吗

cywjava commented 1 year ago

要是希望能够让模型记住你的数据内容，数据量需要加大，只训练一个epoch，基本上是不行的。

在我改名的经验中，如果想要让模型忘记他之前的名字，那么这个意图数据需要重复🔁1600条左右。

具体可以参考这个链接大佬修改名称有什么经验呢 #39

你是谁？我是良睦路程序训练的一个AI模型 23423421，，这后面的数字表达的是啥意思。。你是指的这个吗，比如问你是谁，换成了：我是良睦路程序训练的一个AI模型

feiwuu638 commented 1 year ago

要是希望能够让模型记住你的数据内容，数据量需要加大，只训练一个epoch，基本上是不行的。

在我改名的经验中，如果想要让模型忘记他之前的名字，那么这个意图数据需要重复🔁1600条左右。

具体可以参考这个链接大佬修改名称有什么经验呢 #39

按照这个方法训练，模型可以回答“你是不是由良木路程序员开发的模型”，但问它“你是谁”或“你叫什么名字”的时候还是回答是chatglm

yanchaoguo commented 1 year ago

BLAIR-wy commented 1 year ago

请问大佬你的epoch是多少呀？你的alldata最后是多少条呢