Open Itochiee opened 4 months ago
请教一下大家,预训练阶段,每条训练样本混杂着不同的句子(不同句子用隔开),这样做是否会造成混杂的不相关的句子在预训练时互相受影响?为什么不是每个句子就是一条训练样本呢(如果句子超长,再截断成多个子句)?
请教一下大家,预训练阶段,每条训练样本混杂着不同的句子(不同句子用隔开),这样做是否会造成混杂的不相关的句子在预训练时互相受影响?为什么不是每个句子就是一条训练样本呢(如果句子超长,再截断成多个子句)?