Open shyoulala opened 7 months ago
计算sft损失的时候label和logits貌似没有shift,是我理解有问题吗? 应该是new_logits = logits[:,:-1,:]
这样:
labels在DataCollatorForSupervisedDataset里shift过了
计算sft损失的时候label和logits貌似没有shift,是我理解有问题吗? 应该是new_logits = logits[:,:-1,:]