Open li-aolong opened 4 years ago
train.py文件的第93行
train.py
loss_c = self.criterion_c(out.transpose(1, 2), data["output_ids"])
这里为什么要将第二维和第三维进行转置?是因为数据的第二维才是对应id么?
train.py
文件的第93行这里为什么要将第二维和第三维进行转置?是因为数据的第二维才是对应id么?