hiyoung123 / SoftMaskedBert

Soft-Masked Bert 复现论文:https://arxiv.org/pdf/2005.07421.pdf
255 stars 47 forks source link

为什么要加一个转置? #19

Open li-aolong opened 4 years ago

li-aolong commented 4 years ago

train.py文件的第93行

loss_c = self.criterion_c(out.transpose(1, 2), data["output_ids"])

这里为什么要将第二维和第三维进行转置?是因为数据的第二维才是对应id么?