Open Cherryjingyao opened 3 years ago
是预测的response 的概率分布和实际的交叉熵吗?那和goden_out loss有什么区别吗?
next_sentence loss是论文里面的knowledge selection loss
是预测的response 的概率分布和实际的交叉熵吗?那和goden_out loss有什么区别吗?