Open EddieChen324 opened 2 years ago
两者能正常下降,大概率应该就是没问题
您好 我把您关于similarity loss获得labels函数的最后一段的argmax给注释掉了 因为我看苏神的bert4keras这一块好像直接就把labels矩阵传过去了 请问您为什么要在那一块加argmax呀
这块感觉问题不大,去掉也行。
两者能正常下降,大概率应该就是没问题