Closed Tomorrowdawn closed 5 months ago
训练代码中误传了prob而不是logits。
模型代码需要拆掉softmax头。
8240eea9de6aacc67b343f78c14d74af267d4463 fixed this
训练代码中误传了prob而不是logits。
模型代码需要拆掉softmax头。