Closed math-yyj closed 6 years ago
看起来没发现loss的计算部分,损失函数层并没有出现在这些文件里?
cosin_add_m处理之后,再传到普通的softmax层损失. 这里不涉及损失函数,只是变换,和求梯度。
老师,有实验例子吗?lfw
看起来没发现loss的计算部分,损失函数层并没有出现在这些文件里?