Open yuanyuansiyuan opened 6 years ago
观察了自己跑的结果,loss基本上下降趋势,应该没有问题
@yuanyuansiyuan 我自己fork了一份,改了部分代码。我发现,如果把loss_ce,loss_adv,loss_diff三种损失分开画出来的话,整体loss和loss_ce都是下降的,但是loss_adv和loss_diff大多数情况下是上升的。
而且这个源码中的实现,loss_adv的参数用0.05以及loss_diff的系数用1,都会导致这两个loss的数量级很小,相对于loss_ce来说基本上可以忽略不计。
@yuanyuansiyuan 我疑惑的是,假如说loss_adv和loss_diff是上升的,是不是意味着多抗训练和正交性约束实际上是没有效果的?
自己复现了一遍,也是,没有提升反而下降,如果把正交约束变为单侧下降的没那么厉害。
你好,两个问题