Open CodeShaoNian opened 4 years ago
See _update
function. It is calculated based on the Chain rule. update 里的formula 和这个图片里的稍有不同,但是是一样的,我用电脑软件算的。
不过这个loss function 目前有问题,(看之前俩issue)没有真正起到优化的作用。具体bug我还没找到。
还有个问题,就是 上图 loss函数中, I(pred) 关于 e 的式子,这个式子在哪里,我没有找到 ,能再帮忙解释一下么,谢谢了
能帮忙解释一下model3中 Ioss 对 beta 求导, 是根据哪个公式么?我知道 loss 对 I 求导, 但是 I 对 beta 求导 是怎么计算的呢, 谢谢