Open CaseyWay2022 opened 5 months ago
增加mu的时候,会至少提升到一个设定的最小值的
是否可以这样理解,在矩阵正定的情况下尽可能向牛顿方向迭代,在矩阵非正定或不收敛的情况下尽可能往梯度方向迭代?想请教一下为什么这样设置,因为似乎L1、L2范数正则化这种类似的方式可以实现一步就将非正定的矩阵转化为正定矩阵。
确实是这样理解的;至于为什么这么做么,牛顿法里面处理非正定矩阵好像比较简单通用的方法就是这么处理的,把海森矩阵加一个单位矩阵的倍数
也有一些其他的方法,比如先矩阵分解,再做修改的
在代码中看到mu初始化为0.并且在循环中根据求解状态乘2或除2,但是初始化为0能否起到正则化的作用?这块不是很理解,想请教一下谢谢