Open YUFEIFUT opened 11 months ago
上图是仓库中的关于这题的回答,但是经我实验,如下图,我用的 Pytorch,用全零初始化 w ,最终也是能拟合的:
我不知道是我弄错了还是这里的答案写错了呢
对于线性回归,可以初始化为零。这个网络只有w,b,就是逻辑回归。
w.grad
b.grad
所以算法不会失效,梯度下降肯定能收敛到这个全局最小值的。
上图是仓库中的关于这题的回答,但是经我实验,如下图,我用的 Pytorch,用全零初始化 w ,最终也是能拟合的:
我不知道是我弄错了还是这里的答案写错了呢