fengdu78 / Coursera-ML-AndrewNg-Notes

吴恩达老师的机器学习课程个人笔记
31.44k stars 10.56k forks source link

exp4: 为什么计算第三层参数的梯度时,不需要乘sigmoid_gradient(z3) #98

Closed hexiang-x closed 2 years ago

hexiang-x commented 2 years ago

d3t = ht - yt d2t = np.multiply((theta2.T * d3t.T).T, sigmoid_gradient(z2t)) 我的问题的意思时: d3t计算时,为什么不需要像d2t,乘上sigmoid_gradient()呢?

hexiang-x commented 2 years ago

十分抱歉,我明白了,最后一层对z的偏导数就是h-y, 我半个小时前认为最后一层对h的偏导数为h-y。 由于代价函数对z的导数时h-y故不需要再乘上sigmoid_gradient(z)。