exp4: 为什么计算第三层参数的梯度时，不需要乘sigmoid_gradient(z3)

fengdu78 / Coursera-ML-AndrewNg-Notes

吴恩达老师的机器学习课程个人笔记

32.14k stars 10.63k forks source link

Closed hexiang-x closed 2 years ago

hexiang-x commented 2 years ago

d3t = ht - yt d2t = np.multiply((theta2.T * d3t.T).T, sigmoid_gradient(z2t)) 我的问题的意思时: d3t计算时，为什么不需要像d2t,乘上sigmoid_gradient()呢？

hexiang-x commented 2 years ago

十分抱歉，我明白了，最后一层对z的偏导数就是h-y, 我半个小时前认为最后一层对h的偏导数为h-y。由于代价函数对z的导数时h-y故不需要再乘上sigmoid_gradient(z)。