Closed hexiang-x closed 2 years ago
d3t = ht - yt d2t = np.multiply((theta2.T * d3t.T).T, sigmoid_gradient(z2t)) 我的问题的意思时: d3t计算时,为什么不需要像d2t,乘上sigmoid_gradient()呢?
十分抱歉,我明白了,最后一层对z的偏导数就是h-y, 我半个小时前认为最后一层对h的偏导数为h-y。 由于代价函数对z的导数时h-y故不需要再乘上sigmoid_gradient(z)。
d3t = ht - yt d2t = np.multiply((theta2.T * d3t.T).T, sigmoid_gradient(z2t)) 我的问题的意思时: d3t计算时,为什么不需要像d2t,乘上sigmoid_gradient()呢?