Open gavinjou818 opened 6 years ago
按照公式来看 w权值应该是统一的。
actual_gradient = conn.get_gradient() 这一句获取梯度的时候,这时候的权值是 W[new],W[old] 早已经变了。。 再执行predict 获取的梯度就不是上一次的W[old] 权值。
感觉这个函数封装起来会有点疑惑... 不知道说得对不对。
按照公式来看 w权值应该是统一的。
actual_gradient = conn.get_gradient()
这一句获取梯度的时候,这时候的权值是 W[new],W[old] 早已经变了。。 再执行predict 获取的梯度就不是上一次的W[old] 权值。
感觉这个函数封装起来会有点疑惑... 不知道说得对不对。