Open hysic opened 7 years ago
定义: 与
反向传播(BP)算法公式:
反向传播算法步骤(单个training example):
BP + mini-batch Gradient descent:
反向传播(BP)算法的速度:一次反向传播,就可以算出所有的梯度。所需要的时间:一次前向传播 + 一次后向传播 ≈ 两次前向传播。
对比根据梯度定义(见下式)计算所需要的时间:前向传播的次数 = 权重的个数 + 1
所以BP算法比梯度定义的算法快得多。
BP算法公式(3)和(4)的推导:
反向传播(backpropagation):计算cost function关于w和b的偏微分。
要想应用反向传播,cost function需要满足两个条件:
满足上述两个条件的cost function举例: