习题6-4 - Githubissues

习题6-4 推导LSTM网络中参数的梯度，并分析其避免梯度消失的效果．

其中

假设我们需要连续考高等数学 =》线性代数 =》概率论等几门学科 h1 表示考完高等数学时候的状态， c1表示考高等数学时大脑的记忆

现在需要考线性代数了

故有： 𝒄2 = 𝒇2 ⊙ 𝒄1 + 𝒊2 ⊙ 𝒄‘2

而我们拿到考试试卷的时候，发现所要使用的知识就更少了，所以使用 o2 来决定现有记忆中的多少来进行答题，从而得到最终的状态。

故有：𝒉2 = 𝒐2 ⊙ tanh (𝒄2)

IMG_20220104_164951

注： 𝛿𝑡,𝑘 的值可再斟酌（估计是错的，后续再仔细推到，不忍删去）

LSTM 通过记忆单元 C 来缓解梯度消失问题

由于

得到

nndl / solutions