Open Williams-Hao opened 3 years ago
邱老师您好,首先感谢您的书,对于我等初学者真是福音!我在读您的书【注意力章节-指针网络】这里有点疑惑,想在这里讨论一下。
公式(8.15): s_m,n = v$T tanh(Wx_n + Uh_m), 这里的x_n, h_m分别表示输入序列向量, 和输入序列的隐层向量。
原因如下:
在看了一遍Pointer Netwok的论文之后,我觉得你说得是对的。
推导错误:P198 公式8.15 中是否有错误。
邱老师您好,首先感谢您的书,对于我等初学者真是福音!我在读您的书【注意力章节-指针网络】这里有点疑惑,想在这里讨论一下。
公式(8.15): s_m,n = v$T tanh(Wx_n + Uh_m), 这里的x_n, h_m分别表示输入序列向量, 和输入序列的隐层向量。
这里的x_n是否有误,是否应为h_n ?
原因如下: