Closed YueZhengMeng closed 2 months ago
个人对题目"只使用矩阵乘法,能否为具有不同矢量长度的查询和键设计新的评分函数?"的理解是:通过矩阵乘法实现线性层W_k与W_q,将特征向量维度不同的query与key映射到num_hiddens维。 而如不是ch10.ipynb给出的解答中那样,通过矩阵乘法实现W_v
已在ch10.md中找到更合理的解答。 两边内容不同步 我将copy ch10.md中的解答到ch10.ipynb中
个人对题目"只使用矩阵乘法,能否为具有不同矢量长度的查询和键设计新的评分函数?"的理解是:通过矩阵乘法实现线性层W_k与W_q,将特征向量维度不同的query与key映射到num_hiddens维。 而如不是ch10.ipynb给出的解答中那样,通过矩阵乘法实现W_v