datawhalechina / d2l-ai-solutions-manual

《动手学深度学习》习题解答,在线阅读地址如下:
https://datawhalechina.github.io/d2l-ai-solutions-manual/
Other
337 stars 63 forks source link

ch 10 练习10.3.2 解题思路的疑问 #105

Closed YueZhengMeng closed 2 months ago

YueZhengMeng commented 2 months ago

个人对题目"只使用矩阵乘法,能否为具有不同矢量长度的查询和键设计新的评分函数?"的理解是:通过矩阵乘法实现线性层W_k与W_q,将特征向量维度不同的query与key映射到num_hiddens维。 而如不是ch10.ipynb给出的解答中那样,通过矩阵乘法实现W_v

YueZhengMeng commented 2 months ago

已在ch10.md中找到更合理的解答。 两边内容不同步 我将copy ch10.md中的解答到ch10.ipynb中