Open hanfu opened 4 years ago
您好, 请教一个梯度计算的问题. deepfm中embedding层的参数学习(即second_order_emb), torch在计算梯度的时候是分别计算deep部分和fm部分, 然后求和得到更新的步长的么? 另外就是这个embedding层的初始化有什么技巧么?
您好, 请教一个梯度计算的问题. deepfm中embedding层的参数学习(即second_order_emb), torch在计算梯度的时候是分别计算deep部分和fm部分, 然后求和得到更新的步长的么? 另外就是这个embedding层的初始化有什么技巧么?