Open waterbeach opened 5 years ago
开源给出的code只是在公开数据集实现的demo,这些数据集没有很丰富的特征。 生产的DIN模型我们是以item为最小的粒度,把item的所有相关的feature 如你说的 品牌 brand、类目 category,还有产品词 product word,店铺 shop,以及一些别的item为key能关联到的feature。把它们的embedding 和item的embedding concat 起来当做是最终item的embedding,这个concat操作也可以变成sum pooling操作,不过效果都是差不多的,concat在我们的场景会好一些。对于用户行为序列的item和预估候选的item都做同样的处理,最终输入模型。
刚看了一眼代码,模型的输入是 (u, i, j, hist_i, sl),所以只包括用户的历史行为商品这一维特征是吗? 历史行为过的品牌、类目可以加上么?该怎么拼接呢?