qiaoguan / deep-ctr-prediction

CTR prediction models based on deep learning(基于深度学习的广告推荐CTR预估模型)
https://github.com/qiaoguan/deep-ctr-prediction
907 stars 276 forks source link

DIN样本数据含义 #13

Closed ljcmheart closed 4 years ago

ljcmheart commented 4 years ago

您好,您能帮忙解释下DIN代码中用到的数据集是什么意思嘛,主要是:product_id_att,creative_id_att,user_click_products_att,user_click_products_att,因为官方的代码里没有用过多的特征,感觉您的代码比较有实用性,烦请帮忙解答一下含义和数据格式,谢谢~

qiaoguan commented 4 years ago

creative_id_att 表示该样本当前的creative_id, last_click_creativeid, 用户历史点击的creative_id序列, 其实我就是提供的一个参考代码,特征这些也是给的一个简单的参考方式,具体可以参考模型的实现部分(din.py 里面的attention_layer实现和输入)

ljcmheart commented 4 years ago

好的,明白了,刚接触attention机制,还是掌握的不够清楚,谢谢您啦~

------------------ 原始邮件 ------------------ 发件人: "gq"<notifications@github.com>; 发送时间: 2020年5月11日(星期一) 晚上6:23 收件人: "qiaoguan/deep-ctr-prediction"<deep-ctr-prediction@noreply.github.com>; 抄送: "♡♛♥"<1825330825@qq.com>;"Author"<author@noreply.github.com>; 主题: Re: [qiaoguan/deep-ctr-prediction] DIN样本数据含义 (#13)

creative_id_att 表示该样本当前的creative_id, last_click_creativeid, 用户历史点击的creative_id序列, 其实我就是提供的一个参考代码,特征这些也是给的一个简单的参考方式,具体可以参考模型的实现部分(din.py 里面的attention_layer实现和输入)

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

ljcmheart commented 4 years ago

大神,可以指点一下我DIN样本的具体格式嘛,attention部分的数据理不清楚,我现在是用户当前的商品id,和历史点击的id list,我做样本的时候是把历史点击id序列作为字符串存储了,在模型输入的时候历史点击的序列怎么处理呢,您可以截取一条您的数据给我看一下不,谢谢~

------------------ 原始邮件 ------------------ 发件人: "gq"<notifications@github.com>; 发送时间: 2020年5月11日(星期一) 晚上6:23 收件人: "qiaoguan/deep-ctr-prediction"<deep-ctr-prediction@noreply.github.com>; 抄送: "♡♛♥"<1825330825@qq.com>;"Author"<author@noreply.github.com>; 主题: Re: [qiaoguan/deep-ctr-prediction] DIN样本数据含义 (#13)

creative_id_att 表示该样本当前的creative_id, last_click_creativeid, 用户历史点击的creative_id序列, 其实我就是提供的一个参考代码,特征这些也是给的一个简单的参考方式,具体可以参考模型的实现部分(din.py 里面的attention_layer实现和输入)

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

qiaoguan commented 4 years ago

你如果是用的tfrecord可以直接参考我的这个代码,历史点击的id list 在tfrecord格式对应的格式也是一个list,数据解析直接参考这份代码就OK, 如果不用tfrecord格式, 可以参考下 readme 里面的wide&deep里面的代码