zhougr1993 / DeepInterestNetwork

1.61k stars 559 forks source link

max_sl 变量(用户点击序列的长度)在每个 batch 里都是不一样的值,模型结构在每个 batch 里是不固定的? #69

Open lcshr123 opened 4 years ago

lcshr123 commented 4 years ago

想请教一下大佬, 代码里 max_sl 这个变量每个 batch 都会计算一遍。这样的话,每个 batch 里的 hist_i 这个变量的 shape 就是变化的,会引起后面的计算过程的 shape 也是变化的。 tensorflow 可以这样训练吗? 预测的时候,假设之前训练时的 max_sl 最大是 100, 新输入的数据的 max_sl 如果大于100,可以正确运行吗?

YoungsonZhao commented 4 years ago

同有这个疑问,求解答

woon9zhai commented 4 years ago

同问

Melaniemod commented 4 years ago

经过attention后hist_i 的size 变成 [B, 1, H] 的了[batch大小,1,embedding大小]