Open lcshr123 opened 4 years ago
想请教一下大佬, 代码里 max_sl 这个变量每个 batch 都会计算一遍。这样的话,每个 batch 里的 hist_i 这个变量的 shape 就是变化的,会引起后面的计算过程的 shape 也是变化的。 tensorflow 可以这样训练吗? 预测的时候,假设之前训练时的 max_sl 最大是 100, 新输入的数据的 max_sl 如果大于100,可以正确运行吗?
同有这个疑问,求解答
同问
经过attention后hist_i 的size 变成 [B, 1, H] 的了[batch大小,1,embedding大小]
想请教一下大佬, 代码里 max_sl 这个变量每个 batch 都会计算一遍。这样的话,每个 batch 里的 hist_i 这个变量的 shape 就是变化的,会引起后面的计算过程的 shape 也是变化的。 tensorflow 可以这样训练吗? 预测的时候,假设之前训练时的 max_sl 最大是 100, 新输入的数据的 max_sl 如果大于100,可以正确运行吗?