关于pgen_dense层的问题

SoftWiser-group / iTag

Implementation of An Integral Tag Recommendation Model for Textual Content.

10 stars 3 forks source link

关于pgen_dense层的问题 #2

Closed Quincy1994 closed 5 years ago

Quincy1994 commented 5 years ago

您好，在您的代码中pgendense层似乎并没有在train的过程得到学习，而是直接用于预测predict，这部分代码是否有遗漏？ p = pgen_dense(decoder_pgen)

Tangworld commented 5 years ago

你好，是这样的，这一步操作的输入decoder_pgen是在之前的attention过程里得到的，而attention的参数会得到学习： decoder_outputs, decoder_alphas, decoder_pgen = time_attention([encoder_outputs, decoder_outputs]) 然后你提到的pgen_dense层只是进行了一次softmax操作