SoftWiser-group / iTag

Implementation of An Integral Tag Recommendation Model for Textual Content.
10 stars 3 forks source link

关于pgen_dense层的问题 #2

Closed Quincy1994 closed 5 years ago

Quincy1994 commented 5 years ago

您好,在您的代码中pgendense层似乎并没有在train的过程得到学习,而是直接用于预测predict,这部分代码是否有遗漏? p = pgen_dense(decoder_pgen)

Tangworld commented 5 years ago

你好,是这样的,这一步操作的输入decoder_pgen是在之前的attention过程里得到的,而attention的参数会得到学习: decoder_outputs, decoder_alphas, decoder_pgen = time_attention([encoder_outputs, decoder_outputs]) 然后你提到的pgen_dense层只是进行了一次softmax操作