Closed sunshine-zkf closed 3 years ago
l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs)) 该损失函数缺少参数 from_logits = True。在计算输出是没有使用激活函数softmax,因此需要在损失函数上指定,即令from_logits = True。故损失函数应该为: l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs,from_logits=True))
错误结果:
epoch 50, perplexity 100.705286, time 1.76 sec 分开
了解,感谢指正
👍
已修正
l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs)) 该损失函数缺少参数 from_logits = True。在计算输出是没有使用激活函数softmax,因此需要在损失函数上指定,即令from_logits = True。故损失函数应该为: l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs,from_logits=True))
错误结果:
epoch 50, perplexity 100.705286, time 1.76 sec 分开
不分开
epoch 100, perplexity 27.005527, time 1.85 sec 分开
不分开
epoch 150, perplexity 1019.865201, time 1.80 sec 分开