Open wmc1421910835 opened 1 year ago
还想问一个,就是为什么我在用您的代码能跑通,但是precision,f等分数都是0.0,是我哪里用错了吗? 这是用到的gpu
最后一次应该不能用gelu了,因为他马上要输出会经过sigmoid了。 第二个问题我感觉和gpu应该是无关的,你可以尝试看看能不能overfit一小部分数据
还想问一个,就是为什么我在用您的代码能跑通,但是precision,f等分数都是0.0,是我哪里用错了吗? 这是用到的gpu