Open qinglongheu opened 1 year ago
是标签的问题吗?是不是需要改动标签设置?
n_heads = 6 head_dims = 80 num_layers = 2 lr = 0.0007 attn_type = 'adatrans' n_epochs = 100这些参数需要设置吗?
你可以先尝试overfit一小部分数据,就是少一些数据看看。
作者大大您好,我想问一下运行过程出现两个结果,一个是test-data后的,一个是dev后的。论文中的结果是取哪一个在6个数据及上和其他模型对比呢?还有一般不都是取test吗?为什么最后是get best dev?期待您的回答!
你好,我用自己的数据集训练,loss下降很少,100epoch训练的评分SpanFPreRecMetric: f=0.0, pre=0.0, rec=0.0 ,loss为113.这是什么问题?是数据集的问题吗?数据集格式为BIO格式