wenyu332 / daguan_bert_ner

30 stars 13 forks source link

wenyu332,你好。我在用你程序训练时,训练次数改成了10,得到predict.txt文件。然后用submit程序生成submit.txt时,发现到一定条数后就是卡住。 #9

Closed lizhzh8 closed 5 years ago

lizhzh8 commented 5 years ago

卡住原因是我所得到的命名实体识别类型不太符合逻辑。比如有的命名实体会是 b_S a-E 类似这种。而在实际中不应该只出现a-E 这一个命名实体的。 这是因为我训练的次数不够吗?还是欠拟合?CRF感觉没起作用呢?

wenyu332 commented 5 years ago

10次肯定不行,太少了。。不过我这里有时候也会出现这种情况,但出现次数和个数不是很多,我就把这些都掠过去了,后面有时间在找找原因吧。。

lizhzh8 commented 5 years ago

嗯嗯。我用10次得到的结果提交上去,有90%的效果

wenyu332 commented 5 years ago

恩恩

dh12306 commented 5 years ago

我也是卡住,训练了5个epoch,生成submit时,我发现第79行的预测有问题,因为max_seq_len=200,当文本长度大于200时,预测结果只有198个,submit的样本最大长度436,当改了max_seq_len的时候,就会报错,大概是维度不匹配的错,如下图,想请教下@wenyu332 大神这个max_seq_len 改了之后还需要改哪里: gpu 报错如下: image

cpu 报错如下:

image