stanleylsx / entity_extractor_by_ner

基于Tensorflow2.3开发的NER模型,都是CRF范式,包含Bilstm(IDCNN)-CRF、Bert-Bilstm(IDCNN)-CRF、Bert-CRF,可微调预训练模型,可对抗学习,用于命名实体识别,配置后可直接运行。
390 stars 73 forks source link

idcnn训练时出现准确率和召回率全0 #60

Closed ChemEng227 closed 1 year ago

ChemEng227 commented 1 year ago

image

如图,尝试训练IDCNN-CRF模型时,出现准确和召回率全0且训练无改善,数个Epoch后loss变为NaN的情况,应该怎么解决?

stanleylsx commented 1 year ago

image

如图,尝试训练IDCNN-CRF模型时,出现准确和召回率全0且训练无改善,数个Epoch后loss变为NaN的情况,应该怎么解决?

数据集的大小和分布如何?

stanleylsx commented 1 year ago

我使用demo数据直接跑idcnn没有出现这个问题,训练结果和文件会更新上来,大概率数据欠拟合,建议增加数据集或者增大学习率。 或者使用bert作为embedding或者把bert加入的微调中。