ShannonAI / mrc-for-flat-nested-ner

Code for ACL 2020 paper `A Unified MRC Framework for Named Entity Recognition`
657 stars 117 forks source link

Recall低问题 #43

Open YCG09 opened 4 years ago

YCG09 commented 4 years ago

您好,我的数据集上存在precision明显大于recall的情况,如果想以precision换recall,您可否给点建议?谢谢

ghost commented 4 years ago

您好,感谢提问。 如果是domain specific的数据集(医疗,金融,法律等),单纯为了提高recall,可以通过添加字典做同义词匹配等添加规则的方式来实现(通用数据集例如新闻等,可能会因为添加规则会造成precision降低。); 如果是因为数据量小造成模型的recall较低,可以采用标注新的训练数据样本或者采用数据增强的方式。 如果是因为实体分布不平衡,导致的整体recall较低,可以通过优化训练过程(比如将cross entropy替换成focal loss, weighted cross entropy)来提高recall 或者通过提高某一类别的实体recall提高整体的recall。

以上都是我个人的理解,希望您指教。感谢!