Open YCG09 opened 4 years ago
您好,感谢提问。 如果是domain specific的数据集(医疗,金融,法律等),单纯为了提高recall,可以通过添加字典做同义词匹配等添加规则的方式来实现(通用数据集例如新闻等,可能会因为添加规则会造成precision降低。); 如果是因为数据量小造成模型的recall较低,可以采用标注新的训练数据样本或者采用数据增强的方式。 如果是因为实体分布不平衡,导致的整体recall较低,可以通过优化训练过程(比如将cross entropy替换成focal loss, weighted cross entropy)来提高recall 或者通过提高某一类别的实体recall提高整体的recall。
以上都是我个人的理解,希望您指教。感谢!
您好,我的数据集上存在precision明显大于recall的情况,如果想以precision换recall,您可否给点建议?谢谢