Closed ArtificialIdoit closed 5 years ago
我倒是有个猜测,但是不太敢确定
是因为负样本太多,所以去掉了无用信息,一种变相的数据增强?
是因为负样本太多,所以去掉了无用信息,一种变相的数据增强?
是的,其实就是把不包含实体的句子从训练集里删掉了。
是因为负样本太多,所以去掉了无用信息,一种变相的数据增强?
是的,其实就是把不包含实体的句子从训练集里删掉了。
好的,谢谢
分享下我的经验,在另一个NER项目里确实发现如果不去负样本,召回率会很低。所以去掉不包含实体的句子是必须的。
分享下我的经验,在另一个NER项目里确实发现如果不去负样本,召回率会很低。所以去掉不包含实体的句子是必须的。
十分感谢,后续有时间我会尝试一下。
ChineseNER/data/renMinRiBao/data_renmin_word.py中的85行到88行,为什么会只保留numNotO!=0的linedata?