duterscmy / ccks2019-ckbqa-4th-codes

中文知识库问答代码,CCKS2019 CKBQA评测第四名解决方案
477 stars 91 forks source link

关于Similarity模型中用到的数据集生成问题 #31

Open ConnollyLeon opened 4 years ago

ConnollyLeon commented 4 years ago

我观察到src/data里已经有您生成好的数据集,请问有相关的数据集生成代码吗?

duterscmy commented 4 years ago

这部分代码后来改没了。主要就是找了一些特征在训练集上训练一个逻辑回归打分模型,然后根据分数选择训练集里分数较高的错误候选作为负例。这样的做法跟随机选择若干负例来训练BERT匹配模型的效果是否有提升实际没有评价过。