duterscmy / ccks2019-ckbqa-4th-codes

中文知识库问答代码,CCKS2019 CKBQA评测第四名解决方案
476 stars 91 forks source link

文本匹配数据集疑问 #25

Open 1234560o opened 4 years ago

1234560o commented 4 years ago

作者,您好!我看了你提供的文本匹配模型的训练集train.csv生成的human语句采用了知识库实体,我在想使用mention会不会好点? 比如question:奥巴马出生在哪?知识库实体侯赛因(美国总统)和question从字面上来说没有太大相关性,而且很多知识库实体(?)部分也和question字面含义关系不大,这感觉会造成一定的干扰。 如果使用mention来生成human语句,好像就能避免上面的问题,而且这样生成句子感觉和question语义及语法结构上更匹配,想请问作者有什么高见吗?