caishiqing / joint-mrc

机器检索阅读联合学习,莱斯杯:全国第二届“军事智能机器阅读”挑战赛 rank6 方案
126 stars 25 forks source link

数字类answer效果不好 #5

Open FankLi opened 4 years ago

FankLi commented 4 years ago

你好,麻烦请教一下,用了你的架构在自己数据集上进行了训练,但是数据类的answer效果很不好,acc不到50%,请问会是什么原因造成的呢?

例子: context:'2020.10.18的贷款利率是5.88%,这是最新的利率...',question:'贷款利率是多少?',answer:'5.88%'

模型预测的答案虽然是数字,但不是5.88%,结果可能是2020,可能是18,等等

是因为tokenizer.tokenize把5.88%分开了吗?但是answer_start是在5上,answer_end是在%上

FankLi commented 4 years ago

误删了上一个issues...